Python数据开发工程师(实习岗)
200-300元/天
Python 深圳 硕士 5天/周 最少3个月

岗位关键词
岗位职责
【工作职责】
1.负责超大规模多模态数据集的下载、清洗、去重等,构建开箱即用的数据集;
2.根据项目的数据需求,利用公共资源或爬虫等技术完成原始数据的收集,包括中文NLP语料,多模态数据等;
3.跟踪国内外相关领域论文和github项目,下载和分析最新开源数据集,并了解其数据处理方法,评估数据质量和与之间数据集的优异,并撰写总结报告;
4.开发和优化数据可视化工具,能高效地展示数据集内容,方便团队成员了解数据集;
5.使用对已有数据集,使用算法或规则进一步清洗或者标注,与团队成员协作,打造业界标。
岗位要求
【任职要求】
1.熟悉linux开发,熟练掌握Python;
2.熟悉机器学习的常用库,进行文本和图像数据预处理、清洗、分析、可视化呈现;
3.具有良好的英语阅读和书写能力,能够熟练查阅相关领域文献。
【加分项】
- 有海量数据清洗、数据加工工作经验优先;
- 熟悉数据抓取原理及技术,有数据爬取及防爬实战经验优先;
- 有大数据经验,了解spark,hadoop等大数据工具优先;
-了解机器学习、深度学习模型,有CV、NLP算法经验优先。
【相关福利】
异地实习提供房补;
按日提供餐补;
发放节假日礼品;
定时提供羽毛球及篮球运动场地。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报