大模型数据技术研究员
40-70K * 14薪
数据挖掘 上海 博士 1年以内

岗位关键词
岗位职责
1、负责多模态数据解析,在文档多模态、语音、图像等多个数据模态实现数据高质量解析,构建最强领域数据集。实现多模态统一的训练数据集,支撑模型训练效果最佳
2、主导领域数据生成,包括预训练数据、SFT数据、SOP数据等多个方向,同时对生成数据多样性、复杂性、逻辑性负责,构建多人设融合、领域理解能力最佳的领域数据生成技术
3、承担大模型数据工程价值评估以及高效学习任务,基于模型loss、困惑度等多个维度设计数据价值反馈体系,指导高质量数据过滤,深刻探查数据课程学习体系,设计并实现数据混合策略,为模型阶段迭代提供可视化路径。
4、从事AI4Data关键技术研究,突破大模型数据应用中的关键技术,持续提升NL2SQL精度,达到业界领先水平,从事结构化数据知识萃取技术,利用大模型技术洞察数据,发现数据规律,挖掘数据价值,突破人+小模型的数据洞察模式;
岗位要求
1、具备NLP,数据库,大数据治理等方向学术研究背景,在深度学习、深度强化学习、统计分析、知识图谱、形式化技术、运筹优化中一个以上的领域有着深入的研究和丰富的实践;
2、了解AI大模型数据处理技术发展历程,具备相关算法研究与设计、原型开发和模型性能优化相关能力;
3、掌握AI大模型训练和使用,有工业级AI项目落地经验、发表过领域顶刊顶会、具有3GPP标准工作经验者优先;
4、熟悉业界开源数据集构建流程、数据质量标准和数据安全标准的制定规则者优先;
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报