多模态数据研究员【“智星”计划】

25-50K * 15薪
人工智能
北京
硕士

投递时间:2025年6月9日-2025年12月31日

岗位职责
职位描述: 1. 业务研发与技术落地: 1)负责多模态理解大模型的研究、设计、开发与优化,参与项目需求分析、技术方案评审及代码质量把控。 2)持续跟踪大模型领域(CV/NLP/多模态)的前沿技术动态与行业趋势,为团队提供技术决策支持。 2. 模型优化与工程实践 1)协同算法与数据团队,将研究成果转化为高性能实用模型,主导模型架构设计、参数调优及分布式训练流程搭建。 2)熟练运用深度学习框架(如PyTorch、Hugging Face、DeepSpeed、Megatron-LM)进行模型训练与优化,通过实验分析模型表现并制定改进策略。 3. 数据管线构建与管理 1)负责多模态数据(文本、图像、语音、视频等)的收集、清洗、标注及特征提取,构建高质量训练数据集。 2)设计数据归一化与增强方案,优化数据质量与训练效率,参与制定数据存储、备份及安全策略。 4. 前沿算法研究与创新 1)深入探索多模态大模型技术(如跨模态融合、表示学习、泛化能力优化),定期输出技术分析报告,支撑团队战略规划。 2)开展创新性研究,通过实验验证新架构与算法的有效性,推动模型在多模态任务中的性能突破。
岗位要求
任职要求: 1. 教育背景:计算机科学、人工智能、数学或相关专业硕士及以上学历,具备扎实的数理基础。 2. 科研经验:具备一定的计算机视觉(CV)、自然语言处理(NLP)或大模型研发经验,有成功落地项目者优先, 具备独立完成模型设计、训练调优及效果验证的能力。 3. 专业技能 1)精通至少一种深度学习框架(PyTorch/TensorFlow),熟悉Hugging Face、DeepSpeed等工具链。 2)深入理解主流大模型技术(如GPT、Llama、Qwen-VL、LLaVA、GPT-4V、Gemini等)的原理与训练方法。 3)掌握大模型优化技术(分布式训练、量化、剪枝)、方案架构设计及Prompt工程实践。 4. 能力素质 1)具备优秀的科研创新能力与复杂问题解决能力,对技术前沿高度敏感。 2)良好的跨团队协作与沟通能力,自我驱动力强,对多模态AI领域有持续热情。 加分项: 1. 具备3D重建、人体运动(Motion)建模相关研究经验; 2. 在顶级会议(CVPR/ICCV/ECCV/NeurIPS/ICML/ACL等)发表过相关论文; 工作目标: 1. 构建覆盖文本、语音、视觉、运动(Motion)的大规模全模态高质量数据集; 2. 研发高性能数字人大脑模型,推动多模态认知与交互能力的边界。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
北京智源人工智能研究院
人工智能
不需要融资
北京
查看其他 5 个职位