多语言大模型研究实习生(A243970)

200-300元/天
算法工程师
北京
不限
5天/周
最少3个月
岗位关键词
岗位职责
1. 参与多语言大模型的核心技术研发,包括跨语言理解、迁移学习等方向 2. 设计和优化模型的多语言对齐方案,提升小语种处理能力 3. 跟踪多语言预训练及对齐相关的前沿研究进展,参与技术方案设计 4. 探索多语言多模态融合技术,推进视觉-语言交互等创新应用 5. 参与学术论文撰写和专利申请,推动研究成果产出
岗位要求
1. 计算机科学、人工智能等相关专业在读研究生 2. 扎实的机器学习和深度学习理论基础,熟悉Transformer架构和预训练模型 3. 熟练掌握PyTorch等深度学习框架,有大规模模型训练经验 4. 熟悉主流多语言embedding模型(如bge-m3等)的原理和应用 5. 至少满足以下条件之一: - 在ACL/ICLR/NeurIPS等顶会发表过多语言/跨语言相关论文 - 参与过多语言大模型相关开源项目 - 在CCMT/WMT等多语言竞赛中取得优异成绩 加分项 1. 有小语种数据收集和处理经验 2. 熟悉多模态模型(如CLIP、LLaVA等)的原理和实现 3. 在GitHub有语言模型相关的开源项目 4. 掌握C++/Java等系统开发语言 5. 有大规模语言模型训练和部署经验
北京市海淀区中关村东路1号院9号搜狐网络大厦11层
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
北京智谱华章科技
互联网
B轮
北京市
查看其他 6 个职位