日常实习| LLM Posttrain算法工程师| 米哈游 | 内推
内推码:J4VQ9
岗位链接:链接
岗位名称:【日常实习】LLM Posttrain算法工程师
投递的时候,请填写内推码,方便我跟进后续流程;岗位一般至少5个工作日才有进度更新,请耐心等候;
也欢迎同学们内部相互推荐,同一个人可以投递多个岗位,互不影响。
工作职责
- 紧跟领域前沿技术,探索有效和高效的 RLHF 或 RLAIF 等post-training方法,提升大语言模型角色扮演、创意写作等方向的综合能力
- 参与预研项目的研发,与产品、策划、工程等多个团队紧密协作,拆解并设计具体的算法解决方案和交付目标
- 构建高质量、多领域的数据处理及分析流程,包括但不限于数据清洗、数据合成、数据混合策略等
- 构建稳健可靠的算法评估流程,揭示大语言模型能力边界和潜在机制
任职要求
- 计算机科学、人工智能或相关领域的在读硕士/博士
- 在自然语言处理、大语言模型研究或机器学习领域中具有项目经验
- 具备扎实的代码与算法基础,熟练掌握PyTorch等深度学习框架
- 具备有效的沟通和协作技能,对探索新技术和推动技术创新充满热情
加分项
- 在NeurIPS/ICML/ACL/EMNLP等顶级会议上发表过高引论文,或在ACM/ICPC,NOI/IOI,TopCoder等大赛上有获奖
- 主导过有影响力的LLM应用项目,或有丰富的技术落地经验
- 熟悉大规模语料处理、数据质量评估、数据合成及其在大模型训练中的应用
- 具有大规模训练大模型经历,了解分布式训练框架及对应的性能调优和资源管理
- 有过RLHF、RLAIF的相关经验

查看5道真题和解析