日常实习| LLM Posttrain算法工程师| 米哈游 | 内推

内推码:J4VQ9

岗位链接:链接

岗位名称:【日常实习】LLM Posttrain算法工程师

投递的时候,请填写内推码,方便我跟进后续流程;岗位一般至少5个工作日才有进度更新,请耐心等候;

也欢迎同学们内部相互推荐,同一个人可以投递多个岗位,互不影响。

工作职责

  1. 紧跟领域前沿技术,探索有效和高效的 RLHF 或 RLAIF 等post-training方法,提升大语言模型角色扮演、创意写作等方向的综合能力
  2. 参与预研项目的研发,与产品、策划、工程等多个团队紧密协作,拆解并设计具体的算法解决方案和交付目标
  3. 构建高质量、多领域的数据处理及分析流程,包括但不限于数据清洗、数据合成、数据混合策略等
  4. 构建稳健可靠的算法评估流程,揭示大语言模型能力边界和潜在机制

任职要求

  1. 计算机科学、人工智能或相关领域的在读硕士/博士
  2. 在自然语言处理、大语言模型研究或机器学习领域中具有项目经验
  3. 具备扎实的代码与算法基础,熟练掌握PyTorch等深度学习框架
  4. 具备有效的沟通和协作技能,对探索新技术和推动技术创新充满热情

加分项

  1. 在NeurIPS/ICML/ACL/EMNLP等顶级会议上发表过高引论文,或在ACM/ICPC,NOI/IOI,TopCoder等大赛上有获奖
  2. 主导过有影响力的LLM应用项目,或有丰富的技术落地经验
  3. 熟悉大规模语料处理、数据质量评估、数据合成及其在大模型训练中的应用
  4. 具有大规模训练大模型经历,了解分布式训练框架及对应的性能调优和资源管理
  5. 有过RLHF、RLAIF的相关经验

alt

#实习##内推##mihoyo#
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务