米哈游【提前批】LLM算法研究员(后训练方向)

工作职责
1、研究LLM后训练算法,探索LLM Agent在游戏场景中的落地应用,包括在游戏设计、玩法以及研发管线中的应用等;
2、针对各应用场景,收集LLM后训练数据,制定数据流转pipeline,参与构建后训练数据飞轮;
3、研究LLM模型的后训练策略,使用强化学习等技术提升LLM Agent的性能,参与游戏领域LLM模型的调优、训练和迭代,推动LLM在游戏场景中的技术突破;
4、与游戏制作管线中的其他团队紧密合作,打造新的AI游戏开发流程,创造次世代游戏体验;与工程团队紧密合作,交付稳定可靠的LLM服务。‌

任职要求
1、计算机科学、数学等相关领域的应届毕业生,有良好的编程能力和扎实数理基础;
2、熟悉LLM常用工具和框架,如transformers,llama-factory,verl等。熟悉适用于LLM后训练的强化学习算法,如PPO,GRPO,DAPO等;
3、有LLM项目实践经历,包括但不限于LLM模型训练,Code Agent,RAG系统,AI搜索,AI NPC,各类AI工作流等。

加分项
1、在NeurIPS/ICML/ICLR/ACL/EMNLP等会议或期刊上发表过论文者优先;
2、获得过国际或国内信息竞赛奖项者优先;
3、有游戏技术栈开发经历的优先,参与过 AI Agent 工业化工具开发优先。

面向对象
2026届(2025.9-2026.8之间毕业)

#秋招##内推##提前批##米哈游##llm##算法#
全部评论

相关推荐

不愿透露姓名的神秘牛友
07-10 11:33
点赞 评论 收藏
分享
06-28 22:48
已编辑
广东金融学院 Java
小浪_Coding:学院本+这俩项目不是buff叠满了嘛
点赞 评论 收藏
分享
机械打工仔:我来告诉你原因,是因为sobb有在线简历,有些HR为了快会直接先看在线简历,初步感觉不合适就不会找你要详细的了
投了多少份简历才上岸
点赞 评论 收藏
分享
07-14 13:47
门头沟学院 Java
Lynn012:你评估好自己的位置了吗《顶尖应届》
投递小米集团等公司7个岗位
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务