米哈游实习-LLM算法实习生

工作职责
1、设计严谨和科学的针对post train model的benchmark,准确评估基础模型能力,设计模型能力优化方向,提升基础模型的social intelligence
2、设计和训练奖励模型,深度参与基础模型的后训练优化,持续解决reward hacking问题和扩大强化学习训练规模
3、研究Reward System,涉及但不限于LLM-as-Judge, Generative Reward Model, Agentic Reward Model, Sandbox等技术

任职要求
1、硕士及以上学位在读,计算机、人工智能等相关专业优先
2、深入了解LLM后训练,具备LLM Benchmark设计/奖励信号设计/强化学习训练项目经验者优先
3、具备良好的中英文阅读和鉴赏能力,有良好的沟通合作能力
4、熟练使用python语言和pytorch框架

加分项
1. 在ACM/ICPC,NOI/IOI,TopCoder等编程大赛上有获奖
2. 在后训练/模型评估有NeurIPS/ICML/ACL/EMNLP顶级论文发表,积极追踪大模型方向前沿进展和应用
3. 具备良好的文学素养,对游戏、影视、小说等人文和娱乐内容有浓厚兴趣

投递链接
https://jobs.mihoyo.com/?sharePageId=121176&recommendationCode=052BT&isRecommendation=true#/campus/position/7913

#春招##内推##前端##后端##客户端##ai##产品##测试##实习#
全部评论

相关推荐

点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
正在热议
更多
# 一张图晒出你司的标语 #
4347次浏览 75人参与
# AI面会问哪些问题? #
28055次浏览 561人参与
# 米连集团26产品管培生项目 #
13377次浏览 285人参与
# 你的实习产出是真实的还是包装的? #
20278次浏览 342人参与
# 找AI工作可以去哪些公司? #
9228次浏览 241人参与
# 春招至今,你的战绩如何? #
65791次浏览 584人参与
# 开放七大实习专项,百度暑期实习值得冲吗 #
15300次浏览 222人参与
# 从事AI岗需要掌握哪些技术栈? #
9068次浏览 313人参与
# 中国电信笔试 #
32024次浏览 292人参与
# 你做过最难的笔试是哪家公司 #
33847次浏览 239人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
340890次浏览 2175人参与
# 哪些公司真双非友好? #
69639次浏览 289人参与
# 阿里笔试 #
178705次浏览 1317人参与
# 机械人避雷的岗位/公司 #
62704次浏览 393人参与
# 小马智行求职进展汇总 #
25133次浏览 80人参与
# 第一份工作一定要去大厂吗 #
14757次浏览 122人参与
# 金三银四,你的春招进行到哪个阶段了? #
22106次浏览 280人参与
# 为了减少AI幻觉,你注入过哪些设定? #
26266次浏览 310人参与
# 应届生第一份工资要多少合适 #
20691次浏览 86人参与
# 沪漂/北漂你觉得哪个更苦? #
9950次浏览 194人参与
# 聊聊你的职场新体验 #
336521次浏览 1895人参与
# HR最不可信的一句话是__ #
6312次浏览 114人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务