米哈游27届实习-LLM Posttrain算法实习生

工作职责
1. 紧跟领域前沿技术,探索有效和高效的 RLHF 或 RLAIF 等post-training方法,提升模型在复杂对话、多轮推理或情感理解方面的综合能力
2. 构建高质量、多领域的数据处理及分析流程,包括但不限于数据清洗、数据合成、数据混合策略等
3. 构建稳健可靠的算法评估流程,揭示大语言模型能力边界和潜在机制

任职要求
1. 计算机科学、人工智能或相关领域的在读硕士/博士
2. 在自然语言处理、大语言模型研究或机器学习领域中具有项目经验
3. 具备扎实的代码与算法基础,熟练掌握PyTorch等深度学习框架
4. 具备有效的沟通和协作技能,对探索新技术和推动技术创新充满热情

加分项
1. 在NeurIPS/ICML/ACL/EMNLP等顶级会议上发表过高引论文,或在ACM/ICPC,NOI/IOI,TopCoder等大赛上有获奖
2. 主导过有影响力的LLM应用项目,或有丰富的技术落地经验
3. 熟悉大规模语料处理、数据质量评估、数据合成及其在大模型训练中的应用
4. 具有大规模训练大模型经历,了解分布式训练框架及对应的性能调优和资源管理
5. 有过RLHF、RLAIF的相关经验

投递链接
https://jobs.mihoyo.com/?sharePageId=121176&recommendationCode=052BT&isRecommendation=true#/campus/position/7827

#米哈游##校招##内推##秋招##春招##游戏##大模型#
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务