度小满大模型算法实习生招聘
度小满大模型算法实习生招聘
坐标:北京度小满金融总部
【岗位职责】
1、大语言模型训练优化:参与大模型的监督微调、奖励模型、强化微调等技术的研究与优化,聚焦于解决模型在复杂指令遵循、推理、幻觉、工具使用等问题中的表现瓶颈,提升模型的实用性与可靠性。
2、评估系统建设:收集、清洗训练数据,提高数据质量,开发和完善大模型评估系统,对模型能力水平进行多维评测,识别并解决模型可能存在稳定性、安全和幻觉问题,理解模型行为,并指导模型进行迭代。
3、前沿探索:探索业界前沿的训练技术,设计并进行实验,分析大模型在不同数据分布和任务场景下的表现,发现并解决影响模型性能的关键问题,参与顶会论文、专利的撰写与发表。
【岗位要求】
1.计算机、数学等相关专业硕士及以上学历。
2.有机器学习基础和较强的编码能力,熟悉Pytorch,使用过Deepspeed或Megatron等分布式训练框架。
3.了解以下大语言模型或强化学习相关技术至少一项,包含SFT、PPO、GRPO、DPO、MCTS等。
4.有大模型实习/项目经历或人工智能领域顶级会议论文发表经历者优先。
5. 每周实习4天以上,持续时间3个月以上。
【发展前景】
1. 大模型行业持续高速发展,市场空间巨大;
2. 工作氛围积极向上,结果导向,重视效率;
3. 强化个人技术能力,参与顶会论文撰写、发表。
如有意向请投递简历至admin#mlpod.com(#替换成@),并注明大模型算法实习生