度小满大模型算法实习生招聘

度小满大模型算法实习生招聘

坐标:北京度小满金融总部

【岗位职责】

1、大语言模型训练优化:参与大模型的监督微调、奖励模型、强化微调等技术的研究与优化,聚焦于解决模型在复杂指令遵循、推理、幻觉、工具使用等问题中的表现瓶颈,提升模型的实用性与可靠性。

2、评估系统建设:收集、清洗训练数据,提高数据质量,开发和完善大模型评估系统,对模型能力水平进行多维评测,识别并解决模型可能存在稳定性、安全和幻觉问题,理解模型行为,并指导模型进行迭代。

3、前沿探索:探索业界前沿的训练技术,设计并进行实验,分析大模型在不同数据分布和任务场景下的表现,发现并解决影响模型性能的关键问题,参与顶会论文、专利的撰写与发表。

【岗位要求】

1.计算机、数学等相关专业硕士及以上学历。

2.有机器学习基础和较强的编码能力,熟悉Pytorch,使用过Deepspeed或Megatron等分布式训练框架。

3.了解以下大语言模型或强化学习相关技术至少一项,包含SFT、PPO、GRPO、DPO、MCTS等。

4.有大模型实习/项目经历或人工智能领域顶级会议论文发表经历者优先。

5. 每周实习4天以上,持续时间3个月以上。

【发展前景】

1. 大模型行业持续高速发展,市场空间巨大;

2. 工作氛围积极向上,结果导向,重视效率;

3. 强化个人技术能力,参与顶会论文撰写、发表。

如有意向请投递简历至admin#mlpod.com(#替换成@),并注明大模型算法实习生

全部评论

相关推荐

03-26 15:39
门头沟学院 Java
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务