美团大模型算法实习生（面向2027届毕业生）

300-500元/天

算法工程师

硕士

5天/周

最少6个月

有转正

倪先生本周在线

北京三快在线科技有限公司·算法工程师

反馈率：79% | 反馈时长：16天

岗位关键词

岗位职责

1. 长程Agent能力建设：探索Agent在复杂多步任务中的规划、执行与自我纠错能力，研究多Agent协作与任务交接机制，推动从短程辅助向长程自主闭环演进 2. 多模态融合：推进语音、图像与文本的原生多模态联合建模，探索流式感知交互架构，提升Agent在实时对话场景中的多维理解与响应能力 3. Agent强化学习：研究大规模Agent RL训练范式，包括可验证环境构建、长程奖励设计、Agent自我对弈数据合成等，提升Agent在真实任务中的可靠性与泛化性 4. 主动交互与记忆进化：提升Agent的主动意图澄清、不确定性感知、长程记忆管理等核心能力，探索将交互经验沉淀为可复用Skill的自我进化机制 5. 前沿探索与落地验证：跟踪复现Agent智能方向前沿工作，结合智能客服、通用助手等真实场景进行实验验证，推动技术能力沉淀

岗位要求

岗位要求 1. 熟悉大模型原理，具备数据处理、微调、预训练、强化学习等方面的实践经验 2. 熟悉自然语言处理或多模态领域常见算法与模型，有Agent / Tool-use / 对话系统相关经验者佳； 3. 具备良好的编程能力，熟悉Python，熟练使用PyTorch等深度学习框架 4. 具备独立阅读与复现顶会论文的能力，有较强的自驱力和技术好奇心 5. 每周至少全职工作四天，保证实习至少6个月，实习须征得导师同意具备以下优先 1. 有Agent / 多Agent系统 / 强化学习（RLHF/大规模RL）相关研究或项目经验 2. 有多模态模型（Vision-Language / Speech-Language）训练或应用经验 3. 在ACL、EMNLP、NeurIPS、ICML、ICLR等会议或期刊有论文发表 4. 在开源社区或相关评测竞赛中有突出贡献或获奖经历

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

美团

互联网

已上市

北京，上海，深圳，厦门，成都

查看其他 29 个职位

127 笔试题目 4973 面试经验 571 面试短评