美团大模型算法实习生(面向2027届毕业生)
300-500元/天
算法工程师 北京 硕士 5天/周 最少6个月 有转正

岗位关键词
岗位职责
1. 长程Agent能力建设:探索Agent在复杂多步任务中的规划、执行与自我纠错能力,研究多Agent协作与任务交接机制,推动从短程辅助向长程自主闭环演进
2. 多模态融合:推进语音、图像与文本的原生多模态联合建模,探索流式感知交互架构,提升Agent在实时对话场景中的多维理解与响应能力
3. Agent强化学习:研究大规模Agent RL训练范式,包括可验证环境构建、长程奖励设计、Agent自我对弈数据合成等,提升Agent在真实任务中的可靠性与泛化性
4. 主动交互与记忆进化:提升Agent的主动意图澄清、不确定性感知、长程记忆管理等核心能力,探索将交互经验沉淀为可复用Skill的自我进化机制
5. 前沿探索与落地验证:跟踪复现Agent智能方向前沿工作,结合智能客服、通用助手等真实场景进行实验验证,推动技术能力沉淀
岗位要求
岗位要求
1. 熟悉大模型原理,具备数据处理、微调、预训练、强化学习等方面的实践经验
2. 熟悉自然语言处理或多模态领域常见算法与模型,有Agent / Tool-use / 对话系统相关经验者佳;
3. 具备良好的编程能力,熟悉Python,熟练使用PyTorch等深度学习框架
4. 具备独立阅读与复现顶会论文的能力,有较强的自驱力和技术好奇心
5. 每周至少全职工作四天,保证实习至少6个月,实习须征得导师同意
具备以下优先
1. 有Agent / 多Agent系统 / 强化学习(RLHF/大规模RL)相关研究或项目经验
2. 有多模态模型(Vision-Language / Speech-Language)训练或应用经验
3. 在ACL、EMNLP、NeurIPS、ICML、ICLR等会议或期刊有论文发表
4. 在开源社区或相关评测竞赛中有突出贡献或获奖经历
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报