1688买家Agentic AI算法专家-阿里星-阿里巴巴2027届实习生

薪资面议
算法工程师
杭州
本科

投递时间:2026年3月18日-2027年3月18日

岗位职责
1.主导GRPO/PPO/DAPO等Alignment算法研发,提升模型在B2B复杂场景下的长链条推理、Tool-use及自省纠错能力; 2.基于1688海量买卖家交互数据,搭建针对B类生意场景的模拟器或世界模型,通过模拟博弈持续优化Agent的最优决策路径; 3.参与千亿级模型的继续训练与Multi-Agent RL训练,构建openclaw的大脑,同时推进落地; 4.将业务突破转化为学术成果,支持在 NeurIPS、ICLR、ICML 等顶会发表高质量论文,或推动相关算法在社区的开源,建立行业影响力。
岗位要求
1.计算机、数学、自动化等相关专业博士或顶尖硕士,深入理解LLM/VLM/RL/Agent领域,熟悉DPO/PPO/GRPO等RL前沿算法; 2.具备实际的Agent系统开发经验如任务分解、工具调用、记忆管理、上下文规划等,参与或主导过大型语言模型的训练或优化项目,熟悉Agent评估; 3.具备敏锐的逻辑分析能力,坚定相信AI Native的未来,具备从底层重构产品的热忱,而不只是在旧系统上修修补补。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
阿里巴巴集团
电商
不需要融资
杭州市
查看其他 499 个职位