面向异步长程任务的主动式Agent研究-阿里星-阿里巴巴2027届实习生

薪资面议
人工智能
杭州
本科

投递时间:2026年4月24日-2027年4月24日

岗位职责
负责面向异步长程任务的主动式Agent研究,重点探索Agent在长时间跨度、多步骤复杂任务中的自主规划、主动推进与自适应纠偏能力。研究方向涵盖长程任务分解与动态重规划、主动式交互机制设计、跨session状态管理,以及支撑上述能力的Agentic Model post-training方法,并推动研究成果在Accio实际业务场景中落地。 1、研究异步长程任务场景下Agent的核心能力建设,包括任务分解与规划、执行监控与自主纠偏、主动通知与用户交互策略等; 2、设计面向长程Agentic能力的post-training方案,探索适配异步任务特性的数据构造、奖励建模与训练方法; 3、构建长程异步任务的评测体系与仿真环境,弥补现有benchmark在任务时间跨度、多轮交互、并发协调等维度的空白。
岗位要求
1、具备大模型post-training、强化学习相关研究经验; 2、熟悉Agent系统设计,对function calling、tool use、multi-step reasoning等能力有深入理解; 3、熟悉主流训练框架(如VeRL等)及Agent开发框架; 4、编程能力扎实,熟练使用Python、PyTorch。 加分项: 1、有长程规划、异步任务调度、multi-agent系统等方向的研究经验,在顶会发表过相关论文; 2、参与过知名Agentic post-training 项目; 3、具备跨境电商、B2B贸易等业务场景的理解或实践经验。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
阿里巴巴集团
电商
不需要融资
杭州市
查看其他 499 个职位