面向异步长程任务的主动式Agent研究-阿里星-阿里巴巴2027届实习生
薪资面议
人工智能 杭州 本科

投递时间:2026年4月24日-2027年4月24日
岗位职责
负责面向异步长程任务的主动式Agent研究,重点探索Agent在长时间跨度、多步骤复杂任务中的自主规划、主动推进与自适应纠偏能力。研究方向涵盖长程任务分解与动态重规划、主动式交互机制设计、跨session状态管理,以及支撑上述能力的Agentic Model post-training方法,并推动研究成果在Accio实际业务场景中落地。
1、研究异步长程任务场景下Agent的核心能力建设,包括任务分解与规划、执行监控与自主纠偏、主动通知与用户交互策略等;
2、设计面向长程Agentic能力的post-training方案,探索适配异步任务特性的数据构造、奖励建模与训练方法;
3、构建长程异步任务的评测体系与仿真环境,弥补现有benchmark在任务时间跨度、多轮交互、并发协调等维度的空白。
岗位要求
1、具备大模型post-training、强化学习相关研究经验;
2、熟悉Agent系统设计,对function calling、tool use、multi-step reasoning等能力有深入理解;
3、熟悉主流训练框架(如VeRL等)及Agent开发框架;
4、编程能力扎实,熟练使用Python、PyTorch。
加分项:
1、有长程规划、异步任务调度、multi-agent系统等方向的研究经验,在顶会发表过相关论文;
2、参与过知名Agentic post-training 项目;
3、具备跨境电商、B2B贸易等业务场景的理解或实践经验。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报