【27届留用实习生】智能体后训练算法-AI For Science中心

薪资面议
算法工程师
上海
不限
4天/周
最少3个月
有转正
我公司正在参加 27届暑期实习2期专场 活动,更多适合你的职位内容,点击前往 活动大厅 查看->
岗位职责
1、面向通用以及科学智能体(Agent)的后训练框架搭建、算法设计、环境搭建等,结合多轮交互、工具调用场景研发新型RL算法。 2、研发不限于Search Agent、Scientific Reasoning-enhanced Agent、Agent Swarm等并进行优化,构建高效率、模块化、可复用的 Agent后训练框架。 3、探索并实现Multi-Agent协作、自动化工作流编排、长期任务执行等能力,使框架适用于科研、企业和工程场景的真实任务。
岗位要求
1、计算机科学、人工智能、软件工程、自动化等相关专业。实习4个月及以上。 2、至少熟悉一款主流强化学习开源框架,如Slime、Verl、AReal或同类框架。 3、具备通用算法架构(如 Detectron2、OpenMMLab系列、Transformers 等)的开发或深度使用经验者优先。 4、有智能体训练、自动化工作流、强化学习等方向的顶会论文发表经验(行业认可度高的技术报告加分),或在 GitHub等开源社区 有高质量开源项目贡献者优先(Star>2K)。
龙文路129号(国际传媒港L1大楼)
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海人工智能实验室
未融资
上海
查看其他 61 个职位