【27届留用实习生】智能体后训练算法-AI For Science中心
薪资面议
算法工程师 上海 不限 4天/周 最少3个月 有转正

岗位职责
1、面向通用以及科学智能体(Agent)的后训练框架搭建、算法设计、环境搭建等,结合多轮交互、工具调用场景研发新型RL算法。
2、研发不限于Search Agent、Scientific Reasoning-enhanced Agent、Agent Swarm等并进行优化,构建高效率、模块化、可复用的 Agent后训练框架。
3、探索并实现Multi-Agent协作、自动化工作流编排、长期任务执行等能力,使框架适用于科研、企业和工程场景的真实任务。
岗位要求
1、计算机科学、人工智能、软件工程、自动化等相关专业。实习4个月及以上。
2、至少熟悉一款主流强化学习开源框架,如Slime、Verl、AReal或同类框架。
3、具备通用算法架构(如 Detectron2、OpenMMLab系列、Transformers 等)的开发或深度使用经验者优先。
4、有智能体训练、自动化工作流、强化学习等方向的顶会论文发表经验(行业认可度高的技术报告加分),或在 GitHub等开源社区 有高质量开源项目贡献者优先(Star>2K)。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报