【27届留用实习生】-智能体Scaling law研究-安全可信AI中心

薪资面议

算法工程师

不限

4天/周

最少3个月

有转正

葛女士 1分钟前在线

上海人工智能创新中心·校招

反馈率：61% | 反馈时长：5天

优我公司正在参加 27届暑期实习2期专场活动，更多适合你的职位内容，点击前往活动大厅查看->

岗位职责

"致力于探索大模型（LLM）在复杂动态环境下的能力边界。我们坚信，不仅模型参数有 Scaling Law，环境的复杂度和对抗性也存在 Scaling Law——更真实、更残酷、更多变的交互环境，将催生出具备极致泛化能力与鲁棒性的超级智能体。在这里，你将不再局限于静态数据集的微调，而是构建成百上千个充满未知的虚拟世界，利用我们独有的大规模并行演练平台和强化学习框架，见证 AI 在不断的挫折与交互中实现能力的“涌现”。： 1.自动构建多元风险宇宙：发挥你的想象力与逻辑思维，利用组内现有框架设计并搭建多样化的交互场景（涵盖网络交互、系统操作、逻辑博弈等）。你需要像“关卡设计师”一样，在环境中自动埋设陷阱、噪音与对抗性风险点，挑战 AI 的安全底线。 2.探索安全 Scaling Law：开展大规模强化学习实验，研究环境数量、环境真实度及任务复杂度与模型泛化性鲁棒性之间的数理关系。验证“在更难的环境中活下来，才能在未知的世界里更安全”这一核心假设。 3.验证效率优化：深入学习K8S、Ray、Spark等基础架构，二次开发verl、slime等框架，辅助全职员工提升组内AI Infra的相关效率。 4.涌现验证：对智能体交互轨迹数据进行自动化挖掘，找出导致模型“幻觉”或“崩溃”的深层原因，深入分析Agent在交互过程中产生的“顿悟”时刻（Aha Moments），挖掘模型在长链路决策中的行为模式，为算法优化提供关键洞察。"

岗位要求

"我们要找的不是只会调包的“炼丹师”，而是极具灵气与好奇心的“探索者”。我们不要求你精通底层架构，但希望你： 1.聪明且逻辑严密：本科/硕士/博士均可，计算机、数学、物理或相关专业。你的大脑需要能比模型“多想一步”。 2.代码能力强：熟练掌握 Python，Coding 习惯良好，可以快速掌握新框架，学习能力强。 3.实习稳定性：最少6个月，希望9个月以上。 4.黑客松精神：喜欢折腾，不满足于标准答案。你渴望让模型去操作手机、浏览器、去写代码、去解决真实世界的难题，越难越好。"

龙文路129号（国际传媒港L1大楼）

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

上海人工智能实验室

未融资

上海

查看其他 52 个职位

0 笔试题目 2 面试经验 0 面试短评