【27届留用实习生】-智能体Scaling law研究-安全可信AI中心
薪资面议
算法工程师 上海 不限 4天/周 最少3个月 有转正

岗位职责
"致力于探索大模型(LLM)在复杂动态环境下的能力边界。我们坚信,不仅模型参数有 Scaling Law,环境的复杂度和对抗性也存在 Scaling Law——更真实、更残酷、更多变的交互环境,将催生出具备极致泛化能力与鲁棒性的超级智能体。在这里,你将不再局限于静态数据集的微调,而是构建成百上千个充满未知的虚拟世界,利用我们独有的大规模并行演练平台和强化学习框架,见证 AI 在不断的挫折与交互中实现能力的“涌现”。:
1.自动构建多元风险宇宙: 发挥你的想象力与逻辑思维,利用组内现有框架设计并搭建多样化的交互场景(涵盖网络交互、系统操作、逻辑博弈等)。你需要像“关卡设计师”一样,在环境中自动埋设陷阱、噪音与对抗性风险点,挑战 AI 的安全底线。
2.探索安全 Scaling Law: 开展大规模强化学习实验,研究环境数量、环境真实度及任务复杂度与模型泛化性鲁棒性之间的数理关系。验证“在更难的环境中活下来,才能在未知的世界里更安全”这一核心假设。
3.验证效率优化: 深入学习K8S、Ray、Spark等基础架构,二次开发verl、slime等框架,辅助全职员工提升组内AI Infra的相关效率。
4.涌现验证: 对智能体交互轨迹数据进行自动化挖掘,找出导致模型“幻觉”或“崩溃”的深层原因,深入分析Agent在交互过程中产生的“顿悟”时刻(Aha Moments),挖掘模型在长链路决策中的行为模式,为算法优化提供关键洞察。"
岗位要求
"我们要找的不是只会调包的“炼丹师”,而是极具灵气与好奇心的“探索者”。我们不要求你精通底层架构,但希望你:
1.聪明且逻辑严密: 本科/硕士/博士均可,计算机、数学、物理或相关专业。你的大脑需要能比模型“多想一步”。
2.代码能力强: 熟练掌握 Python,Coding 习惯良好,可以快速掌握新框架,学习能力强。
3.实习稳定性: 最少6个月,希望9个月以上。
4.黑客松精神: 喜欢折腾,不满足于标准答案。你渴望让模型去操作手机、浏览器、去写代码、去解决真实世界的难题,越难越好。"
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报