【27届留用实习生】大模型攻防与进化训练实习生「Mythos 计划」-安全可信AI中心

薪资面议
算法工程师
上海
不限
4天/周
最少6个月
有转正
岗位职责
职位描述: 1.安全数据构建:围绕漏洞挖掘与修复、风险归因、攻击轨迹等安全攻防任务,并面向环境规模化(Environment Scaling)构建可扩展的安全任务沙箱,构建高质量安全数据集与自动化数据生产流程,支撑安全大模型训练、评测与持续迭代。 2.安全大模型训练:参与设计和训练Mythos-like安全大模型,结合偏好优化、自主蒸馏、强化学习、自主进化等训练方法,提升模型在自动化漏洞检测与修复等任务中的能力; 3.安全大模型评测:参与设计Mythos-like安全大模型能力评测体系,探索大模型的安全能力边界,支持内部安全评测、模型对齐优化及开源安全组件建设。
岗位要求
职位要求: 1.本科生及以上学历,计算机科学、人工智能、网络安全、软件工程等相关专业; 2.熟悉强化学习基础知识、大模型基本原理及后训练技术,有大模型训练或评测经验者优先; 3.熟悉漏洞挖掘、网络安全攻防技术,了解常见黑客攻击手法,对自动化攻防工具链(如自动化扫描、Fuzzing、漏洞利用框架等)有深入理解和实操经验; 4.熟练使用 Python,熟悉 PyTorch、verl 等主流模型训练或5.推理框架,具备扎实的代码能力或工程实现能力; 能实习 6 个月及以上优先。 加分项: 1.在大模型安全、AI 红队、对抗攻击、模型对齐、智能体安全、网络安全自动化等方向有研究或项目经验; 2.参与过大模型训练、RL 后训练、自动化评测平台、红队平台或安全数据集建设者优先; 3.熟悉 Agent 系统安全,包括多轮交互、工具调用、Memory、Skills、权限控制、沙箱执行等模块的风险建模与评测; 4.顶会(NeurIPS、ICML、ICLR、USENIX Security、CCS、NDSS、S&P 等)论文、开源安全项目贡献优先; 5.在 ACM/ICPC、Kaggle、CTF、安全攻防竞赛等活动中取得优异成绩者优先。
龙文路129号(国际传媒港L1大楼)
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海人工智能实验室
未融资
上海
查看其他 64 个职位