【26届校招】-大模型算法工程师/青年研究员(智能体方向)-安全可信中心

薪资面议
算法工程师
上海
不限

投递时间:2025年8月16日-2028年10月14日

岗位职责
团队介绍: 上海人工智能实验室安全可信团队以Make Safe AI 为核心技术愿景,致力于大模型、具身、智能体及多智能体系统的安全与可信研究,关注模型推理能力与对齐机制的深入理解与优化。我们推动前沿技术在可信推理、对齐方法、攻击与防御、评测体系等方向的创新落地,成果多次发表于顶级学术会议,包括ACL杰出论文、ICLR Oral等。如果你对大模型安全、可信对齐及未来AI能力的潜在风险怀有热情,欢迎加入我们,共同推动从“让AI 变得安全”向“打造安全的AI 转变”,支持人工智能朝着有益、安全、公平方向健康有序发展。 职位描述 你将收获:直面自主智能带来的安全挑战;参与构建下一代智能体安全防护体系;守护亿级用户数字与物理世界安全 岗位职责: 智能体安全评测技术研究:设计和搭建业界领先的智能体安全评测基准,建立一套科学、可复现的安全评估方法论,涵盖指令安全、工具调用安全、记忆安全、多智能体协同安全等多个维度。 智能体安全攻防技术研究:研究智能体的特有攻击向量,包括但不限于:指令注入/越狱、规划路径劫持、工具调用滥用/劫持、长期记忆污染等;探索多智能体系统中的安全风险,如共谋攻击、信息污染扩散、中心化节点失效等群体智能安全问题。研究特定智能体特有安全漏洞(如具身智能体的传感器欺骗),开发针对上述风险的自动化攻击脚本与安全评测框架,进行红蓝对抗演练。 智能体安全加固与防御体系构建:研究并应用Agent对齐技术与鲁棒性规划算法,确保智能体行为符合安全与伦理规范。开发智能体行为异常检测与溯源模型,实时发现并响应潜在的安全入侵。"
岗位要求
"任职要求: 硬性条件:本科及以上学历,计算机科学/网络安全/人工智能相关专业;AI安全领域经验,精通大模型架构(Transformer/BERT/GPT系列);具备Agent开发实战经验(LangChain, MetaGPT等);精通Python,熟悉主流AI框架(PyTorch/TensorFlow/JAX) 攻防能力要求:攻击与评估侧:至少掌握两类Agent实战攻击技术:指令注入/越狱、恶意工具调用、规划逻辑操纵;具备设计和执行Agent安全红蓝对抗、自动化模糊测试或安全基准评测的能力。 防御与加固侧:具备以下至少一个领域的实战经验:工具调用安全监控、模型价值对齐、对抗样本监测。 加分项: 在NeurIPS/ICLR/CCS等顶会发表AI安全相关论文;参与过主流Agent项目(如MetaGPT、camel框架);有CTF/AI安全竞赛获奖经历;熟悉OWASP Top 10 for LLM等安全标准。 "
龙文路129号(国际传媒港L1大楼)
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海人工智能实验室
未融资
上海
查看其他 33 个职位