【27届留用实习生】-大模型自动化攻防-安全可信AI中心

薪资面议
算法工程师
上海
不限
4天/周
最少3个月
有转正
我公司正在参加 27届暑期实习2期专场 活动,更多适合你的职位内容,点击前往 活动大厅 查看->
岗位职责
1. 研究大模型、智能体的潜在安全风险,构建自动化漏洞发现与风险扫描流水线; 2. 设计并开发自动化红队攻击框架,实现对模型推理、训练阶段攻击技术的批量化、流程化执行; 3. 设计新型防御方案(鲁棒性增强、异常检测、安全对齐、动态防御机制),构建自动化安全评估与持续回归测试体系,实现攻防闭环迭代; 4. 多模态安全体系构建:研究跨文本、图像、语音的多模态攻击向量(如跨模态对抗攻击、多模态数据污染); 5. 构建融合多模态特征的安全检测系统,开发针对AIGC内容的水印、溯源技术;探索视觉-语言模型(VLM)的对抗防御策略与可解释性分析。
岗位要求
- 硕士及以上学历,计算机科学/网络安全/人工智能相关专业;具备AI安全领域经验,精通大模型架构(Transformer/BERT/GPT系列); - 熟练掌握对抗机器学习技术:FGSM/PGD攻击、防御蒸馏、对抗训练等;具备多模态模型实战经验(CLIP/Stable Diffusion/DALL-E等); - 精通Python,熟悉主流AI框架(PyTorch/TensorFlow/JAX); - 熟悉模型逆向、对抗攻击、数据投毒、模型鲁棒性增强、输入输出过滤和安全对齐技术(RLHF/宪法AI); - 具备自动化工具/平台开发能力,有构建端到端自动化攻击或评估Pipeline的实际经验。 加分项: - 在NeurIPS/ICLR/CCS等顶会发表AI安全相关论文; - 参与过主流大模型安全评估项目(如MITRE ATLAS框架);有CTF/AI安全竞赛获奖经历; - 熟悉OWASP Top 10 for LLM等安全标准; - 有开源自动化AI安全工具开发或贡献经验;有基于LLM驱动的自动化攻击/防御Agent开发经验者优先。
龙文路129号(国际传媒港L1大楼)
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海人工智能实验室
未融资
上海
查看其他 52 个职位