【27届留用实习生】-大模型自动化攻防-安全可信AI中心
薪资面议
算法工程师 上海 不限 4天/周 最少3个月 有转正

岗位职责
1. 研究大模型、智能体的潜在安全风险,构建自动化漏洞发现与风险扫描流水线;
2. 设计并开发自动化红队攻击框架,实现对模型推理、训练阶段攻击技术的批量化、流程化执行;
3. 设计新型防御方案(鲁棒性增强、异常检测、安全对齐、动态防御机制),构建自动化安全评估与持续回归测试体系,实现攻防闭环迭代;
4. 多模态安全体系构建:研究跨文本、图像、语音的多模态攻击向量(如跨模态对抗攻击、多模态数据污染);
5. 构建融合多模态特征的安全检测系统,开发针对AIGC内容的水印、溯源技术;探索视觉-语言模型(VLM)的对抗防御策略与可解释性分析。
岗位要求
- 硕士及以上学历,计算机科学/网络安全/人工智能相关专业;具备AI安全领域经验,精通大模型架构(Transformer/BERT/GPT系列);
- 熟练掌握对抗机器学习技术:FGSM/PGD攻击、防御蒸馏、对抗训练等;具备多模态模型实战经验(CLIP/Stable Diffusion/DALL-E等);
- 精通Python,熟悉主流AI框架(PyTorch/TensorFlow/JAX);
- 熟悉模型逆向、对抗攻击、数据投毒、模型鲁棒性增强、输入输出过滤和安全对齐技术(RLHF/宪法AI);
- 具备自动化工具/平台开发能力,有构建端到端自动化攻击或评估Pipeline的实际经验。
加分项:
- 在NeurIPS/ICLR/CCS等顶会发表AI安全相关论文;
- 参与过主流大模型安全评估项目(如MITRE ATLAS框架);有CTF/AI安全竞赛获奖经历;
- 熟悉OWASP Top 10 for LLM等安全标准;
- 有开源自动化AI安全工具开发或贡献经验;有基于LLM驱动的自动化攻击/防御Agent开发经验者优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报