【27届留用实习生】大模型前沿架构研究实习生「破壁者」-安全可信AI中心

薪资面议

算法工程师

不限

4天/周

最少6个月

有转正

葛女士 5分钟前在线

上海人工智能创新中心·校招

反馈率：27% | 反馈时长：1天

岗位职责

职位描述 1.开展针对大模型架构创新进行探索的研究，重点围绕当前长程任务与特定领域内大模型的输出可控性差，安全性低进行研究。优化当前模型的注意力与混合专家架构，并探索新架构发展方向。 2.开展基于新架构大模型的预训练，以及基于开源标准架构大模型的持续预训练，后训练工作，其中包括监督微调与强化学习得内容。 3.搭建评测平台并验证新架构模型能力。其中包括基于架构特性针对性开发模型部署与验证技术，进一步有效利用模型能力。 4.将研究成果转化为开源代码，编写技术报告，参与学术讨论和技术交流，鼓励在国际顶级期刊或会议上发表研究成果。

岗位要求

职位要求 1.计算机科学、数学、统计学或相关专业，数理基础扎实者优先。 2.熟悉大模型训练流程，具有模型训练经验，熟悉SFT、RL等方法与swift，verl，slime等模型训练框架。另外，了解FSDP，Megatron等技术背景者优先。 3.熟练使用Python，熟悉PyTorch等主流深度学习框架，具备扎实的代码能力。 4.能实习6个月及以上优先。加分项 1.在顶级会议/期刊（NeurlPS，ICML，ICLR，ACL，EMNLP等）以一作或主要贡献者身份发表论文。 2.参与开发有影响力的开源项目优先。具备模型基础架构（AI infra），具备模型算子优化（CUDA，triton）开发经验者优先。 3.熟悉swift，verl，slime等模型训练框架、了解FSDP，Megatron等技术背景者优先。

龙文路129号（国际传媒港L1大楼）

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

上海人工智能实验室

未融资

上海

查看其他 64 个职位

0 笔试题目 2 面试经验 0 面试短评