【27届留用实习生】大模型前沿架构研究实习生「破壁者」-安全可信AI中心

薪资面议
算法工程师
上海
不限
4天/周
最少6个月
有转正
岗位职责
职位描述 1.开展针对大模型架构创新进行探索的研究,重点围绕当前长程任务与特定领域内大模型的输出可控性差,安全性低进行研究。优化当前模型的注意力与混合专家架构,并探索新架构发展方向。 2.开展基于新架构大模型的预训练,以及基于开源标准架构大模型的持续预训练,后训练工作,其中包括监督微调与强化学习得内容。 3.搭建评测平台并验证新架构模型能力。其中包括基于架构特性针对性开发模型部署与验证技术,进一步有效利用模型能力。 4.将研究成果转化为开源代码,编写技术报告,参与学术讨论和技术交流,鼓励在国际顶级期刊或会议上发表研究成果。
岗位要求
职位要求 1.计算机科学、数学、统计学或相关专业,数理基础扎实者优先。 2.熟悉大模型训练流程,具有模型训练经验,熟悉SFT、RL等方法与swift,verl,slime等模型训练框架。另外,了解FSDP,Megatron等技术背景者优先。 3.熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力。 4.能实习6个月及以上优先。 加分项 1.在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以一作或主要贡献者身份发表论文。 2.参与开发有影响力的开源项目优先。 具备模型基础架构(AI infra),具备模型算子优化(CUDA,triton)开发经验者优先。 3.熟悉swift,verl,slime等模型训练框架、了解FSDP,Megatron等技术背景者优先。
龙文路129号(国际传媒港L1大楼)
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海人工智能实验室
未融资
上海
查看其他 64 个职位