大模型预训练基础设施研究实习生
250-400元/天
算法工程师 上海 本科 5天/周 最少3个月

岗位关键词
岗位职责
1. 对大模型预训练任务的各环节建立理论性能模型
2. 对实际运行的大模型预训练任务进行性能分析,找到与理论模型之间的瓶颈
3. 设计并实现预训练任务的性能优化策略,提升实际训练任务的性能
4. 与实习导师合作撰写并发表论文。
岗位要求
1. 了解Megatron-LM, DeepSpeed 等常见预训练框架
2. 熟悉 C/C++ 和 Python,具备较强的工程能力
3. 能够阅读英文学术论文,能够根据论文进行系统实现和优化
4. 有针对大模型预训练基础设施的性能分析和优化经验者优先
5. 发表过学术论文者优先
6. 可以连续实习不少于六个月者优先
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报