小米训练平台性能优化工程师实习生招聘

职位描述
深度优化训练流程
主导模型训练全链路性能分析与优化,设计GPU资源弹性调度策略
开发自动化训练加速工具链,构建可扩展的云端训练框架
研发混合精度训练、梯度压缩等前沿技术,突破训练吞吐瓶颈
构建训练优化体系
制定标准化训练效能评估体系,建立成本-效率量化模型
设计可复用的训练加速组件库,沉淀最佳实践方法论
开发训练过程性能分析平台,实现性能问题智能诊断
赋能业务研发
优化多任务资源调度策略,提升GPU集群整体利用率
为算法团队提供训练加速解决方案,缩短模型迭代周期

职位要求
1.精通深度学习训练加速技术,熟悉分布式训练框架设计
2.掌握CUDA编程及GPU性能分析工具(nsys/torch profiler)
3.熟练使用PyTorch框架,具备训练流程优化实战经验
4.熟悉常见模型压缩技术(量化/剪枝/蒸馏)及落地应用
5.具备大规模集群资源调度系统开发经验者优先
【技术加分项】
1.有mmcv//deepspeed/megatron/ray等训练框架开发经验
2.算子优化经验,triton/cuda等开发经验.
3.熟悉MPI/NCCL等分布式通信协议
4.在MLSys/ICLR等顶会发表过训练优化相关论文

小米科技校招内推码: 1ZKSZUE 
投递链接: https://xiaomi.jobs.f.mioffice.cn/s/ig0XgB1AK8E

地点:北京小米科技园
联系邮箱:libin37@xiaomi.com

#AI Infra##训练加速##性能优化#
全部评论

相关推荐

09-29 16:59
已编辑
门头沟学院 Java
牛客96609213...:疯狂背刺,之前还明确设置截止日期,还有笔试,现在一帮人卡在复筛,他反而一边开启扩招,还给扩招的免笔试,真服了,你好歹先把复筛中的给处理了再说
投递大疆等公司10个岗位
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务