分布式训练研发实习生

200-340元/天
C++
北京
本科
4天/周
最少6个月
有转正

投递时间:2025年6月20日-2025年8月31日(即将截止)

岗位职责
1. 基于MLU构建异构并行通信库, 面向未来低时延、高带宽的计算通信需求,实现高性能设备通信加速库; 2. 大规模分布式训练中多机计算、通信和训练性能的优化。
岗位要求
1. 本科及以上学历在校生,计算机,软件工程,通信等相关专业; 2. 熟练掌握 C/C++,有扎实的编程基础、良好的编程风格和工作习惯; 3. 熟悉 Python/Shell 等脚本语言; 4. 具有良好的团队协作精神,责任心强,能够积极主动地完成相关工作。 *实习时间至少为6个月 满足以下一种或多种条件者优先: A. 具备并行程序开发经验,了解 CUDA, OpenMPI, NCCL 等并行程序开发和性能调优经验; B. 掌握计算机系统结构知识和指令流水,有 Pipeline 优化经验; C. 有集合通信算法开发,网络编程,RDMA 编程相关经验; D. 了解 Pytorch/Megatron-LM 等框架分布式执行方式 。
致真大厦
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
寒武纪
人工智能
已上市
北京,上海,深圳,合肥,西安,南京
查看其他 0 个职位