分布式训练研发实习生
200-340元/天
C++ 北京 本科 4天/周 最少6个月 有转正

投递时间:2025年6月20日-2025年8月31日(即将截止)
岗位职责
1. 基于MLU构建异构并行通信库, 面向未来低时延、高带宽的计算通信需求,实现高性能设备通信加速库;
2. 大规模分布式训练中多机计算、通信和训练性能的优化。
岗位要求
1. 本科及以上学历在校生,计算机,软件工程,通信等相关专业;
2. 熟练掌握 C/C++,有扎实的编程基础、良好的编程风格和工作习惯;
3. 熟悉 Python/Shell 等脚本语言;
4. 具有良好的团队协作精神,责任心强,能够积极主动地完成相关工作。
*实习时间至少为6个月
满足以下一种或多种条件者优先:
A. 具备并行程序开发经验,了解 CUDA, OpenMPI, NCCL 等并行程序开发和性能调优经验;
B. 掌握计算机系统结构知识和指令流水,有 Pipeline 优化经验;
C. 有集合通信算法开发,网络编程,RDMA 编程相关经验;
D. 了解 Pytorch/Megatron-LM 等框架分布式执行方式 。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报