高性能计算与系统优化实习生

薪资面议










岗位职责
- 高性能计算与AI训推系统的性能剖析、调试与优化,深入业务研究性能瓶颈并设计有效的加速方案,确保计算任务高效稳定运行.
- 面向自有集群架构与业务场景特点设计研发性能加速组件,包括分布式缓存、内存数据库、计算库、通信库等.
- 跟踪探索新兴软硬件技术与行业技术趋势,推动高性能计算平台与框架的迭代升级.
任职要求
- 熟悉计算机体系结构,出色的Linux C/C++与Python编程能力以及丰富的调试调优经验.
- 对技术充满好奇心、自驱力充沛,能够独立推动技术探索与方案落地.
加分项
- 对GPU、NVLink、RDMA、GDR等高性能技术有较好的理解与实战经验.
- 熟悉主流训练框架如PyTorch、TensorFlow等;熟悉分布式系统与高性能通信库如MPI、NCCL、NVSHMEM等.
- 具有大型AI集群或者超算集群的使用/维护经验.