2012校招开始,xdm
职位描述
我们正积极构建下一代AI大模型训推加速平台,现诚邀高性能网络研发工程师加入!你将负责设计并优化底层网络通信框架,支撑千亿级大模型的分布式训练与实时推理,解决高并发、低延迟、高吞吐的核心挑战问题。
核心职责
1. 高性能网络协议研发
- 基于RDMA(RoCE/InfiniBand) 设计低延迟通信方案,优化AI集群多节点数据传输效率。
- 构建高吞吐、低延迟的RPC框架,支持云计算/存储竞争力构建,大模型参数同步(AllReduce/AllGather)和梯度聚合。
2. AI训推网络加速
- 结合计算与网络流水线,构建优化融合算子,实现计算-通信重叠,减少GPU等待时间。
- 针对LLM推理场景,对标Nvidia Dynamo,设计动态批处理(Dynamic Batching)+ 智能负载调度网关,优化端到端推理延迟。
3. 软硬协同优化
- 与海思顶尖硬件团队协同,探索高性能智能网卡在卸载网络协议、负载均衡、AI训推加速中的应用潜力。
我们正积极构建下一代AI大模型训推加速平台,现诚邀高性能网络研发工程师加入!你将负责设计并优化底层网络通信框架,支撑千亿级大模型的分布式训练与实时推理,解决高并发、低延迟、高吞吐的核心挑战问题。
核心职责
1. 高性能网络协议研发
- 基于RDMA(RoCE/InfiniBand) 设计低延迟通信方案,优化AI集群多节点数据传输效率。
- 构建高吞吐、低延迟的RPC框架,支持云计算/存储竞争力构建,大模型参数同步(AllReduce/AllGather)和梯度聚合。
2. AI训推网络加速
- 结合计算与网络流水线,构建优化融合算子,实现计算-通信重叠,减少GPU等待时间。
- 针对LLM推理场景,对标Nvidia Dynamo,设计动态批处理(Dynamic Batching)+ 智能负载调度网关,优化端到端推理延迟。
3. 软硬协同优化
- 与海思顶尖硬件团队协同,探索高性能智能网卡在卸载网络协议、负载均衡、AI训推加速中的应用潜力。
全部评论
相关推荐