首页 / 大模型推理
#

大模型推理

#
15355次浏览 215人互动
此刻你想和大家分享什么
热门 最新
【社招】阿里巴巴 大模型推理优化工程师 高性能通信方向
【社招】阿里巴巴 大模型推理优化工程师 高性能通信方向部门:阿里控股-爱橙科技-技术风险与效能部Base:杭州职位描述负责设计、实现、维护 AI 和高性能计算所需要的高性能网络通信框架和大模型推理场景的性能优化,聚焦模型通信场景的能力建设,完善集合通信、点对点通信等通信方式与推理框架的联合方案设计,追求极致的推理性能。职位要求1. 熟悉 cpp 语言编程,熟悉 python 编程,具备优秀的系统开发、调试、优化能力和经验;2. 具备扎实的计算机理论基础,对数据结构及算法有较强的功底,有网关、高性能通信相关经验优先;3. 有开发集合通信库如 nccl、分布式并行优化相关经验,了解 NvLink、Infiniband、RoCEv2 等高性能通信技术优先;4. 熟悉 Cuda 开发,了解 GPU 工作原理,有 kernel 算子开发优化经验优先;5. 了解主流模型及模型架构,熟悉开源常见推理框架(如:VLLM、sglang、TensorRT)优先;6. 优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;具有良好的沟通能力和团队合作精神,有比较强的推动能力;小组负责大模型推理的通信相关,目前缺人,主管比较急,流程会推进很快。说有3-4个hc,p5~p8都可以。感兴趣可以直接扫我的内推码投递,可以加我微信帮看进度:liyuhang1919        
投递阿里巴巴集团等公司10个岗位
点赞 评论 收藏
分享
02-10 21:59
已编辑
门头沟学院 推荐算法
点赞 评论 收藏
分享
2024-11-03 00:47
清华大学 算法工程师
这篇大模型推理性能优化写的还不错~
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务