【社招】阿里巴巴 大模型推理优化工程师 高性能通信方向

【社招】阿里巴巴 大模型推理优化工程师 高性能通信方向

部门:阿里控股-爱橙科技-技术风险与效能部

Base:杭州

职位描述
负责设计、实现、维护 AI 和高性能计算所需要的高性能网络通信框架和大模型推理场景的性能优化,聚焦模型通信场景的能力建设,完善集合通信、点对点通信等通信方式与推理框架的联合方案设计,追求极致的推理性能。

职位要求
1. 熟悉 cpp 语言编程,熟悉 python 编程,具备优秀的系统开发、调试、优化能力和经验;
2. 具备扎实的计算机理论基础,对数据结构及算法有较强的功底,有网关、高性能通信相关经验优先;
3. 有开发集合通信库如 nccl、分布式并行优化相关经验,了解 NvLink、Infiniband、RoCEv2 等高性能通信技术优先;
4. 熟悉 Cuda 开发,了解 GPU 工作原理,有 kernel 算子开发优化经验优先;
5. 了解主流模型及模型架构,熟悉开源常见推理框架(如:VLLM、sglang、TensorRT)优先;
6. 优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;具有良好的沟通能力和团队合作精神,有比较强的推动能力;

小组负责大模型推理的通信相关,目前缺人,主管比较急,流程会推进很快。说有3-4个hc,p5~p8都可以。感兴趣可以直接扫我的内推码投递,可以加我微信帮看进度:liyuhang1919
#阿里巴巴#  #内推#  #大模型#  #大模型推理#
全部评论

相关推荐

前情提要:楼主是去年毕业的交大本科,被去年的政治英语拷打之后惜败几分无法上岸,遂决定工作在BOSS上投了AI软开的岗位,面的是AI软开里面细分的分布式训练岗整体面试感受比较好,压力面也不是很有压迫感,针对我的不足方面也给出了一些参考意见,推进很流畅下面是整理的部分问题⌚️投递时间:6.13第一周周五👋一面:6.18第二周周三(平和)1.自我介绍+项目经历相关问答2.AI(1)大语言模型Transformer的主要原理(2)残差连接有什么作用(3)卷积核有什么作用,不同种类的卷积核都分别能做什么3.C++(1)智能指针都有哪几类?分别是什么作用?(2)构造函数和析构函数的区别?基类和子类的虚构函数如何被调用?哪些能定义为虚函数?(3)STL用的多吗? map 和 unordered_map 有什么区别?它们在程序内部是怎么实现的?对应增删改查的复杂度?(2)手撕代码:翻转数字【LeetCode 7】我当时给了(1)字符串(2)循环取模累乘累加两种做法🤏二面:6.19第二周周四(压力)1.自我介绍+项目经历相关问答2.数学推导给定一次函数 y=ax+b,已知 y_grad,推导出a_grad, x_grad, b_grad3.PyTorch的一些具体函数的原理+举一反三当时这几个问题回答的不好,有点紧张,然后就听HR和我说后续哪些地方需要学习提升✌️三面:6.20第二周周五主要是HR告诉我被录取了,然后大概和我介绍了一下公司的各项事宜😉oc:6.24第三周周二与HR姐姐沟通了薪资、工时、福利等各种事项后发了offer,原以为可能最后的薪资要比三面和HR沟通的时候还要再低1~2k,结果是涨了2k,其他没什么问题之后就想直接入职了🥰今天是6.25,作为应届毕业生突发奇想带着三方协议去公司,然后和HR参观了一下公司的环境,有餐厅、健身房、瑜伽室等,大楼外的园区环境也不错。最后和未来的leader吃了顿饭(发现就是二面面试官,挺和蔼的前辈),聊了聊公司的发展和我入职后需要做的一些内容,感觉总体蛮不错的
查看10道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务