上海天数智芯-大模型推理引擎研发工程师招聘

岗位职责:

负责天数大模型推理技术的探索与研发,提升大模型在天数 GPGPU 上的推理性能:

1. 负责大模型推理引擎的架构设计与实现;

2. 负责大模型 server 的架构设计与实现;

3. 负责大模型推理通信库的设计及算法实现;

4. 负责大模型相关算子的实现及推理性能的整体优化;

5. 调研并支持大模型前沿算法;

任职资格:

编程基础(必须):

1. 熟悉 Python/C++ 编程(11标准及以上),了解常用数据结构及设计模式;

2. 熟悉深度学习编程框架,能够使用PyTorch 构建大模型推理 pipeline 并对模型中的核心模块进行高效实现;

3. 熟悉 CUDA 编程,了解常见算子的实现及优化手段;

大模型推理技术(至少满足两项):

1. 有 vLLM、TGI、SGLang、TensorRT-LLM等大模型推理框架的使用或优化经验;

2. 了解FlashAttention、PagedAttention、MoE、Chunked Prefill 等大模型核心技术;

3. 了解常见的大模型量化算法(如AWQ、GPTQ、SmoothQuant 等)及量化算子的实现;

4. 了解大模型通信算子(如Allreduce 等)及计算通信 overlap 实现;

5. 有分离式部署(PD 分离)开发经验。

感兴趣可以私聊我进一步了解~

#大模型##大模型招聘##大模型应用开发##大模型找工作##大模型算法工程师#
全部评论

相关推荐

暴杀流调参工作者:春招又试了一些岗位,现在投递很有意思,不仅要精心准备简历,投递官网还得把自己写的东西一条一条复制上去,阿里更是各个bu都有自己的官网,重复操作无数次,投完简历卡完学历了,又该写性格测评、能力测评,写完了又要写专业笔试,最近还有些公司搞了AI辅助编程笔试,有些还有AI面试,对着机器人话也听不明白录屏硬说,终于到了人工面试又要一二三四面,小组成员面主管面部门主管面hr面,次次都没出错机会,稍有不慎就是挂。 卡学历卡项目卡论文卡实习什么都卡,没有不卡的😂
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务