招算子开发和优化工程师!

职位名称:算子开发和优化工程师
工作地点:杭州
职位描述:我们正在寻找经验丰富的 NPU 算子开发工程师。你将负责面向自研 NPU 架构的深度学习算子开发、性能调优、算子编译器设计与实现,并参与大模型在 NPU 平台上的部署与调试工作。该岗位对底层硬件理解、编译器技术及深度学习框架有较高要求,是连接算法、软件与硬件的关键角色。
主要职责:
1.设计、开发和优化面向 NPU 的高性能深度学习算子(如 Conv、MatMul、Attention、LayerNorm 等);
2.参与 NPU 专用算子编译器(如基于 MLIR/TVM)的开发与维护;
3.针对大语言模型(LLM)或视觉大模型,在 NPU 上进行端到端部署、性能分析与瓶颈优化;
4.与芯片架构师、驱动团队及算法团队紧密协作,确保算子在硬件上的高效执行;
5.编写自动化测试用例,保障算子功能正确性与性能稳定性;
6.跟踪业界最新 NPU 架构、编译器技术和大模型推理优化方法,持续提升平台能力。
任职要求:
必备条件:
1.计算机科学、电子工程、自动化或相关专业硕士及以上学历;
2.精通 C/C++ 编程,熟悉 Python,具备扎实的系统编程和调试能力;
3.深入理解深度学习基础算子及其数学原理,有实际算子开发或优化经验;
4.熟悉至少一种主流深度学习框架(如 PyTorch、TensorFlow)及其底层执行机制;
5.具备 GPU/NPU/TPU 等 AI 加速器上的性能调优经验;
加分项:
1.了解编译器基本原理,有 LLVM、MLIR、TVM、XLA 等相关项目经验。
2.有自研 NPU 或 AI 芯片公司工作经验;
3.参与过大模型(如 Llama、Qwen、Stable Diffusion 等)在边缘或端侧设备的部署;
4.熟悉 CUDA/OpenCL/HIP 或 NPU 专用指令集、内存层次结构;
5.在顶级会议(如 ASPLOS、OSDI、MLSys、NeurIPS、ICLR)发表过相关论文。
#算子开发#  #找工作#  #芯片#  #推理优化#  #面试#
全部评论

相关推荐

2025-11-30 22:40
门头沟学院 Java
早上开晨会,领导突然说让我把手头的工作全放一放,给我塞了个新任务 —— 给系统里一堆字段做加密解密。功能本身不难,就是个简单的加解密逻辑,但架不住改动点太多了,几乎每个涉及这些字段的接口、页面、数据库操作都要手动加解密,想想就头大。更离谱的是,领导直接跟我挑明 “必须用 AI 做,AI 做不好你再手动改”,等于把我变成了 “AI 指挥官 + 校对工”。我的工作瞬间从写代码变成了跟 AI 掰扯:跟它说清楚哪些字段要加密、哪些要解密、用什么算法、在哪几个文件里改,光沟通需求就耗了一上午。用的是 Cursor,一次批量改动直接用掉了 13 美刀,看着扣费提示我都心疼 —— 这钱还不如给我加个餐呢!而且 AI 改的代码根本不能直接用,要么漏了某些文件的改动,要么加密解密的位置搞反了,我还得逐行核对,把 AI 没改对的地方手动修正,比自己从头写还费眼。最憋屈的是,这活完全没成长啊!就是重复的加解密操作,AI 代劳了大部分,我只负责核对和兜底,学不到任何新东西,还特别无聊。想摸鱼都不敢光明正大摸,得盯着屏幕逐行检查,生怕漏了哪个 bug,最后还得自己做全量测试,确保每个加解密场景都没问题。本来以为这周能准点下班,结果现在又得天天加班赶进度,越干越没劲儿。实习生的命也是命啊,能不能来点有技术含量的活?这种纯重复、靠 AI 代工还费钱的任务,真的让人越干越内耗,只想赶紧做完交差,再也不想碰了!
virus_w:这种cursor竟然是自费吗
实习生的蛐蛐区
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务