C++开发工程师(AI编译器方向)-25届春招

薪资面议
北京市海淀区知春路7号致真大厦D座16层
2025-03-06
 什么是官网闪投?
简历直投官网 无需重复填写简历 投后必反馈 进度实时更新 安全可靠官网可查 海量岗位5w+ 移动端投递方便


职位描述

我们正在寻找一位 编译器优化工程师,专注于在 寒武纪(Cambricon)芯片 上优化 Triton 编译器和基于MHLO的图编译器,以提升 AI 计算的性能和效率。你将负责 AI编译器在寒武纪 NPU 架构上的适配和优化。



岗位职责

  1. 研究和优化 Triton 编译器和基于MHLO的图编译器,使其高效支持 寒武纪芯片 计算架构。
  2. 基于 MLIR + Linalg 框架,提升编译器代码执行效率。
  3. 参与 图优化、后端代码生成、调度策略、指令优化、流水并行化相关优化工作。
  4. 研究和优化寒武纪芯片 上的 Kernel 计算性能,降低计算开销,提高吞吐率。
  5. 研究算子融合(Op Fusion)、自动调优(Auto-Tuning)、代码生成(CodeGen) 相关优化策略。
  6. 与 硬件团队、AI框架团队(如 PyTorch/TensorFlow) 协作,提升 寒武纪AI编译器对寒武纪 NPU 的支持能力。
  7. 跟踪 LLVM、Triton、TVM、XLA、TorchInductor 等 AI 编译器前沿技术,优化编译性能。


岗位要求

  1. 计算机、电子工程、数学或相关专业本科及以上学历。
  2. 具备扎实的编程基础,熟练掌握C++和Python。
  3. 对编译器技术有浓厚兴趣,熟悉MLIR、Linalg或类似编译框架者优先。
  4. 有Triton开发经验或参与过相关开源项目者优先。
  5. 有GPU/TPU/DSP等芯片的Kernel优化或性能调优经验者加分。
  6. 学习能力强,具备良好的问题解决能力和团队协作意识。

加分项(优先考虑):

  1. 参与过 Triton、IREE、XLA、TVM、TorchInductor 等编译器的开发,或在 GitHub 提交过相关 PR。
  2. 在校期间参与过编译器、AI框架或高性能计算相关项目。
  3. 有ACM、OI等竞赛背景或开源社区贡献。
  4. 在 NeurIPS、ICLR、PLDI、CGO、MICRO 等学术会议上发表过 AI 编译相关论文。
寒武纪
人工智能
上市
北京,上海,深圳,合肥,西安,南京
查看其他 0 个职位