26届春招 寒武纪 AIGC推理框架研发工程师

2025.4.13,二面,20min

  1. C++函数模板、规避内存泄露的方法
  2. torch compiler、cuda graph
  3. 是否了解 ptx

2026.3.25,一面,1h

  1. 推理框架研发工程师岗位的理解
  2. 降低大模型推理成本手段
  3. 为什么要做算子融合
  4. cuda graph 原理、作用、使用场景
  5. 3D 并行 & EP & CP & SP 原理、作用
  6. 模型量化类型、原理、作用
  7. 介绍MTP
  8. vllm的整体架构,请求在内部是如何流转的
  9. kvcache的空间如何计算
  10. prefix cache介绍
  11. vllm V0/V1 比较
  12. TP下,不同的模块如何汇总结果
  13. 口述multi head attention
  14. 一些git、pytorch相关的问题
#寒武纪##发面经攒人品##我的求职进度条#
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务