26届春招 寒武纪 AIGC推理框架研发工程师
2025.4.13,二面,20min
- C++函数模板、规避内存泄露的方法
- torch compiler、cuda graph
- 是否了解 ptx
2026.3.25,一面,1h
- 推理框架研发工程师岗位的理解
- 降低大模型推理成本手段
- 为什么要做算子融合
- cuda graph 原理、作用、使用场景
- 3D 并行 & EP & CP & SP 原理、作用
- 模型量化类型、原理、作用
- 介绍MTP
- vllm的整体架构,请求在内部是如何流转的
- kvcache的空间如何计算
- prefix cache介绍
- vllm V0/V1 比较
- TP下,不同的模块如何汇总结果
- 口述multi head attention
- 一些git、pytorch相关的问题
查看17道真题和解析