飞腾 AI Infra 实习一面分享
发点面经攒攒人品~
基础知识
1 进程与线程的核心区别是什么?Cache 的层级结构及2. 常见替换策略有哪些?
3. IEEE 浮点标准中 FP16、FP32、FP64 各自的位宽分配方式是怎样的?
4. 快速排序的执行流程是什么?堆的基本性质有哪些?拓扑排序适用于哪些场景?
推理与算子优化
5. 请阐述 Transformer 架构中 Decoder-only 结构的特点,包括 QKV 的生成过程以及位置编码的嵌入时机。
6. RMSNorm 的计算公式是什么?其计算访存特性如何?可以从哪些角度进行优化(如负载均衡、Double Buffer、指令替换)?
7. Softmax 的数值稳定性问题如何处理?Online Softmax 的实现原理是什么?
8. 矩阵乘法与反量化融合算子在内存方面的优化策略有哪些?
9. 稀疏矩阵 SpMV 运算中如何实现负载均衡与带宽优化?
项目经历
10. 项目深入考察。
工具与工程
11. Git 中拉取远程分支的操作方式有哪些?fetch+checkout 与 pull 的区别是什么?
基础知识
1 进程与线程的核心区别是什么?Cache 的层级结构及2. 常见替换策略有哪些?
3. IEEE 浮点标准中 FP16、FP32、FP64 各自的位宽分配方式是怎样的?
4. 快速排序的执行流程是什么?堆的基本性质有哪些?拓扑排序适用于哪些场景?
推理与算子优化
5. 请阐述 Transformer 架构中 Decoder-only 结构的特点,包括 QKV 的生成过程以及位置编码的嵌入时机。
6. RMSNorm 的计算公式是什么?其计算访存特性如何?可以从哪些角度进行优化(如负载均衡、Double Buffer、指令替换)?
7. Softmax 的数值稳定性问题如何处理?Online Softmax 的实现原理是什么?
8. 矩阵乘法与反量化融合算子在内存方面的优化策略有哪些?
9. 稀疏矩阵 SpMV 运算中如何实现负载均衡与带宽优化?
项目经历
10. 项目深入考察。
工具与工程
11. Git 中拉取远程分支的操作方式有哪些?fetch+checkout 与 pull 的区别是什么?
全部评论
相关推荐
点赞 评论 收藏
分享
查看13道真题和解析