飞腾AI infra实习一面 40min
祝大家都能拿到满意的Offer!
1. 项目深挖
2. Transformer架构与多头注意力机制细节(Decoder-only结构、QKV生成、位置编码嵌入时机)
3. RMSNorm公式、计算访存特性及优化方法(负载均衡/Double Buffer/指令替换)
4. Softmax数值稳定性处理与Online实现
5. 矩阵乘与反量化融合算子的内存优化策略
6. 稀疏矩阵SpMV的负载均衡与带宽优化
7. IEEE浮点标准(FP16/32/64位分配)
8. 基础算法:快排步骤、堆性质、拓扑排序适用场景
9. 系统基础:进程/线程区别、Cache层级与替换策略
10. 工具链:Git分支操作命令(fetch+checkout vs pull)
1. 项目深挖
2. Transformer架构与多头注意力机制细节(Decoder-only结构、QKV生成、位置编码嵌入时机)
3. RMSNorm公式、计算访存特性及优化方法(负载均衡/Double Buffer/指令替换)
4. Softmax数值稳定性处理与Online实现
5. 矩阵乘与反量化融合算子的内存优化策略
6. 稀疏矩阵SpMV的负载均衡与带宽优化
7. IEEE浮点标准(FP16/32/64位分配)
8. 基础算法:快排步骤、堆性质、拓扑排序适用场景
9. 系统基础:进程/线程区别、Cache层级与替换策略
10. 工具链:Git分支操作命令(fetch+checkout vs pull)
全部评论
相关推荐
02-28 14:56
北京交通大学 Java 点赞 评论 收藏
分享
查看15道真题和解析