面经分享- AI Infra蔚来汽车一面
继续来分享下之前的面经~欢迎友好讨论,信息共享
1. 详细对比CPU、GPU、NPU的硬件架构优缺点及适用场景
2. 为什么NPU适合AI计算?(Unified Buffer、矩阵加速单元)
3. NVIDIA GPU的内存组织架构和计算调度逻辑
4. 为什么要设计Warp?Warp Scheduler是如何工作的?(掩盖访存延迟)
5. GEMM(矩阵乘)在GPU上的经典优化手段(Shared Memory分块、向量化读写、Double Buffer)
6. 大规模Reduction(归约)操作怎么做?(Warp级归约 -> Block级归约 -> Global原子加 vs 多Kernel级联)
7. 多态的实现机制(编译时多态 vs 运行时多态)
8. 构造函数和析构函数可以是虚函数吗?为什么?
9. 继承关系下构造与析构的执行顺序。
10. 智能指针详解(unique_ptr, shared_ptr, weak_ptr及循环引用解决)
1. 详细对比CPU、GPU、NPU的硬件架构优缺点及适用场景
2. 为什么NPU适合AI计算?(Unified Buffer、矩阵加速单元)
3. NVIDIA GPU的内存组织架构和计算调度逻辑
4. 为什么要设计Warp?Warp Scheduler是如何工作的?(掩盖访存延迟)
5. GEMM(矩阵乘)在GPU上的经典优化手段(Shared Memory分块、向量化读写、Double Buffer)
6. 大规模Reduction(归约)操作怎么做?(Warp级归约 -> Block级归约 -> Global原子加 vs 多Kernel级联)
7. 多态的实现机制(编译时多态 vs 运行时多态)
8. 构造函数和析构函数可以是虚函数吗?为什么?
9. 继承关系下构造与析构的执行顺序。
10. 智能指针详解(unique_ptr, shared_ptr, weak_ptr及循环引用解决)
全部评论
相关推荐
查看26道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享
03-19 17:53
武汉大学 算法工程师
暴杀流调参工作者:春招又试了一些岗位,现在投递很有意思,不仅要精心准备简历,投递官网还得把自己写的东西一条一条复制上去,阿里更是各个bu都有自己的官网,重复操作无数次,投完简历卡完学历了,又该写性格测评、能力测评,写完了又要写专业笔试,最近还有些公司搞了AI辅助编程笔试,有些还有AI面试,对着机器人话也听不明白录屏硬说,终于到了人工面试又要一二三四面,小组成员面主管面部门主管面hr面,次次都没出错机会,稍有不慎就是挂。
卡学历卡项目卡论文卡实习什么都卡,没有不卡的😂 点赞 评论 收藏
分享
点赞 评论 收藏
分享
