面经分享- AI Infra蔚来汽车一面

继续来分享下之前的面经~欢迎友好讨论,信息共享
1. 详细对比CPU、GPU、NPU的硬件架构优缺点及适用场景
2. 为什么NPU适合AI计算?(Unified Buffer、矩阵加速单元)
3. NVIDIA GPU的内存组织架构和计算调度逻辑
4. 为什么要设计Warp?Warp Scheduler是如何工作的?(掩盖访存延迟)
5. GEMM(矩阵乘)在GPU上的经典优化手段(Shared Memory分块、向量化读写、Double Buffer)
6. 大规模Reduction(归约)操作怎么做?(Warp级归约 -> Block级归约 -> Global原子加 vs 多Kernel级联)
7. 多态的实现机制(编译时多态 vs 运行时多态)
8. 构造函数和析构函数可以是虚函数吗?为什么?
9. 继承关系下构造与析构的执行顺序。
10. 智能指针详解(unique_ptr, shared_ptr, weak_ptr及循环引用解决)
全部评论

相关推荐

03-18 01:22
门头沟学院 Java
肖先生~:先别说工资,现在有个工作就不错了
点赞 评论 收藏
分享
03-31 14:46
已编辑
门头沟学院 Web前端
励志成为双港第一ja...:这其实很正常,离的太远了,他认为你不会来,就为了混个面试,而且成本很高,实习生都优先选本地高校。吃了地域的亏,所有很多时候地域可能比院校层次更重要。
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务