oppo AI infra实习二面 好难
发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
项目拷打
1. 数据布局详解:NHWC vs NCHW:在训练/推理中怎么选?
2. 何时应该关闭 Shared Memory?(当出现 Bank Conflict 严重或收益不如直接访问 L2 时)
3. 特定 Shape 导致使用 Shared Memory 时结果异常如何排查
4. Thread/Warp/Block/SM/Grid 的映射关系
5. 如何确定最优线程数?
6. 异步设计:CUDA Stream 的使用前提(无内存访问重叠)
7. 算子融合决策,什么场景适合融合
项目拷打
1. 数据布局详解:NHWC vs NCHW:在训练/推理中怎么选?
2. 何时应该关闭 Shared Memory?(当出现 Bank Conflict 严重或收益不如直接访问 L2 时)
3. 特定 Shape 导致使用 Shared Memory 时结果异常如何排查
4. Thread/Warp/Block/SM/Grid 的映射关系
5. 如何确定最优线程数?
6. 异步设计:CUDA Stream 的使用前提(无内存访问重叠)
7. 算子融合决策,什么场景适合融合
全部评论
1. NHWC vs NCHW
- NCHW:GPU/训练友好,卷积更快,适合训练。
- NHWC:CPU/推理友好,访存连续,适合推理/端侧。
- 选法:训练优先 NCHW,推理看框架/硬件。
2. 何时关 Shared Memory
- Bank Conflict 严重、优化不动时
- 数据复用少,SM 开销 > L2 直接读收益
- 小核、低算力 GPU 上 SM 紧张
3. Shared Memory 结果异常排查
- 越界读写、未__syncthreads()
- Bank Conflict 导致性能/数值抖动
- 多warp 写同地址、未正确同步
- 类型/大小对齐错误
4. Thread/Warp/Block/SM/Grid
相关推荐
查看15道真题和解析