oppo AI infra实习二面 好难

发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
项目拷打
1. 数据布局详解:NHWC vs NCHW:在训练/推理中怎么选?
2. 何时应该关闭 Shared Memory?(当出现 Bank Conflict 严重或收益不如直接访问 L2 时)
3. 特定 Shape 导致使用 Shared Memory 时结果异常如何排查
4. Thread/Warp/Block/SM/Grid 的映射关系
5. 如何确定最优线程数?
6. 异步设计:CUDA Stream 的使用前提(无内存访问重叠)
7. 算子融合决策,什么场景适合融合
全部评论
1. NHWC vs NCHW - NCHW:GPU/训练友好,卷积更快,适合训练。 ​ - NHWC:CPU/推理友好,访存连续,适合推理/端侧。 ​ - 选法:训练优先 NCHW,推理看框架/硬件。   2. 何时关 Shared Memory - Bank Conflict 严重、优化不动时 ​ - 数据复用少,SM 开销 > L2 直接读收益 ​ - 小核、低算力 GPU 上 SM 紧张   3. Shared Memory 结果异常排查 - 越界读写、未__syncthreads() ​ - Bank Conflict 导致性能/数值抖动 ​ - 多warp 写同地址、未正确同步 ​ - 类型/大小对齐错误   4. Thread/Warp/Block/SM/Grid
点赞 回复 分享
发布于 03-02 19:35 浙江

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务