卓驭AI infra校招一面 40min

继续来分享下之前的面经~欢迎友好讨论,信息共享
1. 项目深挖
2. 算子优化从 profiling 到落地的完整流程?如何判断一个算子是 memory-bound 还是 compute-bound?
3. 用过哪些 profiling 工具?Nsight Systems 能看到指令级流水吗?
4. 优化时,Warp利用率低怎么归因?负载不均衡怎么解决?
5. 昇腾NPU和 NVIDIA GPU架构差异,内存层级设计
6. 多进程和多线程的性能区别
7. 还了解哪些模型级优化手段?比如 KV Cache / 算子融合 / 量化
8. 模型输出和预期不符,怎么 debug?误差累积怎么解决
9. 对第一份工作最看重什么?
10. 为什么投卓驭?了解我们技术路线吗?
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务