卓驭AI infra校招一面 40min

继续来分享下之前的面经~欢迎友好讨论,信息共享
1. 项目深挖
2. 算子优化从 profiling 到落地的完整流程?如何判断一个算子是 memory-bound 还是 compute-bound?
3. 用过哪些 profiling 工具?Nsight Systems 能看到指令级流水吗?
4. 优化时,Warp利用率低怎么归因?负载不均衡怎么解决?
5. 昇腾NPU和 NVIDIA GPU架构差异,内存层级设计
6. 多进程和多线程的性能区别
7. 还了解哪些模型级优化手段?比如 KV Cache / 算子融合 / 量化
8. 模型输出和预期不符,怎么 debug?误差累积怎么解决
9. 对第一份工作最看重什么?
10. 为什么投卓驭?了解我们技术路线吗?
全部评论
有评测吗,是双机位还是单机位呢?
点赞 回复 分享
发布于 04-01 22:37 广东

相关推荐

04-17 19:33
已编辑
哈尔滨工程大学 C++
4.13 一面可能是我太菜了,面得一塌糊涂,面试官是交付部的老大,我觉得在这个部门工作的人过得应该不咋地。简历项目不问,实习不问,问了一堆和中间件相关的问题,简历写的一条没问,我说我没做过中间件的东西,对我们来说代码是黑盒,ta说你就按自己理解讲就行,然后讲完了ta就说你说的是错的。 问我怎么设计中间件 谁释放内存怎么共享 怎么零拷贝1.一对多的消费者模式怎么实现线程安全 资源共享,内存释放怎么同步,实现细节2.linux的调度策略3.进程线程区别4.进程通信方式线程能用吗 为什么5.什么时候拆进程 什么时候合进程 举一些例子6.fifo和rr的本质区别,rr能不能抢占7.优缺点8.fifo什么情况下什么时候不可能被抢占。9.rr什么时候抢占fifo10.进程有哪些部分11.数据段还细分吗,bss是什么时候怎么实现清零的,清零过程,是汇编吗12.静态初始化怎么做的 不如我声明一个1万长度得数组,只有135给了具体值,这么大的数据是怎么实现初始化的,有哪些机制,在哪个阶段13.未初始化变量会有什么后果14.动态库怎么加载的,什么时候加载15.你说映射到mmap,那动态库的数据段和代码段都是怎么映射的,如果不是一样的话有什么区别,堆和栈呢,分别怎么映射16.内存在这个过程中是怎么样的只记得这些了4.16 挂
查看17道真题和解析
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务