小红书日常 一面(凉凉
推理co_design方向,无实习经历。刚开始麦克一直不好使,后来拉了个腾讯会议,直接共享屏幕讲项目。
1.vllm的队列,pd分离中也是这些队列吗。(PD分离不会)
2.EP加速原理,vllm 怎么做DP(面试官说没看过vllm源码)
3.GEMM优化,sharedmemory和L1Cache的区别。(说到了Z-order优化warp排列,L1 cache没答上来)
4.flashattention怎么加速的,计算量相比naive atteniton?(就简单讲了下流程)
5.pytorch显存管理?clean cache怎么做,移动之前的显存吗?(应该移动?)
6.投机解码看了哪篇论文?流程是怎么样的,大模型怎么验证?计算量怎么变?计算量不变为什么会加速?
7.megatron的行列并行。
无手撕,感觉也没啥特别八股的东西,项目问的很深,有些东西一知半解的一问就问出来了。
还是准备的不是很充分,面了一半就感觉GG了,刚一结束果然G了。
面试官说最好有些PR。还得学啊
1.vllm的队列,pd分离中也是这些队列吗。(PD分离不会)
2.EP加速原理,vllm 怎么做DP(面试官说没看过vllm源码)
3.GEMM优化,sharedmemory和L1Cache的区别。(说到了Z-order优化warp排列,L1 cache没答上来)
4.flashattention怎么加速的,计算量相比naive atteniton?(就简单讲了下流程)
5.pytorch显存管理?clean cache怎么做,移动之前的显存吗?(应该移动?)
6.投机解码看了哪篇论文?流程是怎么样的,大模型怎么验证?计算量怎么变?计算量不变为什么会加速?
7.megatron的行列并行。
无手撕,感觉也没啥特别八股的东西,项目问的很深,有些东西一知半解的一问就问出来了。
还是准备的不是很充分,面了一半就感觉GG了,刚一结束果然G了。
面试官说最好有些PR。还得学啊
全部评论
AI infra方向吗,考察广度很大呀
相关推荐
04-14 19:08
南昌航空大学科技学院 C++
饼子吃到撑:现在就是学历大于一切了,尤其是应届生,你再厉害人家筛选按钮选择985双非直接完蛋,学历就是硬伤,公司肯定都想用优秀的人,但是不知道你到底优不优秀只能通过最原始的方法来筛选~学历, 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看16道真题和解析