快手实习 Ai Infra一面面经
祝大家都能拿到满意的Offer!
1.实习介绍
2.对岗位的理解
3.Qwen模型占了多少内存,在上一段实习中如何部署的
4.介绍模型量化和Flash attention,实际优化效果如何
5.介绍Tensorrt,底层方面如何加速
6.是否了解vllm框架,追问PagedAttention
7.介绍实验室项目,模型参数量计算量怎么算的
8.Pytorch核心的基础功能是什么,有试过Pytorch对GPU进行管理吗
9.模型训练和推理在资源、消耗上的区别,是否了解模型训练过程中性能优化的手段
10.GPU和CUDA有了解吗,GPU基础的物理执行单元是什么
11.手撕力扣hot100:将有序数组转化为二叉搜索树
1.实习介绍
2.对岗位的理解
3.Qwen模型占了多少内存,在上一段实习中如何部署的
4.介绍模型量化和Flash attention,实际优化效果如何
5.介绍Tensorrt,底层方面如何加速
6.是否了解vllm框架,追问PagedAttention
7.介绍实验室项目,模型参数量计算量怎么算的
8.Pytorch核心的基础功能是什么,有试过Pytorch对GPU进行管理吗
9.模型训练和推理在资源、消耗上的区别,是否了解模型训练过程中性能优化的手段
10.GPU和CUDA有了解吗,GPU基础的物理执行单元是什么
11.手撕力扣hot100:将有序数组转化为二叉搜索树
全部评论

问的还挺多,有后续流程吗
相关推荐
02-27 14:56
哈尔滨工业大学 机械工程师 点赞 评论 收藏
分享
查看16道真题和解析