快手实习 Ai Infra一面面经

祝大家都能拿到满意的Offer!
1.实习介绍
2.对岗位的理解
3.Qwen模型占了多少内存,在上一段实习中如何部署的
4.介绍模型量化和Flash attention,实际优化效果如何
5.介绍Tensorrt,底层方面如何加速
6.是否了解vllm框架,追问PagedAttention
7.介绍实验室项目,模型参数量计算量怎么算的
8.Pytorch核心的基础功能是什么,有试过Pytorch对GPU进行管理吗
9.模型训练和推理在资源、消耗上的区别,是否了解模型训练过程中性能优化的手段
10.GPU和CUDA有了解吗,GPU基础的物理执行单元是什么
11.手撕力扣hot100:将有序数组转化为二叉搜索树
全部评论
问的还挺多,有后续流程吗
点赞 回复 分享
发布于 昨天 18:53 北京

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务