虾皮多模态算法实习二面-业务面
发点面经攒攒人品~
1.项目介绍
2.拷打实习数据怎么处理的?流程是?vllm的pagedattention为什么好?
3.有没有了解最新的论文?
4.qwen3-vlmrope的thw交错为什么好?有没有看过源码?
5.lora注入哪些层?
6.adam和adamw什么区别?为什么要高精度?
7.手撕连续子数组的最大乘积
1.项目介绍
2.拷打实习数据怎么处理的?流程是?vllm的pagedattention为什么好?
3.有没有了解最新的论文?
4.qwen3-vlmrope的thw交错为什么好?有没有看过源码?
5.lora注入哪些层?
6.adam和adamw什么区别?为什么要高精度?
7.手撕连续子数组的最大乘积
全部评论
相关推荐
点赞 评论 收藏
分享
