日常实习字节多模态大模型算法二面
攒人品中,有面试过同岗的朋友欢迎评论区交流
1.llava1.6的改进
2.qwen23vl的改进
3.手撕MHA
4.DPO与PPO的区别
5.GRPO如何计算相对R
6.GRPO为什么要对重要性ratio进行clip
7.为什么要除以根号Dk
8.为什么注意力操作是qkv三个向量
9.一般通过什么方式进行知识的学习
10.看过什么技术报告
1.llava1.6的改进
2.qwen23vl的改进
3.手撕MHA
4.DPO与PPO的区别
5.GRPO如何计算相对R
6.GRPO为什么要对重要性ratio进行clip
7.为什么要除以根号Dk
8.为什么注意力操作是qkv三个向量
9.一般通过什么方式进行知识的学习
10.看过什么技术报告
全部评论
佬面的是哪个部门呀
相关推荐
查看10道真题和解析 点赞 评论 收藏
分享