日常实习字节多模态大模型算法二面

攒人品中,有面试过同岗的朋友欢迎评论区交流
1.llava1.6的改进
2.qwen23vl的改进
3.手撕MHA
4.DPO与PPO的区别
5.GRPO如何计算相对R
6.GRPO为什么要对重要性ratio进行clip
7.为什么要除以根号Dk
8.为什么注意力操作是qkv三个向量
9.一般通过什么方式进行知识的学习
10.看过什么技术报告
全部评论
佬面的是哪个部门呀
点赞 回复 分享
发布于 昨天 01:43 湖北

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务