字节27实习 多模态大模型二面凉经

感觉面完人都通透了,还是太菜了,下去沉淀一下
1.项目拷打,每个问题都很深很细节,问到你不会为止
八股:
1.attention怎么算?
2.QKV和softmax公式;为什么要除根号d?除d行不行?
3.grpo不同模型架构上训练的差异
4.ppo的value model怎么做的?和actor model输出区别。

手撕ppo,grpo公式,两者核心区别,advantage怎么算,kl怎么加。
最后一些数据提纯和视频生成的场景题。
全部评论
问到你不会为止,就是想看你的深度
点赞 回复 分享
发布于 04-29 21:48 陕西

相关推荐

不愿透露姓名的神秘牛友
04-10 09:06
海尔智家 人力 月8.7K 年包13 五险一金双边12% 三年后两金 本科211
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务