3.25百度AI infra一面 1h

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1、项目拷打
2、八股:
(1)解释一下attention机制,再讲讲你最近关注的
模型的attention机制
(2)QKV为什么要有K,直接V不行吗
(3)BN. LN. RMS
(4)位置编码
(5)介绍RL,PPO、DPO、GRPO
(6)为什么decoder only模型用的比decoder only模型多
3、无手撕
全部评论
是实习么
点赞 回复 分享
发布于 昨天 23:08 上海
是偏RL的岗位吗?还问到了RL的相关内容
点赞 回复 分享
发布于 昨天 14:36 广东

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务