3.25百度AI infra一面 1h
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1、项目拷打
2、八股:
(1)解释一下attention机制,再讲讲你最近关注的
模型的attention机制
(2)QKV为什么要有K,直接V不行吗
(3)BN. LN. RMS
(4)位置编码
(5)介绍RL,PPO、DPO、GRPO
(6)为什么decoder only模型用的比decoder only模型多
3、无手撕
1、项目拷打
2、八股:
(1)解释一下attention机制,再讲讲你最近关注的
模型的attention机制
(2)QKV为什么要有K,直接V不行吗
(3)BN. LN. RMS
(4)位置编码
(5)介绍RL,PPO、DPO、GRPO
(6)为什么decoder only模型用的比decoder only模型多
3、无手撕
全部评论
是实习么
是偏RL的岗位吗?还问到了RL的相关内容
相关推荐
查看4道真题和解析 点赞 评论 收藏
分享