TikTok后端面经
一、手撕:
1. Leetcode 1143 最长公共子串
2. 最长子串
二、八股
1. 为什么要除以根号dk,为什么不是dk,根号dk+1
2. 为什么embedding 空间里相近的词语,距离很接近,怎么做到的?
3. DPO的损失函数是什么样的?DPO训练会存在什么问题?
4. PPO为什么要用一个Reward Model和一个Critic Model,一个是当前的价值一个是未来的价值,有什么区别吗?为什么要这样用?
5. 讲讲多头注意力机制,说说Q, K, V三者是什么意思?如果我把K替换成Q,变成Q, Q, V还能工作吗?
6. 你了解哪些聚类方法?说一说。为什么高斯聚类能处理不规则分布的情况?原理是什么
1. Leetcode 1143 最长公共子串
2. 最长子串
二、八股
1. 为什么要除以根号dk,为什么不是dk,根号dk+1
2. 为什么embedding 空间里相近的词语,距离很接近,怎么做到的?
3. DPO的损失函数是什么样的?DPO训练会存在什么问题?
4. PPO为什么要用一个Reward Model和一个Critic Model,一个是当前的价值一个是未来的价值,有什么区别吗?为什么要这样用?
5. 讲讲多头注意力机制,说说Q, K, V三者是什么意思?如果我把K替换成Q,变成Q, Q, V还能工作吗?
6. 你了解哪些聚类方法?说一说。为什么高斯聚类能处理不规则分布的情况?原理是什么
全部评论
相关推荐

点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
今天 16:17
上海科技大学 安卓 点赞 评论 收藏
分享