TikTok后端面经
一、手撕:
1. Leetcode 1143 最长公共子串
2. 最长子串
二、八股
1. 为什么要除以根号dk,为什么不是dk,根号dk+1
2. 为什么embedding 空间里相近的词语,距离很接近,怎么做到的?
3. DPO的损失函数是什么样的?DPO训练会存在什么问题?
4. PPO为什么要用一个Reward Model和一个Critic Model,一个是当前的价值一个是未来的价值,有什么区别吗?为什么要这样用?
5. 讲讲多头注意力机制,说说Q, K, V三者是什么意思?如果我把K替换成Q,变成Q, Q, V还能工作吗?
6. 你了解哪些聚类方法?说一说。为什么高斯聚类能处理不规则分布的情况?原理是什么
1. Leetcode 1143 最长公共子串
2. 最长子串
二、八股
1. 为什么要除以根号dk,为什么不是dk,根号dk+1
2. 为什么embedding 空间里相近的词语,距离很接近,怎么做到的?
3. DPO的损失函数是什么样的?DPO训练会存在什么问题?
4. PPO为什么要用一个Reward Model和一个Critic Model,一个是当前的价值一个是未来的价值,有什么区别吗?为什么要这样用?
5. 讲讲多头注意力机制,说说Q, K, V三者是什么意思?如果我把K替换成Q,变成Q, Q, V还能工作吗?
6. 你了解哪些聚类方法?说一说。为什么高斯聚类能处理不规则分布的情况?原理是什么
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
昨天 16:17
上海科技大学 安卓 点赞 评论 收藏
分享