字节推荐算法一面分享-实习
发点面经攒攒人品~
项目细节拷打
八股
1.大模型了解多少,强化学习了解什么
2.DPO的全称是什么,公式是什么,直接体现在哪里
3.与PPO对比
归一化方法
• 常用的归一化方法有哪些
• 讲讲RMSNorm
AUC
• auc的定义
• 从样本里随机去掉一些负样本,Auc怎么变
优化器
• 讲一讲常用的优化器
• sgd是什么,Adam相对于sgd改进了什么
位置编码
• 正余弦位置编码的公式
项目细节拷打
八股
1.大模型了解多少,强化学习了解什么
2.DPO的全称是什么,公式是什么,直接体现在哪里
3.与PPO对比
归一化方法
• 常用的归一化方法有哪些
• 讲讲RMSNorm
AUC
• auc的定义
• 从样本里随机去掉一些负样本,Auc怎么变
优化器
• 讲一讲常用的优化器
• sgd是什么,Adam相对于sgd改进了什么
位置编码
• 正余弦位置编码的公式
全部评论
相关推荐
昨天 00:09
吉林大学 C++ 点赞 评论 收藏
分享
查看13道真题和解析 点赞 评论 收藏
分享