字节 推荐算法大模型 实习一面
给我面没招了,发点面经攒攒人品~
项目细节拷打
八股
1.大模型了解多少,强化学习了解什么
2.DPO的全称是什么,公式是什么,直接体现在哪里
3.与PPO对比
归一化方法
• 常用的归一化方法有哪些
• 讲讲RMSNorm
AUC
• auc的定义
• 从样本里随机去掉一些负样本,Auc怎么变
优化器
• 讲一讲常用的优化器
• sgd是什么,Adam相对于sgd改进了什么
位置编码
• 正余弦位置编码的公式
手撕
• 计算逆序对数量
• 多头自注意力
项目细节拷打
八股
1.大模型了解多少,强化学习了解什么
2.DPO的全称是什么,公式是什么,直接体现在哪里
3.与PPO对比
归一化方法
• 常用的归一化方法有哪些
• 讲讲RMSNorm
AUC
• auc的定义
• 从样本里随机去掉一些负样本,Auc怎么变
优化器
• 讲一讲常用的优化器
• sgd是什么,Adam相对于sgd改进了什么
位置编码
• 正余弦位置编码的公式
手撕
• 计算逆序对数量
• 多头自注意力
全部评论

感觉问的似乎不多吧
宝子,你这篇面经很有价值诶,感谢分享!!我私信你啦,你看看~
相关推荐
查看14道真题和解析 点赞 评论 收藏
分享
