字节推荐算法一面分享-实习

发点面经攒攒人品~
项目细节拷打
八股
1.大模型了解多少,强化学习了解什么
2.DPO的全称是什么,公式是什么,直接体现在哪里
3.与PPO对比
归一化方法
• 常用的归一化方法有哪些
• 讲讲RMSNorm
AUC
• auc的定义
• 从样本里随机去掉一些负样本,Auc怎么变
优化器
• 讲一讲常用的优化器
• sgd是什么,Adam相对于sgd改进了什么
位置编码
• 正余弦位置编码的公式
全部评论

相关推荐

查看14道真题和解析
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务