百度大模型算法三面面经

三面主要以聊项目为主,问题相对比较少,无手撕
DPO相比于PPO的优势?
在不同的项目中,都使用了DPO,有哪些区别?
如何分析训练结果并改进训练数据的构造方式?
多模态的DPO的训练是如何做的,如果构造数据?
全部评论

相关推荐

魔法恐龙:这真得给个机会,面试的时候问问不吃饭78.5h怎么做到的
点赞 评论 收藏
分享
10-10 01:10
已编辑
深圳大学 测试开发
面了100年面试不知...:六月到九月,四个项目一个实习,是魔丸吗
投了多少份简历才上岸
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务