27暑期百度搜广推算法一面分享
整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1.为什么sft后rl
2.特征怎么构建
3.数据怎么提高质量
4.dapo grpo dpo的区别
5.为什么要混合通用数据,比例多少
手撕:判断字符串是否可以被字典拆分,有没有更优解
1.为什么sft后rl
2.特征怎么构建
3.数据怎么提高质量
4.dapo grpo dpo的区别
5.为什么要混合通用数据,比例多少
手撕:判断字符串是否可以被字典拆分,有没有更优解
全部评论
相关推荐
查看15道真题和解析 点赞 评论 收藏
分享