首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
SFT 和对齐(RLHFDPOIPOPPO)原理差在哪
[问答题]
SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你会怎么选路线。
添加笔记
求解答(0)
邀请回答
收藏(10)
分享
纠错
0个回答
添加回答
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
来自:
大模型应用-牛客面经八股
难度:
0条回答
10收藏
215浏览
热门推荐
相关试题
推理加速这块你有哪些落地经验?量化...
评论
(0)
来自
大模型应用-牛客面经八股
Function/Tool‑Cal...
评论
(0)
来自
大模型应用-牛客面经八股
大模型项目从架构角度怎么搭?模型选...
评论
(0)
来自
大模型应用-牛客面经八股
PEFT 方案里(LoRA/QLo...
评论
(0)
来自
大模型应用-牛客面经八股
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题