为什么只做 SFT 往往对不齐人类偏好？它跟预训练损失的差异

[问答题]

为什么只做 SFT 往往对不齐人类偏好？它跟预训练损失的差异到底体现在哪。

Jerryyyytse

supervised finetuning is only providing question-answer pair, it doesn't indicate the alignment or human value to be safer or make more people to like.

发表于 2026-04-22 10:23:59 回复(0)

提交观点

问题信息

来自：大模型应用-牛客面经八股

难度：

1条回答 3收藏 353浏览

相关试题

向量库工程落地你遇到过哪些关键点？...

评论(0) 来自大模型应用-牛客面经八股
评测体系你怎么搭：离线（MT‑Be...

评论(0) 来自大模型应用-牛客面经八股
大模型项目从架构角度怎么搭？模型选...

评论(0) 来自大模型应用-牛客面经八股
把 Transformer / D...

评论(8) 来自2025年-华为-AI算...
PEFT 方案里（LoRA/QLo...

评论(1) 来自大模型应用-牛客面经八股

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号

为什么只做 SFT 往往对不齐人类偏好？它跟预训练损失的差异

问题信息

热门推荐

相关试题