首页 > 试题广场 >

为什么只做 SFT 往往对不齐人类偏好?它跟预训练损失的差异

[问答题]
为什么只做 SFT 往往对不齐人类偏好?它跟预训练损失的差异到底体现在哪。
supervised finetuning is only providing question-answer pair, it doesn't indicate the alignment or human value to be safer or make more people to like.
发表于 2026-04-22 10:23:59 回复(0)