首页 > 试题广场 >

在大型语言模型的三阶段训练流程中，哪一个阶段的主要目标是让只

[单选题]

在大型语言模型的三阶段训练流程中，哪一个阶段的主要目标是让只会“续写”文本的基座模型变为能理解并遵循人类指令格式的“对话助手”？

```
预训练 (Pre-training)
```

有监督微调 (Supervised Fine-Tuning, SFT)

奖励模型训练 (Reward Model Training)

基于人类反馈的强化学习 (RLHF)

查看正确选项

这道题你会答吗？花几分钟告诉大家答案吧！

提交观点

问题信息

来自：2025年秋招-华为-...

难度：

0条回答 11收藏 161浏览

热门推荐

相关试题

变量 X、Y 的两组数据：组A为 ...

评论(0) 来自2025年秋招-华为-1...
实现简化版的 LSTM

评论(0) 来自2025年秋招-华为-1...
某电商推荐系统用户“月均消费金额”...

评论(0) 来自2025年秋招-华为-1...
在自然语言处理的 N-gram 模...

评论(0) 来自2025年秋招-华为-1...
欠定线性方程 y = A x（A ...

评论(0) 来自2025年秋招-华为-1...

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号