首页 > 试题广场 >

在部署大模型到在线服务时，推理延迟是关键挑战。以下哪种技术在

[单选题]

在部署大模型到在线服务时，推理延迟是关键挑战。以下哪种技术在实际工程中最能显著降低延迟而不严重牺牲模型准确性？

扩展模型规模以利用硬件并行加速

应用模型蒸馏训练小型高效代理模型

使用高精度浮点计算确保输出一致性

```
增加批量大小但忽略实时需求
```

查看答案及解析

Little_YangYang头像

Little_YangYang

应用模型蒸馏训练小型高效代理模型

“而不严重牺牲模型准确性？”？

发表于 2025-09-18 21:54:20 回复(0)

提交观点

问题信息

大模型概念

难度：

1条回答 4收藏 19浏览

热门推荐

相关试题

在使用AI大模型进行文本生成时，"...

大模型概念

评论(0)
在AI大模型的应用中，"微调"的主...

大模型概念

评论(0)
在AI大模型的训练中，"过拟合"通...

大模型概念

评论(0)
历史频道《岁时记》纪录片剧组正在梳...

语句表达

评论(1) 来自2025秋招-中国华电集...
2022年，全国注册登记的提供住宿...

资料分析

评论(1) 来自2025秋招-中国华能集...

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号