首页 > 试题广场 >

在大型语言模型的推理加速与优化中，以下哪些技术被用于减少计算

[不定项选择题]

在大型语言模型的推理加速与优化中，以下哪些技术被用于减少计算量和提升推理速度？

```
模型量化（Quantization）
```
```
模型剪枝（Pruning）
```

知识蒸馏（Knowledge Distillation）

```
数据增强（Data Augmentation）
```

查看答案及解析

盥洗室上的愚者头像

盥洗室上的愚者

c不对吧

发表于 2025-09-17 17:26:12 回复(0)

Jimmyxu头像

Jimmyxu

推理加速阶段用知识蒸馏？这不对吧

发表于 2025-09-08 22:50:04 回复(0)

提交观点

问题信息

大模型开发

难度：

2条回答 17收藏 41浏览

热门推荐

相关试题

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号