首页 > 试题广场 >

在大型语言模型的推理加速与优化中,以下哪些技术被用于减少计算

[不定项选择题]

在大型语言模型的推理加速与优化中,以下哪些技术被用于减少计算量和提升推理速度?

  • 模型量化(Quantization)

  • 模型剪枝(Pruning)

  • 知识蒸馏(Knowledge Distillation)

  • 数据增强(Data Augmentation)

c不对吧
发表于 2025-09-17 17:26:12 回复(0)
推理加速阶段用知识蒸馏?这不对吧
发表于 2025-09-08 22:50:04 回复(0)