在大型语言模型的推理加速与优化中,以下哪些技术被用于减少计算量和提升推理速度?
模型量化(Quantization)
模型剪枝(Pruning)
知识蒸馏(Knowledge Distillation)
数据增强(Data Augmentation)
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题