首页 > 试题广场 >

在部署大模型到在线服务时,推理延迟是关键挑战。以下哪种技术在

[单选题]
在部署大模型到在线服务时,推理延迟是关键挑战。以下哪种技术在实际工程中最能显著降低延迟而不严重牺牲模型准确性?
  • 扩展模型规模以利用硬件并行加速
  • 应用模型蒸馏训练小型高效代理模型
  • 使用高精度浮点计算确保输出一致性
  • 增加批量大小但忽略实时需求
应用模型蒸馏训练小型高效代理模型
而不严重牺牲模型准确性?”?
发表于 2025-09-18 21:54:20 回复(0)