首页 > 试题广场 >

在大型语言模型的推理过程中,延迟优化通常优先考虑哪方面?

[单选题]
在大型语言模型的推理过程中,延迟优化通常优先考虑哪方面?
  • 训练数据的处理速度
  • 单次查询请求的响应时间
  • 模型的总体参数量平衡
  • 预训练阶段的收敛时间
推理过程中优先处理用户的输入输出,所以延迟优化会先考虑单次查询的响应时间,否则用户会炸毛
发表于 2025-11-06 19:41:41 回复(0)