首页 > 试题广场 >

以下哪种注意力优化技术通过将注意力矩阵分块计算来避免完整N×

[单选题]
以下哪种注意力优化技术通过将注意力矩阵分块计算来避免完整N×N矩阵的存储?
  • GQA
  • Linear Attention
  • Flash Attention
  • Sparse Attention

这道题你会答吗?花几分钟告诉大家答案吧!