首页 > 试题广场 >

在RoPE(旋转位置编码)推理外推时,长度超过训练最大长度会

[单选题]
在RoPE(旋转位置编码)推理外推时,长度超过训练最大长度会出现什么问题?
  • 模型直接报错无法处理
  • 注意力分数的旋转频率超出训练范围,导致位置感知失效,长文本理解能力大幅下降
  • KV Cache溢出导致OOM
  • 生成速度线性下降

这道题你会答吗?花几分钟告诉大家答案吧!