首页 > 试题广场 >

以下关于LLM推理中"length penalty"参数的作

[单选题]
以下关于LLM推理中"length penalty"参数的作用是什么?
  • 惩罚生成过长序列,强制输出简短回复
  • 在beam search中调整不同长度候选序列的分数,避免短序列因概率乘法积累而总是得分更高
  • 限制最大生成token数量
  • 对生成的每个token施加固定的分数惩罚

这道题你会答吗?花几分钟告诉大家答案吧!