惩罚生成过长序列,强制输出简短回复
在beam search中调整不同长度候选序列的分数,避免短序列因概率乘法积累而总是得分更高
限制最大生成token数量
对生成的每个token施加固定的分数惩罚
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题