首页 > 试题广场 >

在评估大语言模型的生成输出时,BLEU分数常被用于度量哪个具

[单选题]
在评估大语言模型的生成输出时,BLEU分数常被用于度量哪个具体任务的表现?
  • 文本创意性
  • 逻辑推理能力
  • 机器翻译的匹配精度
  • 情感分类错误率
BLEU (bilingual evaluation understudy) 
发表于 今天 14:08:46 回复(0)