首页 > 试题广场 >

混沌度(Perplexity)是一种常见的应用在使用深度学习

[单选题]

混沌度(Perplexity)是一种常见的应用在使用深度学习处理NLP问题过程中的评估技术,关于混沌度,哪种说法是正确的?

  • 混沌度没什么影响
  • 混沌度越低越好
  • 混沌度越高越好
  • 混沌度对于结果的影响不一定
混沌度可以理解为不确定性,当然是越低越好。
发表于 2020-05-25 21:56:15 回复(1)
Speech and Language Processing第36页
概率可以写成Ngram的形式
最小化perplexity等同于最大化根据语言模型的测试集概率
perplexity也可以理解为加权平均分支因数(weighted average branching factor),一种语言的分支因数是任一单词后面可能出现的下一个单词的数量。例如,一个由0~9的数字组成的“语言”,假设(在某些训练集中和测试集中)10个数字中的每一个都以相同的概率出现,即P = 1/10,该“语言”的perplexity就是10。
假设数字0是非常频繁的,并且比其他数字出现的频率要高得多,测试集的perplexity会降低,因为大多数情况下,下一个数字很是零的概率很高。因此,尽管分支因数仍然是10,但是perplexity或加权分支因数更小。

参考文献
Parsing C. Speech and language processing[J]. 2009.
发表于 2021-07-14 10:43:35 回复(0)
困惑度(Perplexity)是一种常用的语言模型评价指标,它用来评价语言模型的好坏;句子概率越大,语言模型越好,困惑度(Perplexity)也越小。
发表于 2022-07-03 21:12:01 回复(0)
信息熵
发表于 2021-04-06 09:41:49 回复(0)
测试集中的句子越有可能,说明效果越好,困惑度越小
发表于 2022-07-09 20:50:58 回复(0)
不对吧,ppl太低模型可能就过拟了,得看情况吧
发表于 2023-07-24 13:54:47 回复(0)