首页 > 试题广场 >

我们知道二元分类的输出是概率值。一般设定输出概率大于或等于0

[不定项选择题]

我们知道二元分类的输出是概率值。一般设定输出概率大于或等于0.5,则预测为正类;若输出概率小于 0.5,则预测为负类。那么,如果将阈值 0.5 提高,例如 0.6,大于或等于 0.6
的才预测为正类。则准确率(Precision)和召回率(Recall)会发生什么变化?

  • 准确率(Precision)增加或者不变

  • 准确率(Precision)减小

  • 召回率(Recall)减小或者不变

  • 召回率(Recall)增大

首先来看一下什么是准确率和召回率,下面分别用 P 和 R 代表。以一个简单的例子来说明,例如预测 20 个西瓜中哪些是好瓜,这 20 个西瓜中实际有 15 个好瓜,5 个坏瓜。某个模型预测的结果是:16 个好瓜,4 个坏瓜。其中,预测的 16 个好瓜中有 14 个确实是好瓜,预测的 4 个坏瓜中有 3 个确实是坏瓜。下面以一张图表说明:


这样,准确率 P 的定义是:

P=TPTP+FP
P=TPTP+FP
可以理解为预测好瓜中,确实是好瓜的比例。该例子中 P = 14/(14+2)。

召回率 R 的定义是:

R=TPTP+FN
R=TPTP+FN
可以理解为真实的好瓜被预测出来的比例。该例子中 R = 14/(14+1)。

现在,如果二元分类阈值提高,相当于判定好瓜的标准更严格了。所以可能会造成预测是好瓜的数目减少,即 TP 和 FP 均减小。因此准确率可能会增加,极端的,苛刻条件,只预测一个是好瓜,那该瓜是好瓜的概率会很大,即准确率很高。但是 15 个好瓜你只挑出来 1 个,召回率就降低了。

准确率和召回率都不能很好地反映模型性能,通常使用 F1 score 来作为模型预测水平判据。F1 Score 被定义为准确率和召回率的调和平均数。,如下所示:

F1=2⋅P⋅RP+R
发表于 2021-09-02 14:23:37 回复(1)
考察准确率和召回率的定义。
准确率:所有预测为正样本的部分有多少确实为正。题目中所言提高阈值。我们预测正样本变得更加谨慎,准确率通常会增加或不变。
召回率:所有正样本预测对了多少。提高阈值,预测更少的样本为正样本。召回率会减少或者不变。
发表于 2022-09-08 14:21:27 回复(0)
有问题吧准确率 x/(x + y),提高阈值后x变小,y变小,这个值可能减小、增加或者不变,通常意义上认为负样本y减小的更小,所以是增加或不变。但不严谨。
x是TP,y是FP
编辑于 2022-03-25 16:49:32 回复(0)