首页 > 试题广场 >

在二分类问题中,当测试集的正例和负例数量不均衡时,以下评价方

[单选题]
在二分类问题中,当测试集的正例和负例数量不均衡时,以下评价方案哪个是相对不合理的()(假设 precision=TP/(TP+FP),recall=TP/(TP+FN)。)
  • Accuracy:(TP+TN)/all
  • F-value:2*recall*precision/(recall+precision)
  • G-mean:sqrt(precision*recall)
  • AUC:曲线下面积
推荐
emj头像 emj
A
题目提到测试集正例和负例数量不均衡,那么假设正例数量很少占10%,负例数量占大部分90%。
而且算法能正确识别所有负例,但正例只有一半能正确判别。
那么TP=0.05×all, TN=0.9×all,Accuracy=95%。
虽然Accuracy很高,但正例precision只有50%
编辑于 2015-06-17 21:29:02 回复(1)
答案选A,
(此答案修正一楼)

题目提到测试集正例和负例数量不均衡,那么假设正例数量很少占10%,负例数量占大部分90%。
而且算法能正确识别所有负例,但正例只有一半能正确判别。
那么TP=0.05×all, TN=0.9×all,Accuracy=95%。
虽然Accuracy很高,precision是100%,但正例recall只有50%
编辑于 2016-09-11 13:47:02 回复(0)

当beta取值1时,为F1值
c选项中的G-mean公式错的吧

编辑于 2018-11-04 19:52:22 回复(0)
遇到此种题,表示自动放弃!!!
发表于 2017-07-10 21:19:25 回复(0)
码一下G-mean,第一次听说。C选项的公式确实错了。

Recall =TPrate =TP/(TP+FN),

Precision =PPvalue = TP/(TP+FP),

真阴性率:TNrate=TN/(TN+FP)

参见,https://blog.csdn.net/weixin_38313113/article/details/89407518
编辑于 2019-08-13 22:05:24 回复(0)
hah头像 hah
A 因为样本不平衡时 A中计算的准确率并不能很好的衡量算法的优劣 可能吧所有的负类分类正确了 
而我们关注的是正例
发表于 2015-03-29 16:48:18 回复(0)