首页 > 试题广场 >

现在假设负样本量:正样本量=20:1,下列哪些方法可以处理这

[不定项选择题]
现在假设负样本量:正样本量=20:1,下列哪些方法可以处理这种不平衡的情况?()
  • 直接训练模型,预测的时候调节阈值
  • 下采样对少样本进行扩充,以增加正样本数量
  • 随机降采样负样本
  • 训练过程中,增加负样本的权重
类别不平衡的时候可以通过阈值缩放
编辑于 2021-02-20 10:26:27 回复(0)
参考西瓜书,解决类别不平衡书中提出三种方法:
1.下采样
2.过采样
3.阈值偏移
所以我觉得第一个也应该选吧
发表于 2020-03-06 20:34:39 回复(1)
这答案有鬼了吧,复制正样本也只是增加重复数据,对建模并不会提供额外信息的好吗?

如果不通过下采样对少样本进行扩充,剩下的方法就只有在建模的时候调节权重权重了啊
发表于 2019-09-06 09:07:42 回复(7)
主要三个方面,数据,模型和评估方法。

数据上过采样和欠采样,使之均衡;
模型上选对样本不均衡问题不敏感的模型,如决策树; 或者调整分类阈值,使得更倾向与类别少的数据
评估方法,比如ROC或者F1得分
发表于 2020-08-10 17:52:42 回复(0)
题目中的 B 选项有错别字,应该是(对正样本)上采样;题中误写成了下采样
发表于 2022-07-03 20:59:56 回复(0)
为什么下采样能对“少样本”进行扩充,不应该是上采样才对“少样本”进行扩充吗?
发表于 2021-10-01 19:03:44 回复(2)
B:直接的随机采样虽然可以使样本集变得均衡,但会带来一些问题,比如,过采样对少数类样本进行了多次复制,扩大了数据规模,增加了模型训练的复杂度,同时也容易造成过拟合;可以采用SMOTE方法生成样本。
C:虽然可能丢失部分有用信息....
D:在样本不均衡时,也可以通过改变模型训练时的目标函数(如代价敏感学习中不同类别有不同的权重)来矫正这种不平衡性;当样本数目极其不均衡时,也可以将问题转化为单类学习(one-class learning)、异常检测(anomaly detection)。

发表于 2020-07-28 12:48:42 回复(0)
这个为什么啊。。
发表于 2019-08-26 22:11:46 回复(2)
主要三个方面,数据,模型和评估方法。 数据上过采样和欠采样,使之均衡; 模型上选对样本不均衡问题不敏感的模型,如决策树; 或者调整分类阈值,使得更倾向与类别少的数据 评估方法,比如ROC或者F1得分
发表于 2023-11-19 23:01:30 回复(0)
下采样还能扩充???下采样不是间隔去点么,上采样才是插值么,我理解错了么???
发表于 2022-11-22 09:37:52 回复(0)
B选项为啥是正确的?扩充少数样本不应该是上采样吗?
发表于 2021-12-18 21:21:25 回复(0)
解决类别 不平衡问题下采样 过采样阈值移动
发表于 2021-09-23 21:54:17 回复(0)
A选项查了一下 应该是正确的 可以参考这个文章:
D选项错在应该是
增加正样本的权重吧。。。😂(见鬼,选的时候没注意觉得就是负样本。。。然鹅题目给的是负>正)
编辑于 2021-01-04 18:36:55 回复(2)
有些人可能感觉B选项是错误的,我稍微谈一下我的理解,将正样本进行复制,其实反应到LOSS的计算上面就是正样本loss在总的loss中的比重提高,从而使得梯度下降过程中,模型相对的更聚焦于正样本,从而达到类别不平衡处理的目的。 但是A选项我认识是正确的吧,因为对于分类来说,可以改变分类的阈值(比如ROC曲线方法移动阈值)来对不平衡数据分类问题进行处理。
编辑于 2020-08-19 01:01:17 回复(0)
负样本比正样本。。。出题人也太坑了吧
发表于 2020-06-20 09:35:35 回复(0)
降采样为什么不可以选啊?
发表于 2019-08-26 18:24:08 回复(0)