首页 > 试题广场 >

现在假设负样本量:正样本量=20:1，下列哪些方法可以处理这

[不定项选择题]

现在假设负样本量:正样本量=20:1，下列哪些方法可以处理这种不平衡的情况？（）

直接训练模型，预测的时候调节阈值

下采样对少样本进行扩充，以增加正样本数量

```
随机降采样负样本
```

训练过程中，增加负样本的权重

查看答案及解析

岁荣

类别不平衡的时候可以通过阈值缩放

编辑于 2021-02-20 10:26:27 回复(0)

牛客463382533号

参考西瓜书，解决类别不平衡书中提出三种方法：

1.下采样

2.过采样

3.阈值偏移

所以我觉得第一个也应该选吧

发表于 2020-03-06 20:34:39 回复(1)

天麒爸爸

这答案有鬼了吧，复制正样本也只是增加重复数据，对建模并不会提供额外信息的好吗？

如果不通过下采样对少样本进行扩充，剩下的方法就只有在建模的时候调节权重权重了啊

发表于 2019-09-06 09:07:42 回复(7)

Kiral

主要三个方面，数据，模型和评估方法。

数据上过采样和欠采样，使之均衡；
模型上选对样本不均衡问题不敏感的模型，如决策树；或者调整分类阈值，使得更倾向与类别少的数据
评估方法，比如ROC或者F1得分

发表于 2020-08-10 17:52:42 回复(0)

牛客437819822号

题目中的 B 选项有错别字，应该是（对正样本）上采样；题中误写成了下采样

发表于 2022-07-03 20:59:56 回复(0)

黄某人1997

为什么下采样能对“少样本”进行扩充，不应该是上采样才对“少样本”进行扩充吗？

发表于 2021-10-01 19:03:44 回复(2)

赫米特321

B:直接的随机采样虽然可以使样本集变得均衡，但会带来一些问题，比如，过采样对少数类样本进行了多次复制，扩大了数据规模，增加了模型训练的复杂度，同时也容易造成过拟合；可以采用SMOTE方法生成样本。

C:虽然可能丢失部分有用信息....

D:在样本不均衡时，也可以通过改变模型训练时的目标函数（如代价敏感学习中不同类别有不同的权重）来矫正这种不平衡性；当样本数目极其不均衡时，也可以将问题转化为单类学习（one-class learning）、异常检测（anomaly detection）。

发表于 2020-07-28 12:48:42 回复(0)

syoya

这个为什么啊。。

发表于 2019-08-26 22:11:46 回复(2)

挥斥方遒1

主要三个方面，数据，模型和评估方法。数据上过采样和欠采样，使之均衡；模型上选对样本不均衡问题不敏感的模型，如决策树；或者调整分类阈值，使得更倾向与类别少的数据评估方法，比如ROC或者F1得分

发表于 2023-11-19 23:01:30 回复(0)

牛客502547338号

下采样还能扩充？？？下采样不是间隔去点么，上采样才是插值么，我理解错了么？？？

发表于 2022-11-22 09:37:52 回复(0)

罐装黄油猫

B选项为啥是正确的？扩充少数样本不应该是上采样吗？

发表于 2021-12-18 21:21:25 回复(0)

安可乐

解决类别不平衡问题下采样过采样阈值移动

发表于 2021-09-23 21:54:17 回复(0)

不是江小白

A选项查了一下应该是正确的可以参考这个文章：

https://www.jiqizhixin.com/articles/021704

D选项错在应该是

增加正样本的权重吧。。。😂（见鬼，选的时候没注意觉得就是负样本。。。然鹅题目给的是负>正）

编辑于 2021-01-04 18:36:55 回复(2)

滴滴答11111

有些人可能感觉B选项是错误的，我稍微谈一下我的理解，将正样本进行复制，其实反应到LOSS的计算上面就是正样本loss在总的loss中的比重提高，从而使得梯度下降过程中，模型相对的更聚焦于正样本，从而达到类别不平衡处理的目的。但是A选项我认识是正确的吧，因为对于分类来说，可以改变分类的阈值（比如ROC曲线方法移动阈值）来对不平衡数据分类问题进行处理。

编辑于 2020-08-19 01:01:17 回复(0)

牛客817792945号

负样本比正样本。。。出题人也太坑了吧

发表于 2020-06-20 09:35:35 回复(0)

仰望星空20190218194390

降采样为什么不可以选啊？

发表于 2019-08-26 18:24:08 回复(0)

提交观点

问题信息

小米集团算法工程师机器学习 2019

来自：小米2019秋招算法笔...

上传者：小小

难度：

16条回答 474收藏 7149浏览

现在假设负样本量:正样本量=20:1，下列哪些方法可以处理这

问题信息

热门推荐

相关试题