首页 > 试题广场 >

当发现机器学习模型过拟合时，以下操作正确的是：（）

[不定项选择题]

查看答案及解析

呆哥不是个好少年

A也可以

因为维度不断增加就会增加整个数据空间的稀疏性，这样就更容易找到分类的超平面，所以降低维度可以帮助降低过拟合

发表于 2019-09-06 17:45:55 回复(0)

小火箭、

造成过拟合两个因素：1、数据量少 2、模型复杂度过高

发表于 2019-08-27 16:17:12 回复(0)

x~angelkawaii~x

过拟合引发原因：训练数据太少/模型太复杂/参数过多/噪声过多解决方法： 1、获得更多的训练数据集 2、降低特征维度 3、正则化，在训练的时候限制权值变大 4、dropout 5、早停 hold out 6、数据清洗

发表于 2021-10-25 17:18:04 回复(0)

clyycl

降低过拟合风险的方法有：

1.增加训练数据。增加训练数据可以使得模型学习到更多的潜在特征，从而减少噪声的影响。

2.降低模型复杂度。当训练数据较少，过于复杂的模型是产生过拟合的主要因素。适当降低模型复杂度可以避免拟合过多的采样噪声。

3.添加正则项。给模型的参数加上的一定的正则约束。

4.集成学习。集成学习是将多个模型集成在一起，从而避免单一模型带来的过拟合风险。比如bagging算法。

降低欠拟合风险的方法有：

1.添加新的特征。当特征不足或者现有特征和样本标签相关性不强时，模型容易出现欠拟合。通过挖掘“上下文特征、ID类特征、组合特征等新的特征，往往能够取得更好的效果。

2.增加模型复杂度。简单的模型的学习能力较差，通过增加模型复杂度可以使模型拥有更强的拟合能力。例如，在线性模型中增加高次项，在神经网络中添加网络层数或者增加神经元的个数。

3.减小正则化系数。正则项是用来防止过拟合的。但是当模型出现欠拟合时，则需要针对性地减小正则化系数。

本题中的A选项：减少特征数量。由于增加特征数量可以防止欠拟合。反过来，减少特征数量就可以降低过拟合风险。B选项增加样本数量，C选项添加正则项均是降低过拟合风险的方法。D选项增加特征维度，其实是增加特征数量，是用来防止欠拟合的方法。

发表于 2023-08-28 09:43:53 回复(0)

Limothee

我个人觉得第二个选项不应该作为答案，假设我把原训练样本复制一份重新添加到训练集，模型仍旧会表现出过拟合。

发表于 2023-04-01 21:10:08 回复(0)

游泳健将SSS

数据量少的时候减少特征可以

模型复杂度过高的时候减少特征可以

原来真的是减少特征可以治过拟合！

发表于 2020-10-23 20:10:29 回复(0)

提交观点

问题信息

小米集团算法工程师机器学习 2019

来自：小米2019秋招算法笔...

上传者：小小

难度：

6条回答 300收藏 5081浏览