首页 > 试题广场 >

什么是过拟合?过拟合在训练集与测试集上的表现是什么? A.简

[问答题]
什么是过拟合?过拟合在训练集与测试集上的表现是什么?
A.简要阐述过拟合产生的原因;
B.有什么减轻过拟合的方法?简要阐述这些方法减轻过拟合的原理。
过拟合是模型在训练集上的表现过于优越,但是在测试集上表现不佳。
原因:数据集的参数较多
解决方法:增加样本数量,PCA降维,训练过程提取终止,正则化(L1惩罚的目的是减少绝对值权重,L2惩罚的目的是减少平方大小权重),深度学习(神经网络),K-folds交叉验证。正则化的原理,对损失函数加上某种约束,从而减少模型的方差提高泛化能力。
编辑于 2021-10-14 14:25:34 回复(0)
过拟合:模型拟合过度,不仅将数据统计规律拟合,也将噪声拟合了;模型过于复杂。
表现:模型在训练集上的表现过于优越,但是在测试集上表现不佳。
原因:
1.模型过于复杂
2.数据太脏
3.训练集和测试集分布差别太大
4.样本数据少,或变异太小
解决:
1.限制模型复杂度:正则化
2.增加样本
3.early stopping
4.dropout
5.根据拟合优度指标进行优化
6.清洗数据

发表于 2022-04-07 17:05:14 回复(0)
本人自述:
过拟合是在模型训练过程中过分关注了数据的细节信息(如图像细节)而导致模型在训练集上取得较好的准确度,但是在测试集上表现很不好。说明这个训练过程是过拟合的。
1、原因:训练时数据的维度过多,细节关注太多。从数据本身和训练算法两方面寻找原因。
2、解决方法:最常见的就是特征提取,PCA降维。还有就是对训练算法进行调整,比如说深度学习的过程中赋予不同的权重。
发表于 2021-10-12 19:02:20 回复(0)