118

问答题 118 /392

怎么防止过拟合

参考答案

参考回答:

1).在训练和建立模型的时候,从相对简单的模型开始,不要一开始就把特征做的非常多,模型参数跳的非常复杂。

2).增加样本,要覆盖全部的数据类型。数据经过清洗之后再进行模型训练,防止噪声数据干扰模型。

3).正则化。在模型算法中添加惩罚函数来防止过拟合。常见的有L1,L2正则化。

4).集成学习方法bagging(如随机森林)能有效防止过拟合

5).减少特征个数(不是太推荐)注意:降维不能解决过拟合。降维只是减小了特征的维度,并没有减小特征所有的信息。