首页 > 试题广场 >

以下说法中错误的是

[单选题]

以下说法中错误的是

AdaBoost训练过程中基分类器的分类误差率是被该分类器误分类样本的权重之和

随机森林训练过程中对样本进行有放回抽样

Bagging方法主要关注降低偏差，而Boosting方法主要关注降低方差

XGBoost使用了损失函数的二阶导数信息，传统GBDT只用了一阶导数

查看答案及解析

许愿论文答辩顺利通过顺利毕业🙏

Bagging对样本重采样，对每一重采样得到的子样本集训练一个模型，最后取平均。由于子样本集的相似性以及使用的是同种模型，因此各模型有近似相等的bias和variance（事实上，各模型的分布也近似相同，但不独立）。由于，所以bagging后的bias和单个子模型的接近，一般来说不能显著降低bias。另一方面，若各子模型独立，则有，此时可以显著降低variance。若各子模型完全相同，则

，此时不会降低variance。bagging方法得到的各子模型是有一定相关性的，属于上面两个极端状况的中间态，因此可以一定程度降低variance。为了进一步降低variance，Random forest通过随机选取变量子集做拟合的方式de-correlated了各子模型（树），使得variance进一步降低。

（用公式可以一目了然：设有i.d.的n个随机变量，方差记为，两两变量之间的相关性为，则的方差为