/*Adaboost的目的是从训练数据中学习一系列弱分类器,然后将其按一定权重累加起来得到强分类器。 刚开始每个样本对应的权重是相等的,在此样本分布下训练一个基本分类器c1.对于c1错分的样本增加其权重, 对正确分类的样本降低其权重。这样使得错分的样本突出出来,并得到一个新的样本分布。 同时根据分类情况赋予c1一个权重,表示其重要程度,分类正确率越高权重越大。 然后在新的样本分布下对分类器进行训练,得到c2及其权重。依此类推,得到M个基本分类器及其权重。 将这些弱分类器按照权重累加起来就是所期望的强分类器。(B对) //Bagging是对训练样本多次抽样训练多个分类器,然后对测试集进行投票所得到的优胜结果就是最终的分类结果。 在投票时每个分类器的权重是相等的。(所以C错) */
A:SVM 对噪声(如来自其他分布的噪声样本)鲁棒
错误。在 AdaBoost 中,分错的样本会被赋予更大的权重,而不是所有错误样本权重更新比例相同。权重更新是根据分类的错误程度进行的,错误率越高的样本,更新后的权重就越大。
C:Boosting 和 Bagging 都是组合多个分类器投票的方法,二者都是根据单个分类器的正确率决定其权重
错误。Bagging 采用的是均等投票的方式,所有分类器的权重相同。而 Boosting 则是根据单个分类器的表现(正确率)来调整其权重。
D:给定 n 个数据点,如果其中一半用于训练,另一半用于测试,则训练误差和测试误差之间的差别会随着 n 的增加而减少
正确。随着训练样本数量增加,模型能够更好地捕捉数据的模式,因此训练误差和测试误差之间的差异会逐渐减小。