首页 > 试题广场 > 以下描述正确的是:
[不定项选择题]
以下描述正确的是:
  • KNN算法中K值对分类效果影响较为显著,一般K值较大时,对噪声比较敏感。
  • 朴素贝叶斯算法对缺失数据特别敏感,事先需要知道先验概率。
  • SVM算法可以解决高维问题。提高泛化性能。
  • 集成学习算法存在过拟合、鲁棒性不强等问题。
KNN
K值得选取非常重要,因为:

如果当K的取值过小时,一旦有噪声得成分存在们将会对预测产生比较大影响,例如取K值为1时,一旦最近的一个点是噪声,那么就会出现偏差,K值的减小就意味着整体模型变得复杂,容易发生过拟合;

如果K的值取的过大时,就相当于用较大邻域中的训练实例进行预测,学习的近似误差会增大。这时与输入目标点较远实例也会对预测起作用,使预测发生错误。K值的增大就意味着整体的模型变得简单;

朴素贝叶斯算法

对缺失数据不太敏感,算法也比较简单,常用于文本分类。需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。

编辑于 2019-08-12 21:24:26 回复(0)
D不对吧 集成学习不就是用来解决类似决策树的过拟合问题的吗?想Bagging和Random Forest
发表于 2019-08-27 16:47:33 回复(0)
SVM:可以解决高维问题,虽然速度不快。
发表于 2019-08-25 16:27:31 回复(0)
bagging也会过拟合?
发表于 2019-08-18 23:49:57 回复(0)