首页 > 试题广场 >

在large-scale且sparse的数据分析中,knn的

[单选题]
在large-scale且sparse的数据分析中,knn的k个最近邻应该如何选择( )
  • 随机选择
  • L1-norm最近的
  • L2-norm最近的
  • 不用knn
D,因为KNN 一是需要存储所有的样本,二是需要进行繁重的距离计算量。所以不适合大规模的稀疏的数据
发表于 2015-08-11 15:55:15 回复(0)
补充一个选D的理由,KNN不适合高维数据
发表于 2019-05-07 15:20:23 回复(0)
D,KNN在large-scale且sparse的数据情况下不适用。这种情况下,用knn的分类误差太大。
发表于 2018-09-09 09:39:43 回复(0)
C,个人理解:因为KNN寻找k个距离最近的样本可以通过kd树村粗,只要样本数大于特征数搜索时间复杂度为logN,因为样本稀疏,所以L2距离更适合,因为L1是各坐标轴上的距离的和如果样本稀疏的话这种坐标轴上的距离之和没有L2有区分度。

发表于 2018-08-14 10:36:31 回复(0)