在large-scale且sparse的数据分析中，knn的

[单选题]

在large-scale且sparse的数据分析中，knn的k个最近邻应该如何选择（）

小马同学

D，因为KNN 一是需要存储所有的样本，二是需要进行繁重的距离计算量。所以不适合大规模的稀疏的数据

发表于 2015-08-11 15:55:15 回复(0)

VInVendetta

补充一个选D的理由，KNN不适合高维数据

发表于 2019-05-07 15:20:23 回复(0)

snwang

D，KNN在large-scale且sparse的数据情况下不适用。这种情况下，用knn的分类误差太大。

发表于 2018-09-09 09:39:43 回复(0)

阿尔法+

C，个人理解：因为KNN寻找k个距离最近的样本可以通过kd树村粗，只要样本数大于特征数搜索时间复杂度为logN，因为样本稀疏，所以L2距离更适合，因为L1是各坐标轴上的距离的和如果样本稀疏的话这种坐标轴上的距离之和没有L2有区分度。

发表于 2018-08-14 10:36:31 回复(0)

提交观点

问题信息

搜狐数理统计

上传者：牛客897796号

难度：

4条回答 38收藏 11327浏览

扫一扫，把题目装进口袋