首页 > 试题广场 >

关于K均值和DBSCAN的比较，以下说法正确的是()

[不定项选择题]

K均值使用簇的基于原型的概念，而DBSCAN使用基于密度的概念

K均值很难处理非球形的簇和不同大小的簇，DBSCAN可以处理不同大小和不同形状的簇。

K均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是DBSCAN会合并有重叠的簇

K均值丢弃被它识别为噪声的对象，而DBSCAN一般聚类所有对象

查看正确选项

年轻的华夫饼不讲武德

聚类分为：基于划分、层次、密度、图形和模型五大类；
均值聚类k-means是基于划分的聚类， DBSCAN是基于密度的聚类。区别为：
1. k-means需要指定聚类簇数k，并且且初始聚类中心对聚类影响很大。k-means把任何点都归到了某一个类，对异常点比较敏感。DBSCAN能剔除噪声，需要指定邻域距离阈值eps和样本个数阈值MinPts，可以自动确定簇个数。
2. K均值和DBSCAN都是将每个对象指派到单个簇的划分聚类算法，但是K均值一般聚类所有对象，而DBSCAN丢弃被它识别为噪声的对象。
3. K均值很难处理非球形的簇和不同大小的簇。DBSCAN可以处理不同大小或形状的簇，并且不太受噪声和离群点的影响。当簇具有很不相同的密度时，两种算法的性能都很差。
4. K均值只能用于具有明确定义的质心（比如均值或中位数）的数据。DBSCAN要求密度定义（基于传统的欧几里得密度概念）对于数据是有意义的。
5. K均值算法的时间复杂度是O(m)，而DBSCAN的时间复杂度是O(m^2)。
6. DBSCAN多次运行产生相同的结果，而K均值通常使用随机初始化质心，不会产生相同的结果。
7. K均值DBSCAN和都寻找使用所有属性的簇，即它们都不寻找可能只涉及某个属性子集的簇。
8. K均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是DBSCAN会合并有重叠的簇。
9. K均值可以用于稀疏的高维数据，如文档数据。DBSCAN通常在这类数据上的性能很差，因为对于高维数据，传统的欧几里得密度定义不能很好处理它们。原文：https://www.cnblogs.com/hugechuanqi/p/10509307.html

发表于 2020-03-03 14:47:48 回复(2)

七七1010

K均值和DBSCAN都是将每个对象指派到单个簇的划分聚类算法，但是K均值一般聚类所有对象，而DBSCAN丢弃被它识别为噪声的对象。

发表于 2023-03-13 21:27:01 回复(0)

余香深深

原型聚类也称作“基于原型的聚类”，此类算法假设聚类结构可以通过一组原型刻画，在现实任务中极为常见。（“原型”是指样本空间中具有代表性的点）

发表于 2022-09-19 00:54:25 回复(0)

牛客282092948号

选项D中错误的是不是因为这个描述：”

DBSCAN一般聚类所有对象

“

DBSCAN 不适合处理稀疏的高维数据

发表于 2021-03-10 11:16:32 回复(1)

提交观点

问题信息

C++工程师算法工程师数据挖掘爱奇艺测试工程师 2019 大数据开发工程师 Java工程师

上传者：小小

难度：

4条回答 331收藏 8212浏览

关于K均值和DBSCAN的比较，以下说法正确的是()

问题信息

热门推荐

相关试题