首页 > 试题广场 >

关于K均值和DBSCAN的比较,以下说法正确的是()

[不定项选择题]
关于K均值和DBSCAN的比较,以下说法正确的是()
  • K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
  • K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。
  • K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
  • K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
  • 聚类分为:基于划分、层次、密度、图形和模型五大类;
  • 均值聚类k-means是基于划分的聚类, DBSCAN是基于密度的聚类。区别为:

    1. k-means需要指定聚类簇数k,并且且初始聚类中心对聚类影响很大。k-means把任何点都归到了某一个类,对异常点比较敏感。DBSCAN能剔除噪声,需要指定邻域距离阈值eps和样本个数阈值MinPts,可以自动确定簇个数。

    2. K均值和DBSCAN都是将每个对象指派到单个簇的划分聚类算法,但是K均值一般聚类所有对象,而DBSCAN丢弃被它识别为噪声的对象。

    3. K均值很难处理非球形的簇和不同大小的簇。DBSCAN可以处理不同大小或形状的簇,并且不太受噪声和离群点的影响。当簇具有很不相同的密度时,两种算法的性能都很差。

    4. K均值只能用于具有明确定义的质心(比如均值或中位数)的数据。DBSCAN要求密度定义(基于传统的欧几里得密度概念)对于数据是有意义的。

    5. K均值算法的时间复杂度是O(m),而DBSCAN的时间复杂度是O(m^2)。
    6. DBSCAN多次运行产生相同的结果,而K均值通常使用随机初始化质心,不会产生相同的结果。

    7. K均值DBSCAN和都寻找使用所有属性的簇,即它们都不寻找可能只涉及某个属性子集的簇。

    8. K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。

    9. K均值可以用于稀疏的高维数据,如文档数据。DBSCAN通常在这类数据上的性能很差,因为对于高维数据,传统的欧几里得密度定义不能很好处理它们。      原文:https://www.cnblogs.com/hugechuanqi/p/10509307.html
发表于 2020-03-03 14:47:48 回复(2)
K均值和DBSCAN都是将每个对象指派到单个簇的划分聚类算法,但是K均值一般聚类所有对象,而DBSCAN丢弃被它识别为噪声的对象。
发表于 2023-03-13 21:27:01 回复(0)
原型聚类也称作“基于原型的聚类”,此类算法假设聚类结构可以通过一组原型刻画,在现实任务中极为常见。 (“原型”是指样本空间中具有代表性的点)
发表于 2022-09-19 00:54:25 回复(0)
选项D中错误的是不是因为这个描述:”
DBSCAN一般聚类所有对象
DBSCAN 不适合处理稀疏的高维数据
发表于 2021-03-10 11:16:32 回复(1)