首页 > 试题广场 >

关于K-means聚类算法说法正确的是( )

[不定项选择题]
关于K-means聚类算法说法正确的是( )
  • 对大数据集有较高的效率并且具有可伸缩性。
  • 是一种无监督学习方法。
  • k值无法自动获取,初始聚类中心随机选择。
  • 初始聚类中心的选择对聚类结果影响不大。
K-Means的主要优点有:①原理比较简单,实现也是很容易,收敛速度快。②聚类效果较优。③算法的可解释度比较强。④主要需要调参的参数仅仅是簇数k。K-Means的主要缺点有:①K值的选取不好把握②对于不是凸的数据集比较难收敛③如果各隐含类别的数据不平衡,比如各隐含类别的数据量严重失衡,或者各隐含类别的方差不同,则聚类效果不佳。④采用迭代方法,得到的结果只是局部最优。⑤对噪音和异常点比较的敏感。
发表于 2019-08-12 11:01:11 回复(0)
聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。K均值聚类算法是先随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。k-means聚类算法是局部收敛的;k-means的聚类结果和初始聚类中心点的选取有关;k-means聚类算法的时间复杂度是O(NKT),其中N为样本个数,K为聚类团数量,T为迭代次数;k-means聚类算法无法自动确定聚类团数量。

K-Means的主要优点有:①原理比较简单,实现也是很容易,收敛速度快。②聚类效果较优。③算法的可解释度比较强。④主要需要调参的参数仅仅是簇数k。K-Means的主要缺点有:①K值的选取不好把握②对于不是凸的数据集比较难收敛③如果各隐含类别的数据不平衡,比如各隐含类别的数据量严重失衡,或者各隐含类别的方差不同,则聚类效果不佳。④采用迭代方法,得到的结果只是局部最优。⑤对噪音和异常点比较的敏感。

发表于 2019-03-17 18:29:24 回复(0)
为什么对大数据集有较高的效率?? 大的数据集计算量不是会很大??

发表于 2019-08-08 11:18:54 回复(5)
漏选了A,是不是想说相比于其他方法,k means效率高? 觉得这个A有点…
发表于 2020-12-15 18:45:19 回复(0)
K-MEANS在大数据集上有教高的效率
发表于 2020-09-08 17:41:26 回复(0)
K均值算法有一些缺点,例如受初值和离群点的影响每次的结果不稳定、结果
通常不是全局最优而是局部最优解、无法很好地解决数据簇分布差别比较大的情
况(比如一类是另一类样本数量的100倍)、不太适用于离散分类等。但是瑕不掩
瑜,K均值聚类的优点也是很明显和突出的,主要体现在:对于大数据集,K均值
聚类算法相对是可伸缩和高效的,它的计算复杂度是O(NKt)接近于线性,其中N是
数据对象的数目,K是聚类的簇数,t是迭代的轮数。
发表于 2020-07-28 14:45:24 回复(0)
初始聚类中心的选择对聚类结果影响不大,只对K值敏感,所以感觉D也是对的

发表于 2019-09-05 19:40:46 回复(1)