（机器学习理论）请描述K-means的原理，说明选择聚类中心

[问答题]

（机器学习理论）请描述K-means的原理，说明选择聚类中心的方法

12313242

1. k-means的算法原理

1)从N个数据点中选择k个点作为初始聚类中心

2)计算剩余点分别到这k个聚类中心的距离，并将其分配给距离最近的聚类中心

3)重新计算每个类的聚类中心

4)迭代2-3步，直到超过迭代次数限制或者达到聚类误差阈值。

2.聚类中心选择方法

1)从N个数据点随机选取k个点作为初始聚类中心，并计算最终聚类误差平方和SSE，将此过程进行M次，选取拥有最小SSE的初始聚类中心。

2)粗聚类方法预先选择初始聚类中心。如层次聚类、Canopy算法聚类。

发表于 2020-09-18 14:09:11 回复(0)

Maple_2005

k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有（或最小数目）对象被重新分配给不同的聚类，没有（或最小数目）聚类中心再发生变化，误差平方和局部最小。

至于随机聚类中心的选取，用一个随机函数吧，最好选完聚类中心后计算一下它们的欧氏距离，如果很小的话要重新选择，以此来加快收敛速度

发表于 2020-06-05 00:40:03 回复(0)