首页 > 试题广场 >

(机器学习理论)请描述K-means的原理,说明选择聚类中心

[问答题]
(机器学习理论)请描述K-means的原理,说明选择聚类中心的方法
1. k-means的算法原理
1)从N个数据点中选择k个点作为初始聚类中心
2)计算剩余点分别到这k个聚类中心的距离,并将其分配给距离最近的聚类中心
3)重新计算每个类的聚类中心
4)迭代2-3步,直到超过迭代次数限制或者达到聚类误差阈值。
2.聚类中心选择方法
1)从N个数据点随机选取k个点作为初始聚类中心,并计算最终聚类误差平方和SSE,将此过程进行M次,选取拥有最小SSE的初始聚类中心。
2)粗聚类方法预先选择初始聚类中心。如层次聚类、Canopy算法聚类。
发表于 2020-09-18 14:09:11 回复(0)
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
至于随机聚类中心的选取,用一个随机函数吧,最好选完聚类中心后计算一下它们的欧氏距离,如果很小的话要重新选择,以此来加快收敛速度
发表于 2020-06-05 00:40:03 回复(0)