首页 > 试题广场 >

请描述K-means的原理,说明选择聚类中心的方法。

[问答题]
请描述K-means的原理,说明选择聚类中心的方法。
KMeans算法的计算流程伪代码如下:
输入:样本集D={x1, x2, x3,…,xm},聚类簇数k
输出:簇划分C={C1,C2,…,Ck}
从D中随机选取k个样本作为初始向量;
repeat:
    初始化所有Ci为空集;
        对于样本集里每个样本x:
    计算x与k个初始向量的距离,选择距离最小的初始向量的簇标记j作为x的簇标记,将x加入Cj中;
        对于每个簇:
计算新的均值向量,如果新的均值向量与上一步的不同,则更新;否则保持当前均值向量 不变;
until 当前均值向量均未更新;
发表于 2020-10-31 12:01:08 回复(0)
K-means基本原理口述:
    K-means通过迭代,将数据集分成K个簇,使得每个簇中的样本点到簇中心的距离平方和最小
聚类中心选取方法:
    通过K-means++来选择初始质心
发表于 2019-07-15 16:15:02 回复(0)