首页 > 试题广场 >

请写出至少4种聚类算法的名称、基本思想和各自优缺点。

[问答题]
请写出至少4种聚类算法的名称、基本思想和各自优缺点。
k-means聚类算法  k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。k-means算法的处理过程如下:首先,随机地 选择k个对象,每个对象初始地代表了一个簇的平均值或中心;对剩余的每个对象,根据其与各簇中心的距离,将它赋给最近的簇;然后重新计算每个簇的平均值。 这个过程不断重复,直到准则函数收敛。通常,采用平方误差准则,其定义如下:  E=∑i=1~k∑p∈Ci |p-mi|²  这里E是数据库中所有对象的平方误差的总和,p是空间中的点,mi是簇Ci的平均值。该目标函数使生成的簇尽可能紧凑独立,使用的距离度量是欧几里得距离,当然也可以用其他距离度量。
发表于 2018-12-10 23:53:35 回复(0)