基于划分的聚类算法：K-means

Posted on 2025-05-01

算法初始化一个划分，之后通过迭代的办法优化这个划分方式；

如何定义优化？我们需要一个聚类目标函数作为指标：簇对象到簇中心平方误差
$$
E=\sum_{i=1}^{k} \sum_{x \in C_{i}}\left|x-\bar{x}_{i}\right|^{2}
$$
对于$K-means$算法，实现初始均值-簇分配-更新均值-收敛，如下：

一个直观的例子如图所示：

优点：

缺点：