而家
,研究者想將啲數據分做三個聚類-由藍色圓圈、黃色交叉同埋紅色十字代表。
K-平均聚類法嘅出發點係假定咗已知拃數據分幾多個聚類(聚類數量
)。喺最簡單嗰種情況下,K-平均聚類法可以噉嚟想像[1][2]:
- 設
做個案嘅數量而
做聚類數量;
- 建立
咁多個中心點(cluster center),每個中心點嘅位置叫
[註 1];
- 是但攞其中一個個案
嚟睇,
表示
同離佢最近嗰個
之間嘅距離;
- 慢慢調節啲中心點嘅位置[註 2],務求令啲
嘅總值有咁細得咁細[註 3][3]。
數學化啲噉講,K-平均聚類法係要將
個個案分拆做
個集(
),
,搵出:

K-平均聚類法亦可以用圖嚟表示。睇吓附圖幅 gif:想像家陣
,研究者想將啲數據分做三個聚類-聚類由藍色圓圈、黃色交叉同埋紅色十字代表;當中大藍色圓圈、大黃色交叉同大紅色十字表示嗰三個聚類嘅預想中心點;K-平均聚類法就可以當成一次一次(隨住 iteration
數值上升)噉郁動三個中心點,直接達到理想數值(例如
嘅總值去到最細)為止。