Kỹ thuật phân cụm có rất nhiều thuật toán, được chia vào 2 lớp chính đó là phân cụm theo thứ bậc (Hierarchical) và kỹ thuật phân cụm phân hoạch (partitional).
Trong kỹ thuật phân cụm theo thứ bật có 2 phương pháp phổ biến đó là Single link và Complete Link
Single Link: Khoảng cách giữa 2 clusters được tính là khoảng cách giữa 2 đối tượng gần nhất trong 2 clusters đó (minimum distance)
Complete Link: Khoảng cách giữa 2 clusters được tính là khoảng cách giữa 2 đối tượng xa nhât trong 2 clusters đó.
(Xem thêm về phương pháp phân cụm theo thứ bậc tại đây: http://bis.net.vn/forums/t/571.aspx)
Với các phương pháp phân cụm phân hoạch thì Square Error là phương pháp phân cụm sao cho tổng bình phương các khoảng cách giữa các phần tử trong một cluster là nhỏ nhất (thường sử dụng khoảng cách Euclidean) và K-Mean là điển hình của phương pháp này.
Chúc bạn thành công