Chào mừng đến với BIS Đăng nhập | Đăng ký | Trợ giúp
trong Tìm kiếm

Thuật toán K-Means với bài toán phân cụm dữ liệu

Bài cuối 12-23-2015 10:50 AM của TraMy. 35 trả lời.
Trang 2 trong số 2 (36 nội dung) < Trước 1 2
Sắp xếp bài viết: Trước Tiếp theo
  • 04-01-2013 02:50 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 9,240

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Chào bạn,
    Trong bài viết trên có nhầm lẫn ở hình cuối cùng nên làm bạn khó hiểu, mình đã điều chỉnh lại rồi.
    Clustered Instances cho biết số mẫu (instance) trong mỗi cluster (cụm) cùng % tương ứng trong tổng thể training data.
    Giá trị của các thuộc tính trong mỗi cluster cho biết giá trị trung bình (đối với thuộc tính có kiểu định lượng,quantitative) và mode (đối với các thuộc tính có kiểu định danh, nominal) của thuộc tính đó trong các cluster.
    Cảm ơn bạn đã quan tâm và góp ý.
    Chúc bạn thành công.
    • Điểm chủ đề: 35
  • 04-02-2013 10:56 PM trả lời

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Chào anh,
    Em có một dữ liệu ảnh đầu vào là một ma trận nhị phân 2D kích thước lớn. Em muốn dùng DBSCAN để gom nhóm các số 1 lại gần nhau theo (eps,minPoints)(số 0 trong ma trận có thể bỏ đi vì chỉ giữ lại các số 1), mục đích của em là gom các số một lại với nhau và đếm có bao nhiêu nhóm. Em gặp khó khăn ở chỗ lưu dữ liệu đầu vào như thế nào (chẳng hạn file .csv ) và đặc biệt là chọn cặp thông số (esp,minPoints).
    Em xin cảm ơn trước!
    p/s: Ứng dụng của em là đếm số chuyển động qua lại nhờ capture ảnh bằng webcam or camera rồi sau đó gom nhóm các điểm đen trên ảnh captured. 
    Từ khóa đại diện: ,
    • Điểm chủ đề: 35
  • 04-04-2013 07:34 PM trả lời

    • tutruong
    • 10 thành viên năng nổ nhất
    • Tham gia 03-30-2013
    • Điểm 255

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Anh có thể giải thích một chút ý nghĩa và công dụng của các phần trong sơ đồ trên được không, ví dụ: Square Error có công dụng gì? Công thức của nó như thế nào? khi nào sử dụng nó?,....
     Cảm ơn anh nhiều!
     
    Từ khóa đại diện: ,
    • Điểm chủ đề: 35
  • 04-04-2013 09:23 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 9,240

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Kỹ thuật phân cụm có rất nhiều thuật toán, được chia vào 2 lớp chính đó là phân cụm theo thứ bậc (Hierarchical) và kỹ thuật phân cụm phân hoạch (partitional).
     Trong kỹ thuật phân cụm theo thứ bật có 2 phương pháp phổ biến đó là Single link và Complete Link
    Single Link: Khoảng cách giữa 2 clusters được tính là khoảng cách giữa 2 đối tượng gần nhất trong 2 clusters đó  (minimum distance)
    Complete Link: Khoảng cách giữa 2 clusters được tính là khoảng cách giữa 2 đối tượng xa nhât trong 2 clusters đó.
    (Xem thêm về phương pháp phân cụm theo thứ bậc tại đây: http://bis.net.vn/forums/t/571.aspx)
    Với các phương pháp phân cụm phân hoạch thì Square Error là phương pháp phân cụm sao cho tổng bình phương các khoảng cách giữa các phần tử trong một cluster là nhỏ nhất (thường sử dụng khoảng cách Euclidean) và K-Mean là điển hình của phương pháp này.
    Chúc bạn thành công
     

     
    Từ khóa đại diện: ,
    • Điểm chủ đề: 35
  • 04-06-2013 06:15 PM trả lời

    • tutruong
    • 10 thành viên năng nổ nhất
    • Tham gia 03-30-2013
    • Điểm 255

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Qua bài viết của tác giả thì em đã hiểu được cơ bản thuật toán K-Means.
     
    Tuy nhiên em có thấy một toán mở rộng của K-means nữa, tên là X-Means "D. Pelleg and A. W. Moore. X-means: Extending k-means with efficient estimation of the number of clusters" .
    Anh có thể giải thích thêm về thuật toán này để mọi người hiểu thêm được không ? Cảm ơn anh nhiều!
    • Điểm chủ đề: 20
  • 08-27-2013 04:04 PM trả lời

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Chào thầy,
     
    Thầy cho em hỏi. Mình dùng khoảng cách Euclidian để tính khoảng cách. Trường hợp dữ liệu bằng chuỗi thì làm cách nào tính được? Em không dùng Weka mà em tự viết code.
     
    Cám ơn thầy! 
    • Điểm chủ đề: 20
  • 10-21-2013 10:50 PM trả lời

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Em chào anh, anh có thể giải thích giùm em kết quả của bảng trên được không ạ, giả sử với thuộc tính là age thỳ tại sao kết quả của các cụm từ 0 -> 4 lại như kia ạ, anh có thể giải thích rõ giùm em kết quả này được không ạ. Em xin chân thành cảm ơn ạ.
    • Điểm chủ đề: 20
  • 11-09-2015 12:33 PM trả lời

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Cai dat vi du bang ngon ngu R, giup minh voi, Cam on nhieu
    • Điểm chủ đề: 20
  • 12-09-2015 12:46 AM trả lời

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Em chào thầy cho em hỏi :
    1. Thuật toán SimpleKMeans của Weka có xử lý được file dữ liệu có thuộc tính phi số không thầy? nếu có xử lí được thì nó xử lí như thế nào ạ ?

    2. Một trong cái khó thuật toán KMeans là tìm ra số lượng cluster tối ưu để giảm sai số. Khi chạy thuật toán với những tham số seed và numClusters khác nhau thì so sánh tỷ lệ lỗi như thế nào để tối ưu ạ ?

    Em cảm ơn thầy rất nhiều ạ ! 
     
    • Điểm chủ đề: 20
  • 12-21-2015 04:36 PM trả lời

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    a ơi cho em hỏi a có tài liệu về phân cụm (cứng, mờ, phân lớp) bằng tiếng việt k cho e xin với ạ. Em cảm ơn! tramyhtttk10a@gmail.com
    • Điểm chủ đề: 20
  • 12-23-2015 10:50 AM trả lời

    • TraMy
    • Không xếp hạng
    • Tham gia 12-23-2015
    • Điểm 20

    Re: Thuật toán K-Means với bài toán phân cụm dữ liệu

    Thầy có tài liệu hướng dẫn thế này về C-mean và phân cụm phân cấp không cho em xin với ạ. Em cảm ơn! Nếu có thì thầy gửi vào mail tramyhtttk10a@gmail.com cho em ạ!
    • Điểm chủ đề: 20
Trang 2 trong số 2 (36 nội dung) < Trước 1 2
Powered by Community Server (Commercial Edition), by Telligent Systems