Chào mừng đến với BIS Đăng nhập | Đăng ký | Trợ giúp
trong Tìm kiếm

Các độ đo tương tự trong khai phá dữ liệu

Bài cuối 10-22-2018 11:33 AM của chucnv. 0 trả lời.
Trang 1 trong số 1 (1 nội dung)
Sắp xếp bài viết: Trước Tiếp theo
  • 10-22-2018 11:33 AM

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 9,985

    Các độ đo tương tự trong khai phá dữ liệu

    Các độ đo tương tự trong khai phá dữ liệu

    Similarity measures in data mining

    chuc1803@gmail.com 


    Trong khai phá dữ liệu, ta thường dùng các độ đo tương tự để đánh giá mức độ tương tự (Similarity) của 2 đối tượng để thực hiện các thao tác tiếp theo cho phù hợp với từng đối tượng (như gom các đối tượng có sự tương tự cao vào cùng nhóm chẳng hạn).

    • Similarity(X,Y) = 1 if X = Y         (X, Y là 2 đối tượng)
    • Similarity(X,Y) = 0 if X ≠ Y

    Bài viết này giới thiệu cách tính các độ đo tương tự phổ biến như Euclidean distance, Cosine, Manhattan, Jaccard… bằng Python.

    Euclidean distance

    Manhattan distance:

    p (x1, y1), p2(x2, y2).

    Manhattan distance (p1,p2) = |x1 – x2| + |y1 – y2|

    Cosine similarity

    Jaccard similarity

    • Điểm chủ đề: 20
Trang 1 trong số 1 (1 nội dung)
Powered by Community Server (Commercial Edition), by Telligent Systems