Chào mừng đến với BIS Đăng nhập | Đăng ký | Trợ giúp
trong Tìm kiếm

Vấn đề tiền xử lý dữ liệu trong Data Mining

Bài cuối 06-09-2022 06:03 PM của Hertropy. 49 trả lời.
Trang 1 trong số 2 (50 nội dung) 1 2 Tiếp theo >
Sắp xếp bài viết: Trước Tiếp theo
  • 12-29-2010 04:01 PM

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Vấn đề tiền xử lý dữ liệu trong Data Mining

    Vấn đề tiền xử lý dữ liệu trong Data Mining

    (Data Preprocessing in Data Mining)

    Nguyễn Văn Chức – chuc1803@gmail.com

     

    1. Giới thiệu về tiền xử lý dữ liệu (Data Preprocessing)

    Trong qui trình khai phá dữ liệu, công việc xử lý dữ liệu trước khi đưa vào các mô hình là rất cần thiết, bước này làm cho dữ liệu có được ban đầu qua thu thập dữ liệu (gọi là dữ liệu gốc original data) có thể áp dụng được (thích hợp) với các mô hình khai phá dữ liệu (data mining model) cụ thể. Các công việc cụ thể của tiền xử lý dữ liệu bao gồm những công việc như:

    Filtering Attributes: Chọn các thuộc tính phù hợp với mô hình

    Filtering samples: Lọc các mẫu (instances, patterns) dữ liệu cho mô hình

    Clean data: Làm sạch dữ liệu như xóa bỏ các dữ liệu bất thường (Outlier) Transformation: Chuyển đổi dữ liệu cho phù hợp với các mô hình như chuyển đổi dữ liệu từ numeric qua nomial hay ordinal

    Discretization (rời rạc hóa dữ liệu): Nếu bạn có dữ liệu liên tục nhưng một vài mô hình chỉ áp dụng cho các dữ liệu rời rạc (như luật kết hợp chẳn hạn) thì bạn phải thực hiện việc rời rạc hóa dữ liệu.

    Bài viết này mô tả một số công việc cơ bản của quá trình tiền xử lý dữ liệu qua ví dụ cụ thể trên phần mềm Weka nhằm giúp bạn hiểu hơn về Data Preprocessing trong Data mining.

    2. Tiền xử lý dữ liệu với Weka (Data Preprocessing with Weka)

    Dữ liệu được dùng trong minh họa này là dữ liệu về khách hàng ngân hàng ( file comma-separated format tên bank-data.csv ). Gồm 12 thuộc tính và 600 khách hàng (samples, instances, patterns). Cấu trúc file bank-data.csv như sau: (Download file dữ liệu bank-data.csv tại đây)

     

    Vấn đề đặt ra là để thực hiện mô hình khai phá luật kết hợp (Association Rule Mining) trên file bank-data.csv ta cần phải làm các việc sau :

    -        Loại bỏ thuộc tính id vì thuộc tính này không dùng trong mô hình. Quá trình này gọi là lọc thuộc tính (Filtering Attribute)

    -        Rời rạc hóa giá trị của các trường liên tục là “children”,” age” và “income” vì mô hình khai phá luật kết hợp không làm việc với các kiểu dữ liệu liên tục. Quá trình này goi là rời rạc hóa dữ liệu (Discretization)

    Nạp dữ liệu (Loading the Data)

    Thông thường, định dạng chuẩn file dữ liệu của Weka la file ARFF (Attribute Relation File Format), tuy nhiên rất nhiều DBMS và Spreadsheet cho phép tổ chức file dữ liệu dưới dạng file .csv (comma-separated values) và một điều thuận lợi là Weka cho phép đọc dữ liệu từ file .csv.

     

    Nạp file dữ liệu data-bank.csv: Chọn tab “Preprocess” > Open file

    Sau khi dữ liệu được nạp lên, panel bên trái thể hiện các thuộc tính của file dữ liệu, panel bên phải thể hiện các thống kê tương ứng với thuộc tính bên trái (xem hình sau)

    2.1. Lọc thuộc tính (Filtering Attributes)

    Trong file dữ liệu bank-data.csv, mỗi khách hàng được xác định duy nhất bởi thuộc tính id. Chúng ta cần loại bỏ thuộc tính này trước khi thực hiện các bước tiếp theo trong Association Rule Mining. Công việc này được thực hiện rất dễ dàng trong Weka như sau:

    Trong panel Filter > Choose  > filters >unsupervised > attribute > Remove

     

    Bước tiếp theo là bấm vào textbox ngay bên phải nút “Choose” và gỏ vào 1 (đây là index của thuộc tính id trong file dữ liệu). Chú ý rằng tùy chọn "invertSelection"  phải được thiết lập là false. (xem hình)

    Bấm nút “Apply” sẽ tạo ra một liệu mới (working relation) với 11 thuộc tính sau khi đã loại bỏ thuộc tính id. (xem hình sau).

    Bạn có thể thực hiện việc lọc nhiều thuộc tính khác nhau tùy theo ứng dụng của bạn theo cách trên.

    Bây giờ ta lưu lại dữ liệu sau khi loại bỏ thuộc tính id dưới dạng file arff với tên là  "bank-data-R1.arff" .Để thực hiện việc rời rạc hóa dữ liệu ở bước tiếp theo.

    Chọn nút “save” và gỏ vào tên file "bank-data-R1.arff" (xem hình sau)

    Nội dung file “bank-data-R1.arff như sau (in WordPad)

    Chú ý rằng, khi thuộc tính “id” đã bị loại thì tất cả các giá trị của trường id trong các record cũng bị loại.

    2.2. Rời rạc hóa dữ liệu (Discretization)

    Trong Data Mining, một số kỹ thuật như khai phá luật kết hợp (association rule mining) chỉ có thể thực hiện trên các dữ liệu phân loại (categorical/ nominal data). Điều này yêu cầu phải thực hiện việc rời rạc hóa trên các thuộc tính có kiểu dữ liên tục (như kiểu numeric chẳn hạn) khi muốn áp dụng các kỹ thuật này. Trong file dữ liệu “bank-data-R1.arff” có 3 thuộc tính kiểu số, đó là "age", "income", "children".

    Đối với thuộc tính "children", vì phạm vi giá của nó chỉ có thể là 0,1,2 và 3 cho nên ta có thể giữ lại các giá trị của thuộc tính này. Việc rời rạc hóa cho thuộc tính “children” có thể thực hiện đơn giản bằng cách mở file “bank-data-R1.arff” bằng bất kỳ text editor nào (WordPad chẳn hạn) và thay từ khóa “numeric” bằng các giá trị rời rạc {0,1,2,3}. Sau đó lưu kết quả lại với tên file "bank-data2.arff". (Xem hình)

     

    Bây giờ trên file “bank-data2.arff”, chúng ta sẽ thực hiện việc rời rạc hóa dữ liệu trên 2 thuộc tính là "age" và "income".

    Trong ví dụ này, các dữ liệu liên tục trên 2 trường “age” và “income” sẽ được tự động chuyển vào 3 khoảng bins (intervals) như sau

     Nạp file dữ liệu “bank-data2.arff”

    Chú ý rằng thuộc tính “age” và “income” có kiểu dữ liệu là numeric. Và nếu ta chọn thuộc tính “children” ta sẽ thấy kiểu dữ liệu là nominal (xem hình)

    Bây giờ mở lại hộp thoại Filter và chọn: filters.unsupervised.attribute.Discretize

    Tiếp theo, bấm chuột vào text box ngay bên phải nút “Choose” và thiết lập các tham số để thực hiện việc rời rạc hóa.

    Trong textbox attributeIndices nhập 1 tương ứng với index của thuộc tính “age”

    Trong mục bins nhập 3 (tuổi được chia thành 3 khoảng – interval)

     

    Click "Apply" để thực hiện. Kết quả sẽ được tạo ra trong một working relation mới, trong đó các giá trị liên tục trong thuộc tính “age” sẽ được tự động chia vào 3 khoảng có nhãn lần lượt là "(-inf-34.333333]", "(34.333333-50.666667]" “(50.666667- inf)” (xem hình).

    Tương tự, ta thực hiện việc rời rạc hóa thuộc tính “income” như sau (xem hình)và sau đó lưu lại file dữ liệu với tên “bank-data3.arff”

    Nếu bạn mở file dữ liệu “bank-data3.arff” bằng text editor như wordpad sẽ thấy như sau

    Chú ý rằng, kiểu dữ liệu cũng như giá trị của 2 thuộc tính “age” và “income” đã chuyển sang Nominal với 3 khoảng (bin, interval). Kiểm tra thuộc tính “age” ta sẽ thấy rằng có 3 độ tuổi có thể gọi là nhỏ, trung niên, già tương ứng với 3 khoảng là "(-inf-34.333333]", "(34.333333-50.666667]" “(50.666667- inf)”

    Chúng ta có thể thay đổi các nhãn mà Weka tự động tạo ra bằng các nhãn dễ hiểu hơn. Chẳn hạn ta thay nhãn "(-inf-34.333333]" bằng 0_34, nhãn "(34.333333-50.666667]" bằng 35_51 và nhãn “(50.666667- inf)” bằng 52-max ta chỉ cần mở file dữ liệu ra bằng text editor có hỗ trợ find and replace (như wordpad chạn hạn) và thực hiện việc tìm kiếm và thay thế như trên.

    Đối với thuộc tính “income” ta thay thế các nhãn như sau:

    (-inf-24386.173333] thay bằng 0_24386

    (24386.173333-43758.136667] thay bằng 24387_43758

    (43758.136667-inf)thay bằng 43759_max

    Sau khi đã thực hiện và thay thế các nhãn của 2 thuộc tính “age” và “income” ta lưu lại file dữ liệu cuối cùng có tên “bank-data-final.arff”.

     Bây giờ, với file dữ liệu đã qua quá trình lọc thuộc tính id và rời rạc hóa dữ liệu trên 3 thuộc tính là “children”, “age” và “income”, bạn có thể thực hiện các kỹ thuật mining chỉ làm việc trên dữ liệu nominal (như association rule mining). Sau đây là kết quả thực hiện thuật toán Apriori để phát hiện luật kết hợp trên file dữ liệu “bank-data-final.arff”. (Xem thêm về khai phá luật kết hợp ở bài Khai phá luật kết hợp với Weka tại http://bis.net.vn/forums/t/384.aspx.

     

    PS. All comments please send to chucnv@ud.edu.vn. Thank you and Welcome !

     

    • Điểm chủ đề: 260
  • 01-01-2011 07:42 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Cảm ơn bài viết rất hữu ích của anh. Thực sự em đang gặp khó khăn trong khâu tiền xử lý này mà không tìm được tài liệu cụ thể nào hướng dẫn cả. Bài viết theo dạng Tutorial của anh rất dễ hiểu và áp dụng được ngay.
    Chúc anh luôn khỏe và may mắn trong công việc
    Hiền Giang
    • Điểm chủ đề: 20
  • 01-18-2011 04:16 PM trả lời

    • pxh8us
    • 500 thành viên năng nổ nhất
    • Tham gia 01-18-2011
    • Điểm 35

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Không còn gì chi tiết và dễ hiểu hơn. Tuyệt vời. Cảm ơn bác chucnv đã khai sáng cho anh em :((
    • Điểm chủ đề: 35
  • 01-18-2011 05:17 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Cảm ơn bạn đã quan tâm đến bài viết và có những lời động viên. Data Mining là lĩnh vực rất rộng và thú vị, vì vậy mong rằng mỗi người có thể chia sẻ những hiểu biết của mình cho mọi người về lĩnh vực này để Topic này ngày càng hữu ích hơn.
    Chúc bạn thành công,
    Nguyễn Văn Chức
    • Điểm chủ đề: 65
  • 06-17-2011 05:52 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Em có đọc qua nhiều diễn đàn. nhưng ít có diễn đàn nói về Dât Minning . Tìm thấy bis.net.vn em thấy vui vì có box để trao đổi.
    Hiện tại em đang xây dựng 1 tool crawler web. Em đã lấy được 1000 bài viết. Và vấn đề của em bây giờ là mỗi khi em lấy được 1 bài viết về em lại phải so sánh với 1000 bài viết trong  Database. Phương pháp cảu em là so sánh dùng n-grams. Bài toán có thể được giải quyết. Nhưng em thấy rất chậm vì nó phải duyệt tình record 1 để so sánh. Liệu có giải pháp nào hay hơn không ạ. Rất mong mọi người vào thảo luận. Thanks all you!
    • Điểm chủ đề: 35
  • 08-10-2011 12:11 AM trả lời

    • student
    • 200 thành viên năng nổ nhất
    • Tham gia 08-09-2011
    • Điểm 55

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Xin Thầy cho em hỏi:

    - Tính chất của dữ liệu trước và sau khi phân lớp bởi cây quyết định ?

    - Tính đơn điệu và tính thứ tự có nhiều ý nghĩa trong quá trình phân loại bởi cây quyết định không ạ?

    -

    • Điểm chủ đề: 35
  • 08-10-2011 12:15 AM trả lời

    • student
    • 200 thành viên năng nổ nhất
    • Tham gia 08-09-2011
    • Điểm 55

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    - Việc đảm bảo các tính chất đó (nếu cần ?!) trong các mô hình cây quyết định (mờ và không mờ) như thế nào ạ?

    Em xin cảm ơn Thầy!

    • Điểm chủ đề: 20
  • 08-10-2011 10:01 AM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Chào em,

    Tính chất của dữ liệu (Training Dataset) trước và sau khi phân lớp bởi cây quyết định (hay bất kỳ Data Mining Models nào khác)  đều không có gì thay đổi. Kết quả của các Data Mining Models  là các tri thức được phát hiện từ Training dataset.

    Các algorithms để xây dựng Decision tree như ID3, J48, C4.5, CART (Classification and Regression Tree),… dựa trên lý thuyết về Entropy hay Information Gain (độ lợi thông tin). Việc chọn thuật toán nào để có hiệu quả phân lớp cao phụ thuộc vào rất nhiều yếu tố, trong đó cấu trúc dữ liệu ảnh hưởng rất lớn đến kết quả của các thuật toán. Chẳn hạn như thuật toán ID3 và CART cho hiệu quả phân lớp rất cao đối với các trường dữ liệu số (quantitative value) trong khi đó các thuật toán như J48, C4.5 có hiệu quả hơn đối với các dữ liệu Qualititive value (ordinal, Binary, nominal)


    • Điểm chủ đề: 20
  • 08-12-2011 01:22 AM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    cám ơn rất nhiều!!.bài viết rất hay và cụ thể và chi tiết nữa!.1 lần nữa xin cám ơn tác giả đã viết bài viết này!!.
    • Điểm chủ đề: 20
  • 11-23-2011 11:22 AM trả lời

    • kamoro
    • 500 thành viên năng nổ nhất
    • Tham gia 11-23-2011
    • Điểm 35

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    cho em hỏi:
    trong filer có 2 loại là supervise và unsupervise, 2 loại đó khác nhau như thế nào vậy anh ? 
    • Điểm chủ đề: 35
  • 11-23-2011 02:22 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Supervised và Unsupervised trong lĩnh vực máy học (Machine Learning) được dùng để chỉ 2 lớp kỹ thuật khác nhau đó là học có giám sát (Supervised) và học không giám sát (Unsupervised).
    trong Filter 2 mục này dùng để phân loại các kỹ thuật trên
    • Điểm chủ đề: 20
  • 12-07-2011 04:46 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Em chào Anh.
    Em đang làm đồ án về Weka mà thấy mơ hồ quá anh ạ, Anh có thể cho em số điện thoại để em liên lạc hỏi anh đôi chút về vấn đề này được không ạ? Em là Tùng (0975 643 448).
    Chân thành cảm ơn anh nhiều!
    • Điểm chủ đề: 35
  • 12-08-2011 10:45 AM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

     Chào em,
    Em tham khảo một số bài về weka trên diễn đàn này. Nếu em có vấn đề cụ thể nào cần trao đổi thì đưa lên Forum này. Nếu giúp được mình luôn sẳn sàng.
    Chúc em thành công,
    • Điểm chủ đề: 35
  • 12-08-2011 07:59 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Chào anh.
    Anh cho em hỏi Công cụ Weka là gì? cách sử dụng Weka như thế nào ạ? nic yahoo của em là nguoiphuxetaiba2006, nếu có thể mong anh add nic em và cho em hỏi anh một số vấn đề anh nhé vì là giờ em đang rất cần ạ. Chân thành cảm ơn anh.
     
    • Điểm chủ đề: 35
  • 12-08-2011 10:02 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Weka là phần mễm nguồn mở dùng để xây dựng các mô hình khai phá dữ liệu. Weka triển khai hầu hết các thuật toán của Data Mining như Classification, Clustering, Association Rule, Neural Network,....
    em có thể download phần mềm weka tại đây
    www.cs.waikato.ac.nz/ml/weka
    Xem hướng dẫn sử dụng weka tại một số bài viết về weka trong diễn đàn này
     
    • Điểm chủ đề: 50
  • 12-17-2011 03:59 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Chào anh. Anh ơi, anh cho em hỏi 2 chỗ này anh nhé, em đọc mãi mà không hiểu sao lại nhập số 1 và số 3

    (((Trong textbox attributeIndicesnhập 1 tương ứng với index của thuộc tính “age”
     
    Trong mục bins nhập 3 (tuổi được chia thành 3 khoảng – interval)))
     
     
     và cả đây nữa làm tương tự thì ta nhập số mấy nữa anh?
    Tương tự, ta thực hiện việc rời rạc hóa thuộc tính “income” như sau (xem hình)và sau đó lưu lại file dữ liệu với tên “bank-data3.arff”

     
     
     
    • Điểm chủ đề: 35
  • 12-18-2011 02:22 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Index của thuộc tính age là 1 nên trong mục attributeIndices nhập 1
    Bins: nhập 3 vì muốn chia các giá trị của thuộc tính age thành 3 khoảng (0..34; 35- 51; 52... max)
    Tương tự muốn rời rạc hóa giá trị của thuộc tính Income thành 3 nhiêu khoảng thì nhập số khoảng đó vào mục Bins. Trong ví dụ trên là chia làm 3 khoảng 0_24386;24387_43758 và 43759_max
     
    • Điểm chủ đề: 20
  • 12-18-2011 02:43 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Chào anh Chức.
    Anh nói nhiều về Dataming. Như vậy Dataming có khác phân tích thống kê không anh?
    Anh là chuyen gia về lập trình hay phân tích dữ liệu trong Dataming?
    Từ khóa đại diện:
    • Điểm chủ đề: 35
  • 12-19-2011 09:07 AM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Data Mining là lĩnh vực rất rộng giao thoa giữa các 4 ngành chính là Statistics, Database, Machine Learning và Data Visualization
    • Điểm chủ đề: 20
  • 02-11-2012 08:35 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    em chào thầy ạ. Em cũng đang học sử dụng phần mềm weka. Đọc bài của thầy rất dễ hiểu. Nhưng đường link thầy gửi để xem thêm về khai phá dữ liệu bằng weka không mở được ạ. Thâdy xem lại giúp em với ạ. Em rất muốn đọc tiếp bài của thầy, Mong thầy giúp em
    • Điểm chủ đề: 35
  • 02-11-2012 08:57 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Chào em,
    Em hỏi về Link website của Weka ah?
    Em có thể vào Link sau:
    http://www.cs.waikato.ac.nz/ml/weka/
     
     
    • Điểm chủ đề: 35
  • 02-12-2012 10:11 AM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Dạ em muốn hỏi thầy về link http://bis.net.vn/forums/t/384.aspx. Em vào link nay nhưng bị lỗi ạ. Thầy xem lại giúp em. Em muốn xem tiếp cách khai phá luật kết hợp với weka bằng thuật toán Apriori. Em đã thực hiện tiền xử lý dữ liệu như thầy đã hướng dẫn nhưng em không biết thực hiện tiếp như thế nào? Em mới học nên còn nhiều phần còn yếu ạ!
    • Điểm chủ đề: 35
  • 02-12-2012 04:07 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 28,320

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Link http://bis.net.vn/forums/t/384.aspx vào được mà em. Minh đã kiểm trả lại rồi.
    Em Copy Link này bỏ vào trình duyệt hoặc em vào Topic Data Mining and Business Intelligence, bài viết Khai phá luật kết hợp với Weka ở trang thứ 2.
     Chúc em thành công
    • Điểm chủ đề: 20
  • 02-17-2012 09:35 AM trả lời

    • banglang
    • 500 thành viên năng nổ nhất
    • Tham gia 02-17-2012
    • Điểm 35

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Em chào thầy!
     Em đang học về data mining, Em muốn hỏi thầy là sử dụng phần mềm weka (được viết bằng java) trong khai phá dữ liệu thì không cần viết code như các hệ thống khai phá dữ liệu  khác: microsoft SQL server 2000/2005/2008; oracle data mining...đúng không ạ? Em học về lập trình không tốt lắm nên em sợ phải sử dụng công cụ data mining mà pải viết code!
       Trong bài viết này của thầy thuộc bài toán mô tả(đưa ra các luật kết hợp), nhưng em muốn cũng sử dụng  bài toán này để làm bài toán dự đoán, em dùng 1 tập dữ liệu(khoảng 70%) để tìm ra luật kết hợp, từ đó sử dụng 1 tập dữ liệu (khoảng 30%) để kiểm tra xem luật rút ra đúng bao nhiêu %. Từ đó đánh giá mô hình dự đoán hoạt động tốt thế nào? Nếu làm như vậy thì có được không ạ? Mà nếu thực hiện trên bài toán này thì làm như thế nào ạ, và thực hiện test như thế nào thưa thầy?
       Em đang thấy băn khoăn rất nhiều. Mong thầy giúp em trong vấn đề này!
      Em cảm ơn thầy ạ!!!
      
    • Điểm chủ đề: 35
  • 03-11-2012 10:47 PM trả lời

    Re: Vấn đề tiền xử lý dữ liệu trong Data Mining

    Em chào anh Chức!
    Anh có tài liệu nảo về thuật toán ms Apriori không ạ?
     Thuật toán Apriori thì em đã biết rồi.
    Em đang cần tai liệu về thuật toán ms Apriori.
    Em cảm ơn anh nhiều !!! 
    jackiechan
    • Điểm chủ đề: 35
Trang 1 trong số 2 (50 nội dung) 1 2 Tiếp theo >
Powered by Community Server (Commercial Edition), by Telligent Systems