Chào mừng đến với BIS Đăng nhập | Đăng ký | Trợ giúp
trong Tìm kiếm

Cây quyết định (Decision Tree)

Bài cuối 08-08-2014 09:01 PM của chucnv. 29 trả lời.
Trang 1 trong số 2 (30 nội dung) 1 2 Tiếp theo >
Sắp xếp bài viết: Trước Tiếp theo
  • 12-10-2010 04:08 PM

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Cây quyết định (Decision Tree)

    Cây quyết định với bài toán phân lớp (Decision Tree with Classification Problem)

    Nguyễn Văn Chức – chuc1803@gmail.com

    1. Giới thiệu về cây quyết định

    Cây quyết định (Decision Tree) là một cây phân cấp có cấu trúc được dùng để phân lớp các đối tượng dựa vào dãy các luật (series of rules). Các thuộc tính của đối tượng (ngoại trừ thuộc tính phân lớp – Category attribute) có thể thuộc các kiểu dữ liệu khác nhau (Binary, Nominal, ordinal, quantitative values) trong khi đó thuộc tính phân lớp phải có kiểu dữ liệu là Binary hoặc Ordinal.

    Tóm lại, cho dữ liệu về các đối tượng gồm các thuộc tính cùng với lớp (classes) của nó, cây quyết định sẽ sinh ra các luật để dự đoán lớp của các đối tượng chưa biết (unseen data)

    Bài viết này chỉ  trình bày ứng dụng cây quyết định vào giải quyết bài toán phân lớp. Nếu bạn quan tâm đến lý thuyết về xây dựng cây quyết định như thế nào (các thuật toán xây dựng cây quyết định), các bạn có thể tìm đọc thêm các tài liệu khác hoặc đón đọc bài viết tiếp theo (Building a decision tree using ID3 Algorithm) trên http://bis.net.vn/forums/, topic Data Mining and Business Intelligence

    Để  giúp các bạn ứng dụng được cây quyết định trong bài toán phân lớp chúng ta cùng bắt đầu với ví dụ dưới đây:

    Ta có dữ liệu (training data) về 10 đối tượng (người). Mỗi đối tượng được mô tả bởi 4 thuộc tính là Gender, Car Ownership, Travel Cost/Km, Income Level và 1 thuộc tính phân loại (category attribute) là Transportation mode. Trong đó thuộc tính Gender có kiểu binary, thuộc tính Car Ownership có kiểu Quantitative integer (0,1), Travel Cost/Km và Income Level có kiểu dữ liệu Ordinal.

    Tranining data cho biết sự lựa chọn về loại phương tiện vận chuyển (car, bus, train) của khách dựa vào 4 thuộc tính đã cho (xem bảng).

    Attributes

    Classes

    Gender

    Car ownership

    Travel Cost ($)/km

    Income Level

    Transportation mode

    Male

    0

    Cheap

    Low

    Bus

    Male

    1

    Cheap

    Medium

    Bus

    Female

    1

    Cheap

    Medium

    Train

    Female

    0

    Cheap

    Low

    Bus

    Male

    1

    Cheap

    Medium

    Bus

    Male

    0

    Standard

    Medium

    Train

    Female

    1

    Standard

    Medium

    Train

    Female

    1

    Expensive

    High

    Car

    Male

    2

    Expensive

    Medium

    Car

    Female

    2

    Expensive

    High

    Car

    Dựa vào Training Data ở trên, chúng ta có thể tạo ra cây quyết định như sau

     

    Chú ý rằng trong cây quyết định trên, thuộc tính “Income Level” không xuất hiện trong cây bởi vì dựa vào training data đã cho, thuộc tính “Travel Cost/Km”  sẽ sinh ra cây quyết định tốt dùng để phân loại tốt hơn “Income Level”

    Làm sao để sử dụng cây quyết định trong dự đoán lớp của các dữ liệu chưa biết

    Mục đích chính của cây quyết định là dùng để dự đoán lớp (xác định lớp) của các đối tượng chưa biết (unseen data). Giả sử rằng ta có dữ liệu về 3 người với các giá trị dữ liệu đã biết về các thuộc tính Gender, Car Ownership, Travel Cost/Km, Income Level. Tuy nhiên ta chưa biết họ sẽ chọn phương tiện vận chuyển nào (Car, Bus, Train). Nhiệm vụ của chúng ta là sử dụng cây quyết định đã tạo ra để dự đoán (predict) Alex, Buddy và Cherry sẽ chọn phương tiện vận chuyển nào dựa vào 4 thuộc tính của họ. Dữ liệu dưới đây còn được gọi là Testing Data.

    Person name

    Gender

    Car ownership

    Travel Cost ($)/km

    Income Level

    Transportation Mode


    Alex

    Male

    1

    Standard

    High

    ?


    Buddy

    Male

    0

    Cheap

    Medium

    ?


    Cherry

    Female

    1

    Cheap

    High

    ?


     

    Chúng ta bắt đầu từ node gốc của cây (root node) từ thuộc tính Travel Cost/Km, ta thấy rằng nếu Travel Cost/Km là Expensive thì người đó sẽ chọn phương tiện là Car. Nếu Travel Cost/Km là standard thì họ sẽ chọn phương tiện vận chuyển là Train. Nếu Travel Cost/Km là Cheap thì cây quyết định cần tới giá trị của trường Gender của người đó, nếu GenderMale thì chọn Bus, nếu giới tính là Female thì cây quyết định cần kiểm tra xem người đó có sử hữu bao nhiêu xe hơi (Car Ownership). Nếu số xe hơi sở hữu là 0 thì người đó sẽ chọn xe Bus, nếu số xe hơi sở hữu là 1 thì người đó sẽ chọn Train.

    Theo cây quyết định trên, các luật (Series of Rules) được sinh ra từ cây quyết định dùng để dự đoán như sau:

    Rule 1 : If Travel cost/km is expensive then mode = car

    Rule 2 : If Travel cost/km is standard then mode = train

    Rule 3 : If Travel cost/km is cheap and gender is male then mode = bus

    Rule 4 : If Travel cost/km is cheap and gender is female and she owns no car then mode = bus

    Rule 5 : If Travel cost/km is cheap and gender is female and she owns 1 car then mode = train

    Dựa vào các luật này, việc dự đoán lớp cho các dữ liệu chưa biết (unseen data hay Testing data) rất đơn giản. Trong ví dụ này, Alex có giá trị của thuộc tính Travel Cost/KmStandard nên sẽ chọn phương tiện là Train (Rule 2) mà không cần quan tâm đến các thuộc tính khác của Alex. Buddy có giá trị của thuộc tính Travel Cost/KmCheap Gender của anh ta là Male nên anh ta sẽ chọn Bus (Rule 3). Cheery cũng có giá trị thuộc tính Travel Cost/KmCheap nhưng GenderFemale và sở hữu 1 xe hơi cho nên theo cây quyết định trên (Rule 5) cô ta sẽ chọn phương tiện là Train.

    Kết quả phân lớp bằng cây quyết định như sau:

    Person name

    Travel Cost ($)/km

    Gender

    Car ownership

    Transportation Mode

    Alex

    Standard

    Male

    1

    Train

    Buddy

    Cheap

    Male

    0

    Bus

    Cherry

    Cheap

    Female

    1

    Train

     

    Cây quyết định là một phương pháp phân lớp rất hiệu quả và dễ hiểu. Tuy nhiên có một số chú ý khi sử dụng cây quyết định trong xây dựng các mô hình phân lớp như sau:

    Hiệu của phân lớp của cây quyết định (Series of Rules) phụ thuộc rất lớn vào training data. Chẳn hạn cây quyết định được tạo ra bởi chỉ giới hạn 10 samples training data trong ví dụ trên thì hiệu quả ứng dụng cây quyết định để dự đoán các trường hợp khác là không cao (thường training data phải đủ lớn và tin cậy) và vì vậy ta không thể nói rằng tập các luật (Series of Rules) được sinh ra bở cây quyết định trên là tập luật tốt nhất.

    Có rất nhiều thuật toán phân lớp như ID3, J48, C4.5, CART (Classification and Regression Tree),… Việc chọn thuật toán nào để có hiệu quả phân lớp cao tuy thuộc vào rất nhiều yếu tố, trong đó cấu trúc dữ liệu ảnh hưởng rất lớn đến kết quả của các thuật toán. Chẳn hạn như thuật toán ID3 và CART cho hiệu quả phân lớp rất cao đối với các trường dữ liệu số (quantitative value) trong khi đó các thuật toán như J48, C4.5 có hiệu quả hơn đối với các dữ liệu Qualititive value (ordinal, Binary, nominal).

    2. Xây dựng mô hình phân lớp bằng cây quyết định trong Weka

     Trong ví dụ sau đây, tôi sẽ xây dựng mô hình phân lớp (Classification Model) bằng cây quyết định trong weka. Dữ liệu được dùng trong ví dụ này là file weather.arff có 4 thuộc tính Outlook, Temperature, Humidity, Windy và thuộc tính phân loại là Play có 2 giá trị là Yes và No. Đây là dữ liệu mô tả về khả năng có đến sân để chơi thể thao (tennis chẳn hạn) hay không của những người chơi thể thao phụ thuộc vào thời tiết.

    Training data như sau

    Giả sử hôm nay các thông tin về thời tiết mà người quản lý sân tennis có được là

    Vấn đề đặt ra là với thời tiết như vậy, người chơi tennis có đến sân để chơi hay không? (Play = Yes hay No). Việc dự đoán này sẽ giúp cho người quản lý sân giảm được rất nhiều chi phí quản lý sân như  điều chỉnh (tăng hoặc giảm) số nhân viên phục vụ cũng như các dịch vụ khác nhằm phục vụ tốt hơn nhu cầu của người chơi tennis.

     Load file weather.arff trong Weka (Tải file weather.arff tại đây)

    Chọn tab Classify , chọn tree và chọn thuật toán J48 (có thể chọn các thuật toán khác để so sánh hiệu quả phân lớp của các thuật toán khác nhau như ID3, SimpleCart,….)

     

    Decision tree được sinh ra theo training data trên

     

    Các luật (Series of Rules) được sinh ra bởi cây quyết định

    Rule 1:  If outlook = “sunny” and humidity <= 75 then Play = “yes”

    Rule 2:  If outlook = “sunny” and humidity > 75 then Play = “no”

    Rule 3: If outlook = “overcast” then Play= “yes”

    Rule 4: If outlook = “rainy” and windy = TRUE then Play =”no”

    Rule 5: If outlook = “rainy” and windy = FALSE then Play =”yes”

    Như vậy, với cây quyết định được sinh ra bởi training data trên, theo Rule 3 ta xác định giá trị cho trường phân lớp (play) của unseen data trên là “yes” (nghĩa là với thời tiết hôm nay là : outlook (overcast), temperature (85), humidity (80), windy (true) thì mọi người sẽ đến sân chơi tennis). Sử dụng cây quyết định trên sẽ giúp cho người quản lý dự đoán khả năng đến sân chơi tennis khách hàng tùy theo thời tiết.

    PS. Next topic : Building a decision tree using ID3 Algorithm. All comments please send to chucnv@ud.edu.vn. Thank you and welcome!


    • Điểm chủ đề: 140
  • 12-12-2010 10:19 PM trả lời

    • vovanha
    • 500 thành viên năng nổ nhất
    • Tham gia 12-11-2010
    • Điểm 20

    Re: Cây quyết định (Decision Tree)

    Cảm ơn bài viết của anh Chức,
    Em dang muốn tìm hiểu về các thuật toán xây dựng cây quyết định như ID3, J48 mà đọc tài liệu khó hiểu quá. Em rất thích đọc các bài viết của anh về Data mining vì nó dễ hiểu và có ứng dụng minh họa nữa nên rất thiết thực. Hy vọng sẽ được đọc bài viết tiếp theo của anh trong thời gian sớm nhất.
    Chúc anh sức khỏe và thành công
    Võ Văn Hà.
    • Điểm chủ đề: 20
  • 03-19-2011 10:41 AM trả lời

    • lubinnin
    • 500 thành viên năng nổ nhất
    • Tham gia 03-19-2011
    • Điểm 20

    Re: Cây quyết định (Decision Tree)

    Thầy ơi !
    Thầy cho em xin tài liệu về vấn đề khai phá dữ liệu bằng thuật toán id3 và bảo mật cơ sở dữ liệu.
    Cảm ơn Thầy.
    Từ khóa đại diện:
    • Điểm chủ đề: 20
  • 06-07-2011 10:08 AM trả lời

    • huechu
    • 50 thành viên năng nổ nhất
    • Tham gia 06-07-2011
    • Điểm 90

    Re: Cây quyết định (Decision Tree)

    Cảm ơn thầy về bài viết,
    Em đang tìm hiểu nghiên cứu thuật toán ID3 và cách vận dụng của nó trong SQL 2008  nhưng em có một số vướng mắc, mong thầy giải đáp dùm e.
    - Tại sao trong thuật toán ID3 nó lại dùng ENTROPY để xác định node gốc?(có phải mặc định nó là như vậy?)
    - Có phải trong SQL 2008 nó dùng ID3 để xây dựng cây quyết định?
    - Với  ID3 thì trong quá trình hình thành cây, nó tạo ra các tập luật và các tập luật này chưa hẳn đã tối ưu, vậy làm sao mình có thễ tối ưu nó?
    Em xin cảm ơn thầy. 
     
    @import url(/cutesoft_client/cuteeditor/communityservercommon.css);
    • Điểm chủ đề: 35
  • 06-07-2011 11:29 AM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Re: Cây quyết định (Decision Tree)

    Trong các thuật toán xây dựng cây quyết định (ID3, J48, C4.5,...) thường dùng Entropy (Information Gain - độ lợi thông tin) để xác định Root Node của cây. Ngoài ra, có thể sử dụng một số cách khác như Bayesian with K2 Prior, hay Bayesian Dirichlet Equivalent (BDE) Prior để chọn Root Node cho cây.
    Thuật toán xây dựng Decision Tree của Microsoft là thuật toán lai ghép giữ nhiều thuật toán và có thể chọn phương thức xác định Root Node của Decision Tree bằng cách thay đổi tham số SCORE_METHOD của thuật toán
    Nếu sử dụng ID3 để tạo cây thì muốn có cây quyết định tối ưu ( cây quyết định thực chất là tập các luật suy diễn) thì phải qua quá trình tinh chỉnh, cắt tỉa cây (Pruning tree)
    Xem thêm các vấn đề trên tại Link sau:
    http://msdn.microsoft.com/en-us/library/cc645868.aspx
     
     
    • Điểm chủ đề: 20
  • 01-08-2012 12:41 AM trả lời

    • thin88
    • 75 thành viên năng nổ nhất
    • Tham gia 01-07-2012
    • Điểm 75

    Re: Cây quyết định (Decision Tree)

    anh ơi biết được nhân tố quyết định trong cây ID3 rùi thì vẽ thế nào hả anh
    • Điểm chủ đề: 35
  • 01-08-2012 11:03 AM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Re: Cây quyết định (Decision Tree)

    Thuật toán ID3 sử dụng Entropy để tìm node gốc (root). Tiếp tục như vậy cho đến khi xây dựng xong cây
    • Điểm chủ đề: 35
  • 01-08-2012 04:11 PM trả lời

    • thin88
    • 75 thành viên năng nổ nhất
    • Tham gia 01-07-2012
    • Điểm 75

    Re: Cây quyết định (Decision Tree)

    anh có thể cho em gmail rùi em gửi bài cho anh được không, anh làm giúp em nhé em đang cần gấp mong nhận được hồi âm của anh sớm
     
    • Điểm chủ đề: 20
  • 02-14-2012 08:46 PM trả lời

    Re: Cây quyết định (Decision Tree)

    Chào thầy, phần weka của thầy hay lắm.
    Nhưng em chưa hiểu về các bước để có được cây quyết định như hình trên.
    Qua tham khảo tài liệu thì em thấy có 2 bước là
    - Xây dựng cây Top-down: bắt đầu từ nút gốc, tất cả các dữ liệu học ở nút gốc, việc chọn một nút gốc xuất phát phân hoạch dữ liệu một cách đệ quy là phải có đánh giá. Đánh giá dựa vào độ lợi thông tin sử dụng entropy của Shannon (C4.5 - Quinlan), hoặc chỉ số gini (CART-Breiman)
    - Cắt nhánh Bottom - up: tránh học vẹt (overfitting)
     
    ?? Thầy có thể chỉ em cách để xây dựng cây quyết định trên bằng cách tính toán độ lợi thông tin rồi chọn độ lợi lớn nhất ở mỗi nút. Cám ơn thầy nhiều.!!!
    • Điểm chủ đề: 50
  • 02-16-2012 10:30 AM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Re: Cây quyết định (Decision Tree)

    Chào em,
    Quá trình xây dựng cây quyết định có 2 giai đoạn đó là xây dựng cây và cắt tỉa (pruning) cây để được cây quyết định tối ưu.
    Thang đo để lựa chọn Root node thường dựa vào độ lợi thông tin (Information Gain - IG chọn node có IG lớn nhất) hay dùng Entropy.  Giữa Entropy và  IG có mối quan hệ với nhau như sau:
     
    Bài viết ở Link sau minh họa việc sử dụng IG để chọn root node thông qua thuật toán ID3
    http://www.cise.ufl.edu/~ddd/cap6635/Fall-97/Short-papers/2.htm
     
    Chúc em thành công
    • Điểm chủ đề: 50
  • 02-16-2012 10:49 AM trả lời

    • thin88
    • 75 thành viên năng nổ nhất
    • Tham gia 01-07-2012
    • Điểm 75

    Re: Cây quyết định (Decision Tree)

    em cảm ơn anh rất nhiều vì bài viết anh gửi cho em nhưng em đã thi xong môn đó rùi anh ah.
    • Điểm chủ đề: 20
  • 02-18-2012 12:48 PM trả lời

    Re: Cây quyết định (Decision Tree)

    Cảm ơn thầy nhiều!
    Em còn chưa hiểu về các phương pháp tập hợp mô hình (Ensemble-based), ví dụ như BAGGING (Breiman), BOOSTING (Freund&Schapire), RANDOM FOREST (Breiman) đều dựa trên thành phần lỗi bias và variance.
    Ví dụ như: (Số để xếp hạng)
    BAGGING (tăng ít bias (3), Giảm variance (2))
    BOOSTING (Giảm bias (1) & variance (3)) (Tốc độ chậm nhất)
    Random Forest (Giảm bias (2) & variance (1)) (Tốc độ nhanh nhất)
    ???Mong các thành viên đóng góp và giải thích sự so sánh trên!!!
     Ah còn cái nữa là vì sao mà BAGGING dựa trên mô hình cơ sở k-NN thì không hiệu quả???
    • Điểm chủ đề: 20
  • 09-12-2012 06:11 PM trả lời

    • cmxx
    • 500 thành viên năng nổ nhất
    • Tham gia 09-12-2012
    • Điểm 35

    Re: Cây quyết định (Decision Tree)

    Em chào thầy,em có 1 bài tập làm trên dữ liệu poker hands,em có dược 2 tập tin du lieu và train và test,khi du liệu train có 25000 Instances,còn dữ liệu test có 1.000.000,em đã tiền xử lý dữ liệu với bài hướng dẫn của thầy.khi ấy việc chọn mô hình phân loại là id3 hay j48 là dựa vào yếu tố nào dể chọn ko ạ,và còn vấn đề tính cân bằng của dữ liệu huấn luyện có ảnh hưởng đến việc xây dựng bộ phân loại không ạ,em xin cảm ơn
    • Điểm chủ đề: 35
  • 09-12-2012 09:42 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Re: Cây quyết định (Decision Tree)

    Chào em,
     Về nguyên tắc thì dùng càng nhiều dữ liệu để huấn luyện mô hình thì kết quả của mô hình càng tốt, tuy nhiên trong thực tế thì phải cân đối giữa chi phí huấn luyện và kết quả mang lại của mô hình (để cân đối vấn đề này người ta dùng profit chart).
    Thông thường trong việc xây dựng các mô hình khai phá dữ liệu thì tỷ lệ Training Data / Testing Data là 70/30.  Em có 25000 instances để train nhưng có đến 1.000.000 để Test là không hợp lý, nên đổi ngược lại.
    Việc chọn thuật toán nào (ID3 hay J48) để xây dựng mô hình phụ thuộc chủ yếu vào cấu trúc dữ liệu của Data set,  ID3 làm việc hiệu quả hơn với các thuộc tính có kiểu dữ liệu liên tục (continuous data) còn J48 thì làm việc tốt hơn với các thuộc tính định danh (nominal data).
    Chúc em thành công
    • Điểm chủ đề: 35
  • 10-22-2012 10:39 PM trả lời

    Re: Cây quyết định (Decision Tree)

    Em chào thầy,
    Cho em hỏi, trong các ví dụ thì các lớp thường có 2 giá trị là 0,1 hoặc yes,no. Vậy lớp có lớn hơn 2 giá trị như trong ví dụ Train, Bus, Car ở trên thì phải sử dụng thuật toán nào để xây dựng cây quyết định đây thầy?
    Em cảm ơn thầy.

    • Điểm chủ đề: 35
  • 10-23-2012 11:34 AM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Re: Cây quyết định (Decision Tree)

    Chào em,
    Thuộc tính phân lớp có bao nhiêu giá trị cũng được.
     
    • Điểm chủ đề: 50
  • 10-23-2012 11:41 AM trả lời

    Re: Cây quyết định (Decision Tree)

    Dạ em cảm ơn thầy, em hiểu rồi.
    • Điểm chủ đề: 20
  • 10-28-2012 04:10 PM trả lời

    Re: Cây quyết định (Decision Tree)

    Chào Thầy.
    Em có đọc qua một số bài viết của Thầy về Data Mining và Cây Quyết Định, em cũng đang làm bài tập về cây quyết định và có một số thắc mắc rất mong được thầy giải đáp.
     
    Với một số thông tin như:  Dữ liệu ban đầu khoảng 9000 dòng .Tập training khoảng 7000 dòng dữ liệu ,  tập test có 2000 dòng dữ liệu. ( phần mềm dùng để phân lớp em tự viết, dùng độ đo infomationGain và GainRatio )
     
    Sau khi training  em thu được 1 tập các luật, em áp dụng các luật này vào dữ liệu test  thì   khoảng 550 dòng không phân lớp được ( tức là kết quả phân lớp không có giá trị " Yes" hay  " No" ). Số còn lại phân lớp bình thường. ( chưa thống kê độ chính xác ).
     
    Thầy cho em hỏi :  với tập test chỉ 2000 dữ liệu mà khoảng 550 dòng không phân lớp được thì phần mềm dùng để phân lớp đó có thể chấp nhận được hay không ?
    Mong sớm được giải đáp từ thầy.
    Cám ơn Thầy.
    Nguyễn Anh Dũng.
    • Điểm chủ đề: 20
  • 06-10-2013 08:40 PM trả lời

    • caokma
    • 500 thành viên năng nổ nhất
    • Tham gia 05-13-2013
    • Điểm 20

    Re: Cây quyết định (Decision Tree)

    Em chào thầy!
     Thầy cho em hỏi chút, tại sao trong weka khi sử dụng cây quyết định bằng thuật toán ID3 thì ko sử dụng được
    ID3 bị mờ và ko chạy được ạ
     
    • Điểm chủ đề: 20
  • 06-21-2013 03:45 AM trả lời

    Re: Cây quyết định (Decision Tree)

    Thầy cho em hỏi thuật toán ID3 có thể áp dụng trên CSDL có các thuộc tính dạng số không thầy . ví dụ như doanh thu hóa đơn , số tuổi , ngày sinh.
    Em cám ơn thầy 
    • Điểm chủ đề: 20
  • 11-09-2013 09:46 AM trả lời

    Re: Cây quyết định (Decision Tree)

    Em chào anh Chức ạ ! Bài của anh rất ý nghĩa ạ. Dạ cho em hỏi cách sử dụng thuật toán ID3 và C4.5 với WEKA với ạ.  Trong tab Classify/tree  thì không chọn được  id3 vì nó ẩn ạ, và không có C4.5 ở đó ạ. Vậy thì phải làm sao để dùng đc 2 thuật toán này trên WEKA ạ ? Em chân thành cảm ơn ạ.
    • Điểm chủ đề: 35
  • 11-10-2013 09:51 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Re: Cây quyết định (Decision Tree)

    Chào em,
     
    Em dùng Weka Version nào?
    Trường hợp thuật toán bị mờ không chọn được có thể là do dữ liệu training không phù hợp (về cấu trúc).
    C4.5 là phiên bản thương mại nên không có trong Weka, muốn dùng C4.5 phải down riêng.
    Chúc em thành công,
     
     
    • Điểm chủ đề: 35
  • 11-11-2013 09:31 PM trả lời

    Re: Cây quyết định (Decision Tree)

    Dạ em dùng Weka 3.6.2, và đã tiền xử lý dữ liệu như bài trước của anh đăng thì mở được ID3 rồi ạ . Giờ em muốn dùng C4.5 thì em phải down ở đâu và làm thế nào ạ? Anh hướng dẫn em với ạ.
    Em cảm ơn anh ạ!
    • Điểm chủ đề: 35
  • 11-11-2013 10:09 PM trả lời

    • chucnv
    • 10 thành viên năng nổ nhất
    • Tham gia 12-05-2008
    • Điểm 8,020

    Re: Cây quyết định (Decision Tree)

    Follow this link: http://www.rulequest.com/Personal/
    Good luck,
    • Điểm chủ đề: 50
  • 11-11-2013 10:47 PM trả lời

    Re: Cây quyết định (Decision Tree)

    Dạ em cảm ơn ạ, Em k giỏi về lập trình nên không biết file này là để add vào weka hay là là tools của ngôn ngữ nào ak ? Anh chỉ cho em cách dùng ạ.
    Em chân thành cảm ơn anh ạ !
    • Điểm chủ đề: 50
Trang 1 trong số 2 (30 nội dung) 1 2 Tiếp theo >
Powered by Community Server (Commercial Edition), by Telligent Systems