POSoutlook(PlayTennis) = {D3, D7, D12, D13}
POStemp(PlayTennis) = POShumidity(PlayTennis) = POSwind(PlayTennis) = {null}
=> Chọn thuộc tính chia là Outlook, xây dựng 3 bảng quyết định (root Outlook)
T0 (brand overcast)
U1 | Temp | Humidity | Wind | Playtennis |
D3 | Hot | High | Weak | Yes |
D7 | Cool | Normal | Strong | Yes |
D12 | Mild | High | Strong | Yes |
D13 | Hot | Normal | Weak | Yes |
T1 (brand sunny)
U0 | Temp | Humidity | Wind | Playtennis |
D1 | Hot | High | Weak | No |
D2 | Hot | High | Strong | No |
D8 | Mild | High | Weak | No |
D9 | Cool | Normal | Weak | Yes |
D11 | Mild | Normal | Strong | Yes |
T2 (brand rain)
U1 | Temp | Humidity | Wind | Playtennis |
D4 | Mild | High | Weak | Yes |
D5 | Cool | Normal | Weak | Yes |
D6 | Cool | Normal | Strong | No |
D10 | Mild | Normal | Weak | Yes |
D14 | Mild | High | Strong | No |
Bảng T10:
U1 | Temp | Humidity | Wind | Playtennis |
D1 | Hot | High | Weak | No |
D2 | Hot | High | Strong | No |
D8 | Mild | High | Weak | No |
Bảng T11:
U1 | Temp | Humidity | Wind | Playtennis |
D9 | Cool | Normal | Weak | Yes |
D11 | Mild | Normal | Strong | Yes |
=> T10 là hệ thuần khiết vì các đối tượng có Humidity = High đều cho kết quả PlayTennis là No (brand High have leaf NO)
=> T11 là hệ thuần khiết vì các đối tượng có Humidity = Normal đều cho kết quả PlayTennis là Yes (brand Normal have leaf YES)
Xét bảng T2:
Từ bảng T2 ta có:
Bảng T20:
U1 | Temp | Humidity | Wind | Playtennis |
D4 | Mild | High | Weak | Yes |
D5 | Cool | Normal | Weak | Yes |
D10 | Mild | Normal | Weak | Yes |
Bảng T21:
U1 | Temp | Humidity | Wind | Playtennis |
D6 | Cool | Normal | Strong | No |
D14 | Mild | High | Strong | No |
=> T20 là hệ thuần khiết vì các đối tượng có Wind = Weak đều cho kết quả PlayTennis là Yes (brand weak have leaf YES)
=> T21 là hệ thuần khiết vì các đối tượng có Wind = Strong đều cho kết quả PlayTennis là No (brand strong have leaf NO)
Do các hệ quyết định cuối cùng đều là các hệ thuần khiết nên thuật toán xây dựng cây quyết định RDT dừng.
Ví dụ 2Armatage Shanks
Cho tập dữ liệu huấn luyện như sau :
RID | age | income | student | credit_rating | Class: bugs_computer |
1 | youth | high | no | fair | no |
2 | youth | high | no | excellent | no |
3 | middle_aged | high | no | fair | yes |
4 | senior | medium | no | fair | yes |
5 | senior | low | yes | fair | yes |
6 | senior | low | yes | excellent | no |
7 | middle_aged | low | yes | excellent | yes |
8 | youth | medium | no | fair | no |
9 | youth | low | yes | fair | yes |
10 | senior | medium | yes | fair | yes |
11 | youth | medium | yes | excellent | yes |
12 | middle_aged | medium | no | excellent | yes |
13 | middle_aged | high | yes | fair | yes |
14 | senior | medium | no | excellent | no |
Giải
POSage(bugs_computer) = {D3, D7, D12, D13}
POSincome(income) = POSincome(student) = POS(credit_rating) = {null}
=> Chọn age làm thuộc tính chính và xây dựng các bảng quyết định (chọn age làm root)
T0: (middle_aged)
3 | middle_aged | high | no | fair | yes |
7 | middle_aged | low | yes | excellent | yes |
12 | middle_aged | medium | no | excellent | yes |
13 | middle_aged | high | yes | fair | yes |
T1: (youth)
1 | youth | high | no | fair | no |
2 | youth | high | no | excellent | no |
8 | youth | medium | no | fair | no |
9 | youth | low | yes | fair | yes |
11 | youth | medium | yes | excellent | yes |
T2: (senior)
4 | senior | medium | no | fair | yes |
5 | senior | low | yes | fair | yes |
6 | senior | low | yes | excellent | no |
10 | senior | medium | yes | fair | yes |
14 | senior | medium | no | excellent | no |
Xét T0:
Toàn bộ đội tượng đều trả về kết quả YES nên đây là hệ thuần khiết (nhánh middle_aged sẽ trả về node lá YES)
1 | youth | high | no | fair | no |
2 | youth | high | no | excellent | no |
8 | youth | medium | no | fair | no |
9 | youth | low | yes | fair | yes |
11 | youth | medium | yes | excellent | yes |
4 | senior | medium | no | fair | yes |
5 | senior | low | yes | fair | yes |
10 | senior | medium | yes | fair | yes |
6 | senior | low | yes | excellent | no |
14 | senior | medium | no | excellent | no |
No comments:
Post a Comment