Timeline
Chat
Prospettiva
Twoing
Da Wikipedia, l'enciclopedia libera
Remove ads
Nell'apprendimento automatico di alberi di decisione, il criterio del twoing è una misura utilizzata nell'algoritmo CART [1] per selezionare in ogni nodo la migliore partizione degli oggetti contenuti. Il criterio di divisione in (partizione con esito del test positivo, risp. negativo), definito in base alla variabile predittiva o feature , è calcolato come segue
dove è la frazione di oggetti della i-esima classe nell'insieme . L'algoritmo CART seleziona le feature che massimizzano la regola di partizionamento del twoing sopra indicata.
Le principali differenze tra i due criteri di partizionamento possono essere riassunte come segue:[2]
- Il twoing fornisce una suddivisione binaria per ogni nodo, mentre l'entropia può fornire partizioni multiple a seconda delle variabili. Per questo motivo, la complessità in termini di altezza dell'albero prodotto quando si utilizza il twoing nel processo di costruzione dell'albero di decisione è maggiore rispetto all'utilizzo dell'entropia.
- Con il twoing si gestiscono sia valori categorici sia numerici, mentre con l'entropia si gestiscono solo valori categorici.
Alcune altre differenze fra l'utilizzo del twoing o dell'entropia come criteri di divisione sono: [3]
- che il primo è in grado di gestire i valori anomali, mentre l'entropia è sensibile ai valori anomali
- Inoltre, il twoing gestisce i dati mancanti meglio della misura di entropia.
Remove ads
Note
Voci correlate
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads