Timeline
Chat
Prospettiva

Twoing

Da Wikipedia, l'enciclopedia libera

Remove ads

Nell'apprendimento automatico di alberi di decisione, il criterio del twoing è una misura utilizzata nell'algoritmo CART [1] per selezionare in ogni nodo la migliore partizione degli oggetti contenuti. Il criterio di divisione in (partizione con esito del test positivo, risp. negativo), definito in base alla variabile predittiva o feature , è calcolato come segue

dove è la frazione di oggetti della i-esima classe nell'insieme . L'algoritmo CART seleziona le feature che massimizzano la regola di partizionamento del twoing sopra indicata.

Le principali differenze tra i due criteri di partizionamento possono essere riassunte come segue:[2]

  • Il twoing fornisce una suddivisione binaria per ogni nodo, mentre l'entropia può fornire partizioni multiple a seconda delle variabili. Per questo motivo, la complessità in termini di altezza dell'albero prodotto quando si utilizza il twoing nel processo di costruzione dell'albero di decisione è maggiore rispetto all'utilizzo dell'entropia.
  • Con il twoing si gestiscono sia valori categorici sia numerici, mentre con l'entropia si gestiscono solo valori categorici.

Alcune altre differenze fra l'utilizzo del twoing o dell'entropia come criteri di divisione sono: [3]

  • che il primo è in grado di gestire i valori anomali, mentre l'entropia è sensibile ai valori anomali
  • Inoltre, il twoing gestisce i dati mancanti meglio della misura di entropia.
Remove ads

Note

Voci correlate

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads