Timeline
Chat
Prospettiva

Curva di apprendimento (apprendimento automatico)

rappresentazione grafica delle valutazioni relative all'addestramento e alla validazione di un modello al variare del numero di esempi di addestramento Da Wikipedia, l'enciclopedia libera

Curva di apprendimento (apprendimento automatico)
Remove ads

Nell'apprendimento automatico una curva di apprendimento (o curva di addestramento) è una rappresentazione grafica che mostra come le prestazioni di un modello su un insieme di dati di addestramento (e solitamente un insieme di convalida) cambiano al crescere del numero di iterazioni di addestramento (epoche) o della quantità di dati di addestramento usati.[1] In genere, il numero di epoche di addestramento o la dimensione dell'insieme di addestramento viene tracciato sull'asse x e il valore della funzione di perdita (e possibilmente qualche altra metrica come il punteggio di convalida incrociata) sull'asse y.

Thumb
Grafico della curva di apprendimento della dimensione dell'insieme di addestramento rispetto ai punteggi di addestramento (perdita) e di convalida incrociata

Fra i sinonimi sono ricompresi curva di errore, curva di esperienza, curva di miglioramento e curva di generalizzazione.[2]

In termini più astratti, le curve di apprendimento descrivono la differenza tra lo sforzo per apprendere e le prestazioni predittive, dove lo “sforzo per apprendere” è solitamente misurato in termini del numero di campioni di addestramento, mentre le “prestazioni predittive” in termini dell'accuratezza sui campioni di test.[3]

Le curve di apprendimento hanno molti usi interessanti nell'apprendimento automatico, fra i quali:[4][5][6]

  • scelta dei parametri del modello durante la progettazione,
  • ottimizzazione adeguata per migliorare la convergenza,
  • e diagnosticare problemi come il sovradattamento (o il suo opposto).

Le curve di apprendimento possono anche essere strumenti per determinare quanto un modello tragga vantaggio dall'aggiunta di più dati di addestramento e se il modello soffra maggiormente di un errore di varianza o bias. Se sia il punteggio di convalida che il punteggio di addestramento convergono verso un certo valore, il modello non beneficerà significativamente da una maggiore disponibilità di dati di addestramento.[7]

Remove ads

Definizione

Riepilogo
Prospettiva

Quando si costruisce una funzione per approssimare la distribuzione di alcuni dati, è necessario definire una funzione di perdita (loss) per misurare la qualità dell'output del modello (ad esempio, l'accuratezza per le attività di classificazione o l'errore quadratico medio per la regressione). Si definisce quindi un processo di ottimizzazione che trova i parametri del modello tale da minimizzare , denominando il modello ottimale .

Curva di addestramento rispetto alla quantità di dati

Se i dati di addestramento sono

e i dati di convalida sono

,

allora una curva di apprendimento corrisponde al grafico delle due curve

dove

Curva di addestramento rispetto al numero di iterazioni

Molti algoritmi di ottimizzazione sono iterativi, ossia ripetono lo stesso passo (come la backpropagation) finché il processo non converge a un valore ottimale. La discesa del gradiente è uno di tali algoritmi. Se rappresenta l'approssimazione ottimale di trovata dopo passi, una curva di apprendimento conterrà i grafici di

Remove ads

Voci correlate

Note

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads