Timeline
Chat
Prospettiva
Curva di apprendimento (apprendimento automatico)
rappresentazione grafica delle valutazioni relative all'addestramento e alla validazione di un modello al variare del numero di esempi di addestramento Da Wikipedia, l'enciclopedia libera
Remove ads
Nell'apprendimento automatico una curva di apprendimento (o curva di addestramento) è una rappresentazione grafica che mostra come le prestazioni di un modello su un insieme di dati di addestramento (e solitamente un insieme di convalida) cambiano al crescere del numero di iterazioni di addestramento (epoche) o della quantità di dati di addestramento usati.[1] In genere, il numero di epoche di addestramento o la dimensione dell'insieme di addestramento viene tracciato sull'asse x e il valore della funzione di perdita (e possibilmente qualche altra metrica come il punteggio di convalida incrociata) sull'asse y.

Fra i sinonimi sono ricompresi curva di errore, curva di esperienza, curva di miglioramento e curva di generalizzazione.[2]
In termini più astratti, le curve di apprendimento descrivono la differenza tra lo sforzo per apprendere e le prestazioni predittive, dove lo “sforzo per apprendere” è solitamente misurato in termini del numero di campioni di addestramento, mentre le “prestazioni predittive” in termini dell'accuratezza sui campioni di test.[3]
Le curve di apprendimento hanno molti usi interessanti nell'apprendimento automatico, fra i quali:[4][5][6]
- scelta dei parametri del modello durante la progettazione,
- ottimizzazione adeguata per migliorare la convergenza,
- e diagnosticare problemi come il sovradattamento (o il suo opposto).
Le curve di apprendimento possono anche essere strumenti per determinare quanto un modello tragga vantaggio dall'aggiunta di più dati di addestramento e se il modello soffra maggiormente di un errore di varianza o bias. Se sia il punteggio di convalida che il punteggio di addestramento convergono verso un certo valore, il modello non beneficerà significativamente da una maggiore disponibilità di dati di addestramento.[7]
Remove ads
Definizione
Riepilogo
Prospettiva
Quando si costruisce una funzione per approssimare la distribuzione di alcuni dati, è necessario definire una funzione di perdita (loss) per misurare la qualità dell'output del modello (ad esempio, l'accuratezza per le attività di classificazione o l'errore quadratico medio per la regressione). Si definisce quindi un processo di ottimizzazione che trova i parametri del modello tale da minimizzare , denominando il modello ottimale .
Curva di addestramento rispetto alla quantità di dati
Se i dati di addestramento sono
e i dati di convalida sono
,
allora una curva di apprendimento corrisponde al grafico delle due curve
dove
Curva di addestramento rispetto al numero di iterazioni
Molti algoritmi di ottimizzazione sono iterativi, ossia ripetono lo stesso passo (come la backpropagation) finché il processo non converge a un valore ottimale. La discesa del gradiente è uno di tali algoritmi. Se rappresenta l'approssimazione ottimale di trovata dopo passi, una curva di apprendimento conterrà i grafici di
Remove ads
Voci correlate
Note
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads