Timeline
Chat
Prospettiva
Apprendimento per trasferimento
Da Wikipedia, l'enciclopedia libera
Remove ads
L'apprendimento per trasferimento (o transfer learning) è una tecnica di apprendimento automatico in cui la conoscenza appresa per lo svolgimento di un compito attività viene riutilizzata per migliorare le prestazioni in uno correlato.[1] Ad esempio, nella classificazione delle immagini, la conoscenza acquisita nell'imparare a riconoscere le auto potrebbe essere applicata quando si cerca di riconoscere i camion. Questo argomento è correlato alla letteratura sul trasferimento dell'apprendimento psicologia, sebbene i legami pratici tra i due campi siano limitati. Il riutilizzo o il trasferimento di informazioni da attività imparate in precedenza a nuove attività ha il potenziale per migliorare significativamente l'efficienza dell'apprendimento.[2]

Poiché l'apprendimento per trasferimento si avvale di un addestramento con più funzioni obiettivo, è correlato all'apprendimento sensibile ai costi e all'ottimizzazione multi-obiettivo.[3]
Remove ads
Storia
Riepilogo
Prospettiva
Nel 1976, Bozinovski e Fulgosi pubblicarono un articolo[4] sull'apprendimento per trasferimento nell'addestramento delle reti neurali. L'articolo fornisce un modello matematico e geometrico sul tema. Nel 1981, un rapporto prese in esame l'applicazione dell'apprendimento per trasferimento a un dataset di immagini che rappresentavano lettere di terminali di computer, dimostrando sperimentalmente l'apprendimento per trasferimento positivo e negativo.[5]
Nel 1992, Lorien Pratt ha formulato l'algoritmo di trasferimento basato sulla discriminabilità (DBT).[6]
Intorno al 1998, la tecnica è maturata giungendo alla formalizzazione dei suoi fondamenti teorici [7], arrivando a ricomprendere anche l'apprendimento multi-task.[8] Sono stati pubblicati lavori significativi sull'apprendimento per trasferimento fra i quali figurano il libro Learning to Learn del 1998,Thrun Pratt, 2012 e due rassegne della letteratura scientifica dedicate al tema datate 2009 [9] e 2019.[10]
Nel suo tutorial tenuto in occasione della NIPS 2016 [11][12] Andrew Ng ha sostenuto che l'apprendimento per trasferimento sarebbe diventato il prossimo motore del successo commerciale dell'apprendimento automatico, dopo l'apprendimento supervisionato.
Nell'articolo del 2020, "Rethinking Pre-Training and self-training",[13] Zoph et al. sostengono che il pre-addestramento può compromettere la precisione e promuovono invece l'auto-addestramento (self-training).
Remove ads
Definizione
La definizione di apprendimento per trasferimento è data in termini di domini e compiti. Un dominio consiste in: uno spazio di caratteristiche e una distribuzione di probabilità marginale , dove . Dato un dominio specifico, , un compito è composto da uno spazio di etichette e una funzione-obiettivo . La funzione viene utilizzata per predire l'etichetta data una nuova istanza . Questo compito, indicato da , viene appreso dai dati di addestramento costituiti da coppie , dove e
Dato un dominio sorgente e compito di apprendimento , un dominio di destinazione e compito di apprendimento , dove , O , l'apprendimento per trasferimento mira a migliorare l'apprendimento della funzione-obiettivo in utilizzando la conoscenza in e
Remove ads
Applicazioni
Riepilogo
Prospettiva
Sono disponibili algoritmi di apprendimento per trasferimento su reti logiche di Markov e reti bayesiane. L'apprendimento per trasferimento è stato applicato alla scoperta di sottotipi di cancro,[14] all'utilizzo degli edifici,[15][16] ai giochi, alla classificazione del testo,[17][18] al riconoscimento delle cifre,[19] all'imaging medico e al contrasto allo spam.[20]
Nel 2020, si è scoperto che, grazie alla loro natura fisica simile, è possibile l'apprendimento per trasferimento tra segnali elettromiografici (EMG) provenienti dai muscoli e la classificazione dei comportamenti delle onde cerebrali elettroencefalografiche (EEG), dal dominio del riconoscimento dei gesti al dominio del riconoscimento degli stati mentali. È stato osservato che questa relazione funzionava in entrambe le direzioni, dimostrando che l'elettroencefalografia può essere utilizzata anche per classificare l'EMG.[21] Gli esperimenti hanno rilevato che l'accuratezza delle reti neurali e, in particolare, delle reti convoluzionali era stata migliorata [22] attraverso l'apprendimento per trasferimento sia prima di qualsiasi attività di apprendimento (rispetto alla distribuzione casuale standard dei pesi) sia alla fine del processo di apprendimento (asintoto). In altre parole, i risultati sono migliorati dopo l'esposizione a un altro dominio. Inoltre, l'utente finale di un modello per-addestrato può modificare la struttura di strati completamente connessi al fine di migliorare le prestazioni.[23]
Note
Bibliografia
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
