Modelinstorting

Modelinstorting (Engels: model collapse) is een fenomeen waarbij modellen voor machinaal leren geleidelijk degraderen als gevolg van fouten die voortkomen uit ongecontroleerde training op de uitkomsten van een ander model (bijvoorbeeld eerdere versies van zichzelf). Deze modellen produceren dan zogenaamde synthetische data, data die kunstmatig gegenereerd is in plaats van gebaseerd op de werkelijkheid.

Shumailov^[1] bedacht de term en beschreef twee specifieke stadia van de degradatie: vroege modelinstorting en late modelinstorting.

Bij een vroege modelinstorting begint het model informatie te verliezen over de uiteinden van de distributie. Dit heeft vooral invloed op minderheidsgegevens. Uit later onderzoek is gebleken dat een vroege modelinstorting moeilijk op te merken is, omdat de algehele prestatie lijkt te verbeteren, terwijl het model juist minder goed presteert op basis van minderheidsgegevens.
Bij een late modelinstorting verliest het model een aanzienlijk deel van zijn prestaties, raken concepten verward en verliest het het grootste deel van zijn variantie.

Onderzoeker Jathan Sadowski van de Monash University omschreef het fenomeen als "Habsburg AI", of "een systeem dat zo sterk getraind is op de outputs van andere generatieve AI's dat het een inteeltmutant wordt, mogelijk met overdreven groteske eigenschappen".

[1]

Modelinstorting

Mechanisme

Oneensheid over de impact in de echte wereld

Impact op grote taalmodellen

Wikiwand - on