Stor sprogmodel
maskinlæringsmodel designet til sprogteknologiopgaver (NLP) From Wikipedia, the free encyclopedia
Remove ads
En stor sprogmodel (på engelsk Large language model forkortet LLM) er en type maskinlæringsmodel designet til sprogteknologiopgaver (NLP) såsom sproggenerering. LLM'er er sprogmodeller med mange parametre og trænes med self-supervised learning på en stor mængde tekst.



De største og mest dygtige LLM'er er generative pretrained transformers (GPT'er). Moderne modeller kan finjusteres til specifikke opgaver eller guides af hurtig teknik.[1] Disse modeller opnår forudsigelseskraft med hensyn til syntaks, semantik og ontologier[2], der er iboende i menneskelige sprogkorpora, men de arver også unøjagtigheder og skævheder, der er til stede i de data, de er trænet i.[3]
Remove ads
Se også
Referencer
Yderligere læsning
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads