Stor sprogmodel

maskinlæringsmodel designet til sprogteknologiopgaver (NLP) From Wikipedia, the free encyclopedia

Stor sprogmodel
Remove ads

En stor sprogmodel (på engelsk Large language model forkortet LLM) er en type maskinlæringsmodel designet til sprogteknologiopgaver (NLP) såsom sproggenerering. LLM'er er sprogmodeller med mange parametre og trænes med self-supervised learning på en stor mængde tekst.

Thumb
Træningsberegningen af bemærkelsesværdige store modeller i flops vs. udgivelsesdato i perioden 2010-2024. For overordnede bemærkelsesværdige modeller (øverst til venstre), grænse modeller (øverst til højre), top modeller (nederst til venstre) og top modeller inden for førende virksomheder (nederst til højre). Størstedelen af disse modeller er sprogmodeller. Mange af dem er store sprogmodeller.
Thumb
Træningsudgifter i US dollars af nogle AI-modeller.
Thumb
Ydelse af store sprogmodeller på en række NLP-benchmarks som funktion af træningsberegning.

De største og mest dygtige LLM'er er generative pretrained transformers (GPT'er). Moderne modeller kan finjusteres til specifikke opgaver eller guides af hurtig teknik.[1] Disse modeller opnår forudsigelseskraft med hensyn til syntaks, semantik og ontologier[2], der er iboende i menneskelige sprogkorpora, men de arver også unøjagtigheder og skævheder, der er til stede i de data, de er trænet i.[3]

Remove ads

Se også

Referencer

Yderligere læsning

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads