GPT-3 - Wikiwand

Generativ Aldınnan Tayarlanǵan Transformator 3 (GPT-3) (ingl. Generative Pre-trained Transformer 3) — 2020 jılı OpenAI tárepinen shıǵarılǵan úlken til modeli.

Óziniń aldınǵı versiyası GPT-2 sıyaqlı^[1]bul tereń neyron tarmaǵınıń tek dekoderge arnalǵan transformator modeli, ol «itibar beriw» dep atalatuǵın usıl menen qaytalanıw hám konvulsiyaǵa tiykarlanǵan arxitekturalardı almastıradı. Bul itibar beriw mexanizmi modelge eń aktual dep boljanǵan kiris tekstiniń segmentlerine tańlamalı túrde itibar beriwge imkaniyat beredi. GPT-3 175 milliard parametrge iye, olardıń hárqaysısı 16 bitlik dállik penen, 350 GB yadtı talap etedi, sebebi hárbir parametr 2 bayttı aladı. Onıń kontekstlik ayna ólshemi 2048 tokeni bar hám kóplegen tapsırmalarda kúshlik «nollik atıw» oqıw qábiletlerin kórsetti^[1].

2020 jıl 22 sentyabrde Microsoft tek GPT-3 licenziyasın alǵanın járiyaladı. Basqalar ele de hámmege ashıq API-den nátiyje ala aladı, biraq tek Microsoft korporaciyası tiykarǵı til modeline kiriw huqıqına iye.

Remove ads

Fon

The Economist maǵlıwmatlarınsha, jetilistirilgen algoritmler, quwatlıraq kompyuterler hám cifrlastırılǵan material sanınıń jaqında kóbeyiwi mashinalıq oqıtıwdaǵı revolyuciyanı kúsheytti. 2010 jılları jańa texnikalar «tapsırmalardı tez jaqsılawǵa», sonıń ishinde til menen manipulyaciyalawǵa alıp keldi^[2].

Programmalıq támiynat modelleri «miydiń neyron arxitekturasına sáykes ... bos túrde qurılǵan» mıńlaǵan yamasa millionlaǵan mısallardı paydalanıw arqalı úyreniwge oqıtıladı^[2]. Tábiyiy tildi qayta islewde (NLP) qollanılatuǵın arxitekturalardıń biri 2017 jılı engizilgen tereń oqıtıw modeline tiykarlanǵan neyron tarmaq − transformator arxitekturası. Tekstli kirgiziwdi qayta islewge, qazıp alıwǵa, shólkemlestiriwge, baylanıstırıwǵa hám qarama-qarsı qoyıwǵa, sonday-aq sorawlarǵa durıs juwap beriwge uqıplı bir qatar NLP sistemaları bar^[3].

2018-jıl 11-iyun kúni OpenAI izertlewshileri menen injenerleri birinshi generativ aldınnan tayarlanǵan transformator (GPT) — maǵlıwmatlar jıynaqlarında úlken hám hár túrli tekstli korpus penen aldınnan oqıtılǵan, keyin anıq wazıypaǵa baǵdarlanıw ushın diskriminativ túrde dál sazlanǵan, generativ úlken til modeli túrin usınıs etetuǵın maqala járiyaladı. GPT modelleri transformatorǵa tiykarlanǵan tereń oqıtıw neyron tarmaq arxitekturaları. Burın, eń jaqsı jumıs isleytuǵın neyron NLP modelleri kóbinese qol menen belgilengen maǵlıwmatlardıń úlken kóleminen baqlanatuǵın oqıtıwdı qollanǵan, bul júdá úlken til modellerin oqıtıw qımbat hám waqıttı talap etedi^[1]. Birinshi GPT modeli "GPT-1" dep atalǵan hám onnan keyin 2019-jıl fevralda "GPT-2" shıǵarıldı. Aldınǵısınan tikkeley masshtabta rawajlanǵan, GPT-2-niń parametrler sanı da, maǵlıwmatlar jıynaǵınıń ólshemi de on esege ósti. Onıń 1,5 milliard parametrleri bar edi hám ol 8 million veb-betten ibarat maǵlıwmatlar jıynaǵında oqıtılǵan^[4].

2020 jıl fevralda Microsoft korporaciyası óziniń Turing Natural Language Generation (T-NLG) versiyasın usındı, olar «17 milliard parametr menen járiyalanǵan eń úlken til modeli» dep málimledi Ol tekstlerdi ulıwmalastırıw menen sorawlarǵa juwap beriwdi qosqanda, hár túrli tapsırmalardı orınlawda hár qanday til modeline qaraǵanda jaqsı orınladı.

Remove ads

Trening hám imkaniyatlar

GPT-3 tárepinen jazılǵan pedagogika haqqında studentlik esse úlgisi:

«Oqıtıw stiliniń» konstrukciyası mashqalalıq bolıp tabıladı, óytkeni ol oqıtıw stilleriniń qáliplesiw proceslerin itibarǵa almaydı. Ayırım studentler belgili bir úyreniw stilin qáliplestire aladı, óytkeni olardıń belgili bir tájiriybeleri bar. Basqaları ózleriniń úyreniw mútájliklerine jaqsı sáykes kelmegen úyreniw ortalıǵına beyimlesiwge háreket etiw arqalı belgili bir úyreniw stilin qáliplestire aladı. Aqırǵı jaǵdayda, biz úyreniw stiliniń, ortalıq faktorlardıń hám jeke faktorlardıń arasındaǵı óz-ara tásirlerdi hám olardıń qalay úyreniwimizge hám biz basqarıp atırǵan úyreniw túrlerine qalay tásir etetuǵının túsiniwimiz kerek.

2020 jıl 28 mayda OpenAI-degi 31 injener hám izertlewshiler toparı GPT-3-tiń jetiskenliklerin hám rawajlanıwı «zamanagóy til modeliniń» úshinshi áwladın táriyipleytuǵın arXiv preprintin járiyaladı. Topar GPT-3-tiń sıyımlılıǵın aldınǵı versiyası, GPT-2-ge qaraǵanda eki esege joqarı arttırdı^[5], bul GPT-3-ti hazirgi waqıttaǵı eń iri siyrek emes til modeline aylandırdı GPT-3 strukturalıq jaqtan aldınǵısına uqsas bolǵanlıqtan, onıń úlken dálligi onıń joqarı sıyımlılıǵı menen hám parametrlerdiń kóp sanı menen baylanıslı^[6]. GPT-3 sıyımlılıǵı Microsoft korporaciyasınıń Turing NLG modelinen on ese úlken, bul sol gezde belgili keyingi eń úlken NLP modeli.^[7]

Lambdalabs 2020-jıldaǵı jaǵday boyınsha GPT-3-ti jeke GPU-da oqıtıw ushın shama menen 4,6 million AQSH dolları hám 355 jıl jumsalatuǵın shıǵındı bahaladı^[8], parallel túrde kóbirek GPU qollanǵanda haqıyqıy oqıtıw waqtı azıraq.

GPT-3 ushın ólshengen aldınnan oqıtıw maǵlıwmatlar jıynaǵınıń alpıs procenti 410 milliard bayt-jup kodlanǵan tokenlerdi qamtıytuǵın, Common Crawl filtrlengen versiyasınan ibarat. Onsha kórinbeytuǵın deupkikaciya Apache Spark's MinHashLSH qollandı. Basqa derekler: WebText2-den 19 alınǵan milliard token, bul ólshengen toplamnıń 22%, Books1-den 12 milliard token −88%, Books2-den 55 milliard token — 8% hám Wikipedia-dan 3 milliard token. GPT-3 júzlegen milliard sózler boyınsha oqıtıldı hám basqalar qatarında CSS, JSX hám Python-da kodlawǵa da qábiletli.

Tolıǵıraq maǵlıwmat Maǵlıwmatlar jıynaǵı, # tokenler ...

GPT-3 trening maǵlıwmatları:
Maǵlıwmatlar jıynaǵı	# tokenler	Proporciya trening sheńberinde
Common Crawl	410 mlrd	60%
WebText2	19 mlrd	22%
Books1	12 mlrd	8%
Books2	55 mlrd	8%
Wikipedia	3 mlrd	3%

GPT-3 oqıtıw maǵlıwmatları hár tárepleme bolǵanlıqtan, ol hár túrli til tapsırmaları ushın qosımsha oqıtıwdı talap etpeydi. Shınıǵıw maǵlıwmatlarında tosınnan toksik (zıyanlı) til bar hám GPT-3 oqıw maǵlıwmatlarına eliklew nátiyjesinde geyde toksik tildi jaratadı. Vashington universitetiniń izertlewi GPT-3 GPT-2 hám CTRL uqsas tábiyiy tildi qayta islew modelleri menen salıstırılatuǵın toksik dárejede toksik til shıǵaratuǵının anıqladı. OpenAI GPT-3 payda etetuǵın toksik tildiń mólsherin sheklew ushın bir neshe strategiyalardı ámelge asırdı. Nátiyjesinde GPT-3 burınǵı GPT-1 modeli menen salıstırǵanda az toksik til shıǵardı, degen menen ol tolıǵı menen Wikipedia maǵlıwmatlarında oqıtılatuǵın CTRL Wiki menen salıstırǵanda toksik tildiń kóp áwladları menen toksikligi joqarı boldı^[9].

2020 jıl 11 iyunda OpenAI paydalanıwshılar OpenAI-ge usı jańa texnologiyanıń «kúshleri menen sheklewlerin» izertlewge járdemlesiw ushın paydalanıwshıǵa qolaylı GPT-3 API — «mashinalıq oqıtıw qurallarınıń jıynaǵı»na kiriwdi soray alatuǵının járiyaladı^[10]^[11]. Shaqırıw bul API-de ádettegi bir qollanıw jaǵdayınıń ornına «hár qanday inglis tilindegi tapsırmanı» derlik orınlay alatuǵın ulıwma maqsetli «tekstti kirgiziw, tekst shıǵarıw» interfeysi bar ekenin táriyipledi^[10] OpenAI GPT-3 API jeke erte shıǵarılımına kirgen bir paydalanıwshınıń aytıwınsha, GPT-3 bir neshe ápiwayı keńesler menen «tańqalarlıq úylesimli tekstti» jazıwda «júdá jaqsı» boldı.^[12]. Dáslepki eksperimentte AQSHtıń 80 subyektine qısqa ~200 sózlik maqalanı adamlar yamasa GPT-3 jazǵan ba, sonı anıqlaw soraldı. Qatnasıwshılar waqıttıń 52% durıs bahaladı, bul tosınnan boljawdan sál ǵana jaqsıraq.

2021 jıl 18-noyabrde OpenAI API-ge kiriw sheklewsiz bolatuǵınday jetkilikli qáwipsizlik ilajları engizilgenin xabarladı^[13]. OpenAI islep shıǵarıwshılarǵa OpenAI kontent siyasatına ámel etiwge járdemlesetuǵın kontentti moderaciyalaw quralı menen támiyinledi^[14]. 2022 jıl 22 yanvarda OpenAI óziniń eń jańa GPT-3 til modelleri (birge InstructGPT dep ataladı) endi API interfeysinde qollanılatuǵın ádepki til modeli ekenin járiyaladı. OpenAI maǵlıwmatları boyınsha, InstructGPT kórsetpelerdi jaqsıraq orınlap, az dúzilgen faktlerdi generaciyalaw hám toksikligi az kontentti shıǵarıw arqalı paydalanıwshı niyetine jaqsıraq sáykeslendirilgen kontentti shıǵardı^[15].

GPT-3 «adam bahalawshıları adam jazǵan maqalalardan ajıratıwǵa qıynalatuǵın jańalıqlar maqalaların jarata alatuǵınlıqtan» GPT-3 «til modelleriniń paydalı hám zıyanlı qosımshaların ilgeriletiw imkaniyatına» iye. 2020 jıl 28 maydaǵı maqalasında izertlewshiler «jalǵan informaciya, spam, fishing, nızamlı hám húkimetlik proceslerdi teris paydalanıw, jalataylıq akademiyalıq esse jazıw hám sociallıq injenerlik sıltawlardı» qamtıytuǵın GPT-3^[7] itimal «zıyanlı tásirlerin» tolıǵı menen táriyipledi. Avtorlar qáwip-qáterdi azaytıw boyınsha izertlewlerge shaqırıw ushın usı qáwiplerge itibar beredi.

GPT-3 nollik atıw hám az atıw (sonıń ishinde bir retlik) oqıwdı orınlawǵa qábiletli.

2022 jıl iyunda Almira Osmanovich Tunstrem GPT-3 ózi tuwralı maqalanıń tiykarǵı avtorı ekenin^[16], olar onı járiyalawǵa usınǵanın hám onıń sholıwınıń juwmaqlanıwın kútiw waqtında aldınnan járiyalanǵanın jazdı^[17].

Remove ads

GPT-3 modelleri

GPT-3 shańaraǵında kóplegen modeller bar, olardıń ayırımları basqalarǵa qaraǵanda hár túrli maqsetlerge xızmet etedi. OpenAI tárepinen járiyalanǵan dáslepki izertlew maqalasında olardıń tiykarǵı GPT-3 modeliniń 8 túrli ólshemderi bar ekenligi aytılǵan:

Tolıǵıraq maǵlıwmat Model atı, Parameterler ...

Model atı	Parameterler	API atı
GPT-3 Small	125 M	n/a
GPT-3 Medium	350 M	ada
GPT-3 Large	760 M	n/a
GPT-3 XL	1.3 B	babbage
GPT-3 2.7B	2.7 B	n/a
GPT-3 6.7B	6.7 B	curie
GPT-3 13B	13B	n/a
GPT-3 175B	175B	davinci

Modellerdiń yarımına API arqalı qoljetimli boladı, atap aytqanda GPT-3-medium, GPT-3-xl, GPT-3-6.7B hám GPT-3-175b, olardı sáykesinshe ada, babbage, curie hám davinci dep atadı. API úlgileriniń ólshemin OpenAI dáslebinde ashpaǵanı menen, EleutherAI model ólshemleri menen API atları arasındaǵı salıstırıwdı 2021 jıl mayda járiyaladı^[18]. Bul model ólshemlerin keyin OpenAI bunı tastıyıqladı^[19], biraq keyingi modellerdiń ólshemleri ashılǵan joq.

Generativ Aldınnan Tayarlanǵan Transformator 3.5 (GPT-3.5) — 2022 jılı OpenAI tárepinen jaratılǵan GPT-3 modelleriniń kishi klası.

2022 jıl 15 martta OpenAI "text-davinci-002" hám "code-davinci-002" atları menen redaktorlaw hám ornatıw imkaniyatları bar API-de GPT-3 hám Codex-tiń jańa versiyaların qoljetimli etti^[20]. Bul modeller aldınǵı versiyalardan kóbirek qábiletli dep táriyipledi hám 2021 jıl iyunǵa shekemgi maǵlıwmatlar boyınsha oqıtıldı^[21]. 2022 jıl 28 noyabrde OpenAI text-davinci-003-ti usındı^[22]. 2022 jıl 30 noyabrde OpenAI bul modellerdi «GPT-3.5» seriyasına tiyisli dep ayta basladı^[21] hám GPT-3.5 seriyasındaǵı model boyınsha dál sazlanǵan ChatGPT-di shıǵardı.^[23], OpenAI GPT-3-ke GPT-3.5-ti qospaydı^[24].

Modeller

Úsh model bar^[25]:

Chat
- gpt-3.5-turbo
Text completion
- text-davinci-003
- text-davinci-002

GPT-3.5 aldınnan kóriw menen

2023 jıl 10 aprelde OpenAI GPT-3.5 seriyası modeliniń GPT-3.5 Browsing (ALPHA) dep atalǵan jańa variyantın usındı^[26]. Bul jańalanǵan model óziniń aldınǵı "text-davinci-002" hám "code-davinci-002" modelleriniń imkaniyatlarına tiykarlanǵan dep táriyipledi^[27]. GPT-3.5 Browsing (ALPHA) modeli onlayn informaciyaǵa kiriw hám sholıw imkaniyatın qosıp aldı. Bul paydalanıwshı sorawlarına kóbirek dál hám jańalanǵan juwaplar beriwge alıp keldi.^[26]

GPT-3.5 Browsing (ALPHA) modeli 2021 jıl sentyabrge shekemgi maǵlıwmatlar boyınsha oqıtılǵan, bul onıń 2021 jıl iyunǵa shekemgi maǵlıwmatlar boyınsha oqıtılǵan aldınǵı GPT-3.5 modellerine qaraǵanda kóbirek informaciyaǵa beredi. Model islep shıǵarıwshılar menen paydalanıwshılarǵa onlayn informaciyanı ónimli alıw hám sintezley alatuǵın jetilistirilgen tábiyiy tildi qayta islew quralın usınıwǵa háreket etti^[26].

Sholıw imkaniyatların ámelge asırıw ushın, OpenAI GPT-3.5 Browsing (ALPHA) modeli jumıs waqtında tańlanǵan onlayn resurslarǵa kiriwge imkaniyat beretuǵın jańa API engizdi^[28]. Bul imkaniyat paydalanıwshılarǵa sorawlar beriwge yamasa model oǵan qoljetimli eń sońǵı onlayn dereklerge tiykarlanǵan jańalanǵan, dál hám sáykes juwaplardı beredi dep kútiw arqalı informaciya sorawǵa imkaniyat beredi.

2023 jıl 27 aprelde OpenAI GPT Plus paydalanıwshıları ushın GPT-3.5 Browsing (ALPHA) modelin hámmege qoljetimli etti. Bul kóbirek adamlardıń jańa imkaniyatlarǵa erisiwine imkaniyat berdi^[28].

Remove ads

Derekler

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads