Generative pre-trained transformer

Generative pre-trained transformer (GPT, укр. породжувальний попередньо тренований трансформер,^[1] також генеративний попередньо тренований трансформер,^[2] рідше породжувальний попередньо натренований трансформер^[3]) — варіант «штучного інтелекту»^[4]^[5] — це сімейство мовних моделей, які зазвичай навчаються на великому корпусі текстових даних для створення тексту, схожого на текст людини. Вони побудовані з використанням декількох блоків трансформної архітектури. Їх можна точно налаштувати для виконання різноманітних завдань обробки природної мови, таких як генерація тексту, переклад мови та класифікація тексту. «Попереднє навчання» в його назві означає початковий процес навчання на великому текстовому корпусі, під час якого модель вчиться передбачати наступне слово в уривку, що забезпечує надійну основу для успішної роботи моделі в наступних завданнях з обмеженою кількістю даних, що стосуються конкретного завдання.

[1]

[2]

[3]

[4]

[5]

	Архітектура	Кількість параметрів	Тренувальні дані	Дата релізу	Вартість тренування
GPT-1	12-level, 12-headed Transformer decoder (no encoder), followed by linear-softmax.	0,12 млрд	BookCorpus:^[13] 4,5 ГБ тексту з 7000 невиданих книг різних жанрів	11.06.2018	1 місяць на 8 GPU (1.7e+19 FLOP)
GPT-2	GPT-1, але з модифікованою нормалізацією	1,5 млрд	WebText: 40 ГБ тексту, 8 млн документів, 45 млн вебсторінок з позитивними оцінками на Reddit	14.02.2019 (обмежена версія) / 05.11.2019 (повна версія)	Десятки петафлопс/s-day (1.5e+21 FLOP)
GPT-3	GPT-2, but with modification to allow larger scaling.	175 млрд	570 ГБ звичайного тексту, 0,4 трлн токенів. Переважно CommonCrawl, WebText, Англійська Вікіпедія та два корпуси книг (Books1 and Books2)	28.05.2020	3640 петафлопс/s-day (3.1e+23 FLOP)
GPT-3.5	Засекречена	175 млрд	Інформація засекречена	15.03.2022	Інформація засекречена
GPT-4	Засекречена	Невідомо	Інформація засекречена	14.03.2023	Інформація засекречена (орієнтовно 2.1e+25 FLOP)

Generative pre-trained transformer

Застосування

Історія

Див. також

Примітки

Wikiwand - on