GPT-3

生成型預訓練變換模型 3
Generative Pre-trained Transformer 3（GPT-3）
原作者	OpenAI
首次發布	2020年6月11日，5年前 (beta)
目前版本	2023年2月13日，2年前
原始碼庫	https://github.com/openai/gpt-3
前任	GPT-2
繼任	GPT-4
類型	大型語言模型; 基於轉換器的生成式預訓練模型; 基礎模型;
許可協定	專有
網站	openai.com/blog/openai-api

生成型預訓練變換模型 3 （英語：Generative Pre-trained Transformer 3，簡稱 GPT-3）是一個自迴歸語言模型，目的是為了使用深度學習生成人類可以理解的自然語言^[1]。GPT-3是由在舊金山的人工智慧公司OpenAI訓練與開發，模型設計基於谷歌開發的 Transformer 語言模型。GPT-3的神經網路包含1750億個參數，需要700GB來儲存^[2]。該模型在許多工上展示了強大的零樣本和少樣本的能力^[3]。

快速預覽 原作者, 首次發布 ...

OpenAI於2020年5月發表GPT-3的論文，在次月為少量公司與開發人團釋出應用程式介面的測試版。微軟在2020年9月22日宣布取得了GPT-3的獨家授權^[4]。

GPT-3被認為可寫出人類無法與電腦區別的文章與字串，GPT-3原始論文的作者們警告了GPT-3有可能對於社會的負面影響，比如利用製造假新聞的可能性。英國《衛報》即使用GPT-3生成了一個關於人工智慧對人類無威脅的評論專欄^[5]。李開復稱卷積神經網路與GPT-3為人工智慧重要的改善，兩者皆是模型加海量資料的成果^[6]。

[1]

[2]

[3]

[4]

[5]

[6]

GPT-3

背景

訓練和能力

迭代版本

GPT-3.5

GPT-3.5 Turbo

參見

參考資料

外部連結

Wikiwand - on