热门问题
时间线
聊天
视角
人工智慧熱潮
来自维基百科,自由的百科全书
Remove ads
人工智慧熱潮(英語:AI boom)又稱人工智慧之春(英語:AI spring[1]),指人工智慧領域的快速發展時期。該熱潮開始於2016年或2017年的OpenAI公司,生成式人工智慧為此次熱潮的重要組成部分。[2]OpenAI推出的生成式人工智慧系統,如2018年推出的各類GPT以及2021年推出的DALL-E,皆對此次發展起到了推波助瀾的作用。[3][4][5]
由於大型語言模型在2022年得到了提升,基於這一模型的聊天機器人得以成為現實。與此同時,文字到圖像生成模型所繪圖片與手工繪圖相比已經到了可以以假亂真的地步[6],而語音合成技術亦可成功的模仿人類講話。[7]
自2022年底至2023年間,隨著科技巨擘在市場上站穩腳跟,數十個新AI網站和AI聊天機器人上線,導致AI工具的普及率空前增加。[8]對於這一AI熱潮,民眾對此的反應可謂褒貶不一。有的人認為AI有助於開發人類潛力,為人類謀福祉。但有的人則認為AI會導致大量失業,並指出了目前的AI技術所存在諸多缺陷。[9][10][11][12]
Remove ads
語言模型
GPT-3是OpenAI於2020年發布的大型語言模型,該模型可以生成高品質的類人文字,其品質幾可亂真。[13]隨後OpenAI又發布了GPT-3.5版本,該版本被用於ChatGPT,因其能對多個領域的問題給出清晰回答而廣受關注。[14]隨後OpenAI又於2023年4月發布了GPT-4模型,目前該模型已被用於Microsoft Bing搜尋引擎。[15][16]除了OpenAI以外,還有其他多個公司皆發布了自己的語言模型,如谷歌發布的LaMDA模型以及Meta發布的LLaMA模型。
文字到圖像生成模型
OpenAI發布的DALL-E為首批受廣泛關注的文字到圖像生成模型之一,該模型發布於2021年1月。[17]隨後能夠生成更為逼真圖像的DALL-E 2於2022年4月發布,[18]而其開源替代版本Stable Diffusion則發布於2022年8月。[19]
繼文字到圖像生成模型之後,又湧現了多個受語言模型驅動的文字到影片生成模型,如DAMO、[20]Make-A-Video、[21]Imagen Video[22]以及Phenaki[23],這些模型可通過文字或文字/圖像提示自動生成影片。[24]
語音合成
15.ai是首批開放使用的語言合成軟體,該產品發布於2020年3月,能夠讓人們通過輸入音訊媒體的方式產生對其聲音的模仿。[25][26]隨後ElevenLabs推出了一個允許公眾上傳其聲音的網站,用於語音合成。不過由於該軟體能夠讓使用者模仿知名人士的聲音並利用此發布假聲名,ElevenLabs受到了各界譴責。[27]除此之外,這一技術引發了民眾對其應用於深度偽造的擔憂。[28]在有人利用語音合成技術對德雷克與威肯的聲音進行音樂創作後,不少民眾對該技術的合法性及道德提出了質疑。[29]
參考文獻
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads