热门问题
时间线
聊天
视角

DeepSeek-R1

大語言模型 来自维基百科,自由的百科全书

Remove ads

DeepSeek-R1深度求索(DeepSeek)於2025年1月20日發佈的人工智能大型語言模型,專門適用於數學、編碼和邏輯等任務,性能對標OpenAI o1[1]

快速預覽 開發者, 首次發佈 ...

開發

快速預覽 開發者, 首次發佈 ...

DeepSeek-R1-Lite是深度求索於2024年11月20日發佈的人工智能大型語言模型,是深度求索第一個推理模型。專門適用於數學、編碼和邏輯等任務,性能對標OpenAI o1,DeepSeek-R1-Lite是Deepseek R1的預覽版。[2]DeepSeek稱該模型用了強化學習訓練,並為用戶展現了 o1 沒有公開的完整思考過程。而該模型關鍵特點就是便宜,與OpenAI o1的價格相差極大。Deepseek R1 Lite在回答問題前會花更多時間思考,因此準確度會增強。Deepseek的測試結果表明,在數學競賽上的得分與測驗所允許思考的長度緊密相關,而模型思維鍊長度增加展現了更高的效率。[2]

Deepseek-R1-Lite在數學、代碼和複雜邏輯推理上,獲得媲美 o1-preview 的推理效果。在美國數學邀請賽中DeepSeek 稱,該模型在美國邀請數學考試和 MATH 等既定基準上的表現超過了 OpenAI o1 Preview的水平,在國際數學奧林匹克正確率達到83%,它還在Codeforces編程競賽中優於89%的參賽者,但在GPQA Diamond,LiveCodeBench和自然語言解迷中較為遜色。[3]

DeepSeek-R1的論文中沒有公佈其訓練成本等細節。[4]不過此前的論文中,DeepSeek透露其訓練使用的是英偉達因為美國出口管制而針對中國市場特供的低配版GPU H800,訓練成本為557.6萬美元,遠低於類似西方公司的閉源模型。[1][5][6]外界預估R1的訓練成本也不會比DeepSeek-V3高多少,或在600萬美元上下。[7]

Remove ads

使用

DeepSeek-R1使用MIT協議開源,意味着任何人都可以自由使用該模型,包括商業用途。用戶可以在DeepSeek官方網站和App使用官方提供的服務。

DeepSeek-R1上線時提供的API服務定價為每百萬輸入tokens 1元人民幣(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元,輸出API價格僅僅只有OpenAI o1的3%。[8]

外界反應

1月27日,DeepSeek超越ChatGPT,登頂蘋果App Store美國區免費APP下載排行榜。[9]

DeepSeek-R1爆火,引發全球投資者大量拋售人工智能相關股票。1月27日,英偉達美股股價下跌近17%,單日市值蒸發5890億美元,為美國股市歷史上最大。[10][11]

DeepSeek-R1發佈後不久,Meta行政總裁馬克·扎克伯格就宣佈,Meta計劃在2025年投入超600億美元,加大對人工智能的投入。[7]據媒體1月27日報道,Meta成立了四個研究小組,專門研究DeepSeek的模型。[12]其中兩個小組研究其開發者如何降低訓練和運行DeepSeek的成本,第三個小組研究訓練模型可能使用了哪些數據,第四個小組研究基於DeepSeek模型屬性重構其LLaMA模型的新技術。[13]

OpenAI表示,其有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的開源模型,這違反了OpenAI的服務條款。[14]

現狀與替代方案

由於用戶量激增,DeepSeek R1曾面臨伺服器頻繁繁忙問題,主要歸因可能有多種,包括算力需求、帶寬限制及網絡攻擊。用戶可通過本地部署(如Ollama工具)、調用API或使用第三方平台。

參見

參考資料

外部連結

Loading content...
Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads