热门问题
时间线
聊天
视角
DeepSeek-R1
大語言模型 来自维基百科,自由的百科全书
Remove ads
DeepSeek-R1是深度求索(DeepSeek)于2025年1月20日发布的人工智能大型语言模型,专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1[1]。
开发
DeepSeek-R1-Lite是深度求索于2024年11月20日发布的人工智能大型语言模型,是深度求索第一個推理模型。
訓練
DeepSeek-R1的论文中没有公布其训练成本等细节。[2]
不过此前的论文中,DeepSeek透露其训练使用的是英伟达因为美国出口管制而针对中国市场特供的低配版GPU H800,训练成本为557.6万美元,远低于类似西方公司的闭源模型。[1][3][4]
外界预估R1的训练成本也不会比DeepSeek-V3高多少,或在600万美元上下。[5]
特點
DeepSeek-R1-Lite专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1。DeepSeek-R1-Lite是Deepseek R1的預覽版。[6]
DeepSeek稱該模型用了強化學習訓練,並為用户展現了 o1 没有公开的完整思考过程。
Deepseek R1 Lite在回答問題前會花更多時間思考,因此準確度會增強。Deepseek的測試結果表明,在數學競賽上的得分與測驗所允許思考的長度緊密相關,而模型思維鍊長度增加展現了更高的效率。[6]
DeepSeek-R1關鍵特點就是便宜,與OpenAI o1的價格相差極大。DeepSeek-R1上线时提供的API服务定价为每百万输入tokens 1元人民幣(缓存命中)/4元(缓存未命中),每百万输出tokens 16元,输出API价格仅仅只有OpenAI o1的3%。[7]
測試成績
Deepseek-R1-Lite在數學、代碼和複雜邏輯推理上,獲得媲美 o1-preview 的推理效果。
在美国数学邀请赛中,DeepSeek 稱,該模型在美國邀請數學考試和 MATH 等既定基準上的表現超過了 OpenAI o1 Preview的水平,在國際數學奧林匹克正確率達到83%,
它還在Codeforces編程競賽中優於89%的參賽者,但在GPQA Diamond,LiveCodeBench和自然語言解迷中較為遜色。[8]
應用情況
DeepSeek-R1使用MIT协议开源,意味着任何人都可以自由使用该模型,包括商业用途。
用户可以在DeepSeek官方网站和App使用官方提供的服务。
2025年2月起,中国多地政府部门相继将DeepSeek接入政务服务系统,用于公文写作、政策解读等方面[9]。
2025年2月8日,广东省深圳市龙岗区政务服务和数据管理局就已经在政务外网部署了DeepSeek-R1模型。
2025年2月16日,深圳市正式为全市各区及各部门提供DeepSeek模型应用服务[10];其中,福田区基于DeepSeek开发了首批70名AI“数智员工”[11][12][13]。
香港生成式人工智能研發中心在DeepSeek的基礎上,開發HKGAI V1人工智能大語言開源基礎模型[15]。
HKGAI V1支援粵語、普通話及英語,將DeepSeek本地化、使用香港本地數據[16],全參數微調並持續訓練。
HKGAI V1涵蓋「港話通」、「港文通」、「港會通」、「港法通」、「港環通」等系統[17][18],當中的「港文通」為生成式人工智能文書輔助應用程式,在超過70個香港政府部門開始試用[19][20]。
創新科技及工業局局長孫東表示,期望「港話通」手機版應用程序在2025年内推出[21],並以此提供更有個性化的服務[22]。
2025年5月8日,廉政公署向公衆展出「深博士」(英語:Dr. Deep),廉署在DeepSeek的基礎上開發的人工智能模型[23],可提供廉署資訊及防貪建議[24],未來有機會在廉署的分區辦事處、網上或手機使用[25]。
瀋陽飛機設計研究所在研發新戰機的過程中,引入了DeepSeek[26]。
多家汽車製造商,包括BMW[27]、東風汽車、比亞迪、廣汽、零跑[28]、本田[29]、日產[30],宣佈與DeepSeek合作,將其AI系統和中國版汽車結合。
在2025年緬甸地震的救援行動中,中國國家緊急語言服務團與北京語言大學團隊基於DeepSeek的大模型,研發中緬英互譯系統,支援中國國際救援隊進行救災工作[31][32][33],並在未來開源與其他地區使用。
外界反应
1月27日,DeepSeek超越ChatGPT,登顶苹果App Store美国区免费APP下载排行榜。[34]
DeepSeek-R1爆火,引发全球投资者大量抛售人工智能相关股票。1月27日,英伟达美股股价下跌近17%,单日市值蒸发5890亿美元,为美国股市历史上最大。[35][36]
DeepSeek-R1发布后不久,Meta首席执行官马克·扎克伯格就宣布,Meta计划在2025年投入超600亿美元,加大对人工智能的投入。[5]据媒体1月27日报道,Meta成立了四个研究小组,专门研究DeepSeek的模型。[37]其中两个小组研究其开发者如何降低训练和运行DeepSeek的成本,第三个小组研究训练模型可能使用了哪些数据,第四个小组研究基于DeepSeek模型属性重构其LLaMA模型的新技术。[38]
OpenAI表示,其有证据表明DeepSeek使用OpenAI的专有模型来训练自己的开源模型,这违反了OpenAI的服务条款。[39]
Remove ads
现状与替代方案
由于用户量激增,DeepSeek R1曾面临服务器频繁繁忙问题,主要归因可能有多种,包括算力需求、带宽限制及网络攻击。用户可通过本地部署(如Ollama工具)、调用API或使用第三方平台。
参见
参考资料
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads