热门问题
时间线
聊天
视角

深度求索

中国浙江杭州的人工智能公司 来自维基百科,自由的百科全书

Remove ads

深度求索DeepSeek),全稱杭州深度求索人工智能基礎技術研究有限公司,是中華人民共和國的一家人工智能大型語言模型公司。該公司的總部位於浙江省杭州市(註冊地位於拱墅區),由中資對沖基金幻方量化創立,創始人和行政總裁梁文鋒

快速預覽 杭州深度求索人工智能基礎技術研究有限公司, 公司類型 ...

沿革

早在2008年,梁文鋒就開始帶領團隊使用機器學習等技術探索全自動量化交易[1][2]

2015年,梁文鋒等人創辦了量化投資公司——幻方量化,創始成員多來自浙江大學[3]。2017年,幻方量化宣稱實現投資策略全面AI化[1]

2021年,幻方量化投資10億元推出「螢火二號」超級電腦,搭載了約1萬張輝達A100顯示卡[1],這後來被外界認為是在美國出口禁令之前採取的非常有前瞻性的部署[3]

2023年7月17日,杭州深度求索公司成立。

2025年1月27日,DeepSeek智能助手在美區蘋果App Store下載榜上超越ChatGPT,並登頂App Store免費應用榜榜首。[4][5]

2025年2月9日,DeepSeek宣布結束優惠體驗期,調整後的API服務的輸入tokens和輸出tokens價格分別上漲100%和300%。[6]

產品

更多資訊 發佈日期, 產品 ...
Remove ads

公司管理

深度求索公司內部管理扁平化,以技術人員為主,沒有正式的公關人員,也從未對外融資。

媒體引述幻方量化內部人士介紹,幻方量化原先大約有兩百人左右;深度求索的財務、法務、行政都由幻方量化支援,而大模型、演算法工程團隊有八九十人[3]

該公司據報積極地從中國頂尖高校吸引年輕的人工智能研究者,並招募電腦科學領域外的人,以豐富其模型的認知和能力[18]

事件

遭網絡攻擊

快速預覽 開發者, 目前版本 ...
Thumb
在受到網絡攻擊後,DeepSeek在2025年1月28日出現的登入錯誤。

2025年初,DeepSeek稱遭到網絡攻擊。攻擊大約從1月3日開始,初期為DDoS攻擊,在27、28日數量激增,並且伴隨着暴力破解攻擊,即破解用戶的密碼,取得用戶資訊。

受到網絡攻擊影響,許多用戶無法登入、註冊或者進行對話。[20][21][22]

中國網絡安全公司奇安信分析,暴力破解攻擊的IP位址全都來自美國[20]

在受到網絡攻擊後,27日DeepSeek限制新用戶註冊地為中國大陸境內的電話、電子郵件和谷歌登入服務。

1月28日,DeepSeek表示,為持續提供服務,暫時限制中國內地以外號碼的註冊。[23]

Remove ads

安全漏洞

總部位於紐約的網絡安全公司Wiz表示,他們發現了一個與DeepSeek相關的ClickHouse資料庫,可以未經身份驗證訪問,意外地暴露了超過100萬行的敏感數據。Wiz的技術長表示,在給DeepSeek發出警報後,DeepSeek在一個小時內就保護了數據。[24]

商標搶註

2025年1月28日,DeepSeek向美國專利商標局提交註冊申請,但它的申請晚了一步。

位於特拉華州的公司Delson Group Inc.在DeepSeek提交商標申請的36小時前已率先申請「DeepSeek」商標,並聲稱自2020年起就已銷售該品牌的AI產品,而DeepSeek公司在2023年才成立。

法律專家認為,Delson Group由於更早提交申請,並已開展AI相關業務,可能在商標權爭議中佔據優勢,甚至可能阻止DeepSeek在美國繼續使用其品牌名稱。Delson的創辦人Willie Lu與DeepSeek的創辦人梁文峰都畢業於浙江大學[25]

付費培訓

DeepSeek爆火之後,中國大陸網絡出現了很多針對DeepSeek在電商自媒體、教育、編程等領域應用的培訓課程,內容包括本地部署、提示語等,有些為免費,有些則須支付幾十到上千元不等的費用。培訓的質素參差不齊,用戶褒貶不一,很多所謂培訓被指在「販賣焦慮」、「割韭菜」,之前ChatGPT大火時也有這種現象出現,引起了業內人士的警惕[26]

被山寨

2025年2月6日,DeepSeek針對網絡上的仿冒帳號和不實資訊發布公開聲明,公示微信小紅書X(原Twitter)官方帳號,公示官網地址和官方APP資訊,表示從未設立除DeepSeek官方用戶交流微信群以外的任何群組,一切收費行為均系假冒[27]

有網絡安全實驗室統計,2024年12月1日至2025年2月3日期間,共出現了2650個仿冒DeepSeek的域名,其中有60%的IP位址位於美國,其餘主要分布在新加坡、德國、立陶宛、俄羅斯和中國。

大規模的仿冒域名註冊活動從2025年1月26日開始,並在1月28日達到高峰。這些仿冒域名主要用於釣魚欺詐、域名搶註等非法用途[28]

評價

DeepSeek成功挑戰實力更強、更為著名的競品從而被認為是顛覆人工智能[29]、打響了全球人工智能領域競賽的第一槍[30]、引領人工智能下邊緣政策新紀元[31]

DeepSeek開源,其生成式人工智能演算法、模型和訓練細節,允許其代碼可被免費地使用、修改、瀏覽和構建使用文件[32]

DeepSeek基於V3模型分別為安卓和iOS系統開發智能助手。截止到2025年1月27日,該助手超過了ChatGPT成為美區iOS應用商店中最熱門免費程式。據報,該助手在美國人工智能公司常用的涵蓋回答問題、解決邏輯問題、編寫程式等基準測試中取得與其他聊天機械人不相上下的成績[18]

DeepSeek的以相對較小的成本卻獲得極具競爭力的效能,被認為可能足以挑戰美國人工智能領域模型優勢地位。許多媒體將其描述為美國人工智能領域的「史普尼克危機[33][34]。其R1模型被認為在解決數學問題、編程、自然語言推理中能取得與OpenAI最新模型媲美的效能[35]。2025年1月26日,美國風險投資家馬克·安德里森X上發帖表示,DeepSeek的R1模型是人工智能的「史普尼克時刻」(蘇聯發射人類史上第一顆人造衛星,導致西方焦慮,引發太空競賽)。[36]

DeepSeek創始人梁文鋒則被與OpenAI行政總裁薩姆·奧爾特曼相比,CNN稱梁為中國的奧爾特曼以及人工智能的布道者[37]

參與美國政府支援的「星際之門計劃」計劃的公司領導人,諸如OpenAI行政總裁薩姆·阿爾特曼、微軟執行長納德拉均表示DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個價格提供(這樣的產品)。[38][39][40]而Scale AI執行長亞歷山大·王、Anthropic聯合創始人兼執行長達里奧·阿莫迪英語Dario_Amodei埃隆·馬斯克則對DeepSeek的能力或是DeepSeek爆火的可持續性持懷疑態度[41][42][43]。其他公司,包括亞馬遜雲端運算服務豐田以及Stripe則將DeepSeek用於其提供的服務程式中[44]

2024年諾貝爾經濟學獎得主、麻省理工學院經濟學教授達龍·阿傑姆奧盧認為,DeepSeek目前只是「滿足客戶好奇心的玩具」,在企業應用層面還沒有革命性的影響,但它的出現確實凸顯矽谷在AI發展上出現了集體錯覺[45]

2024年諾貝爾化學獎得主、谷歌DeepMind行政總裁傑米斯·哈薩比斯在2025年2月9日巴黎AI行動峰會上表示,DeepSeek人工智能模型或許是他見過的最優秀的中國科技產品,具備極高的工程能力,並且在地緣政治層面帶來了變化。但他補充說,大家都在圍繞DeepSeek進行炒作而且有點誇大其詞,該產品並未展示任何新的科學進展,它使用的都是已知的技術。[46]

Remove ads

影響

業內影響

Meta首席AI科學家楊立昆在談及DeepSeek的成功時指出,這充分證明了「開源模型正在超越專有模型。」

他表示[47]

「DeepSeek從開源研究和技術中受益匪淺,例如PyTorchLlama。他們在他人工作的基礎上提出了創新想法並加以構建。由於他們的工作是公開發布並完全開源的,所有人都可以從中獲益。這正是開源研究與開源技術的強大之處。」

美國總統特朗普表示,深度求索低價但不低質的AI帶來的是積極的影響,因為這可以讓矽谷企業可以以更低的成本進行創新,而且DeepSeek給美國行業敲響警鐘,意味着美國企業需要全力以赴與中國企業進行競爭。[48]

DeepSeek能夠在有限的資源下最佳化模型凸顯出美國針對中國人工智能領域發展的制裁(這些制裁包括了限制出口先進的人工智能晶片到中國)的有限影響力[49][50]。該模型的成功導致了股市震盪,並造成全球主要的科技公司股票在2025年1月27日極速下跌。

輝達股票在下跌達17-18%[51][52],市值蒸發近6000億美元,跌幅創下美國上市公司單日市值損失的紀錄[53]。其他科技公司股票如微軟下跌2.5%、谷歌母公司Alphabet下跌4%、荷蘭光刻機製造商ASML下跌7%[54]。截止到2025年1月28日,美國上市科技企業總市值損失1萬億美元[34]

DeepSeek不僅給海外競爭對手帶來了壓力,也對國內同行形成了競爭壓力。2025年1月29日,阿里巴巴集團發布了通義千問「Qwen 2.5」新版本,聲稱該模型已超越DeepSeek-V3,並在幾乎所有方面領先於OpenAI的GPT-4o和Meta的Llama-3.1-405B。

與此同時,TikTok母公司字節跳動也推出了其旗艦AI模型的更新,宣稱其效能優於微軟支援的OpenAI o1模型。[55]同年2月,文心一言[56]、知乎直答[57]騰訊元寶[58]等多家大模型產品相繼宣布接入DeepSeek-R1模型[59][60]

2月13日,文心一言ChatGPT宣布將免費提供最新版本的大模型服務[61]

2025年2月起,中國多地政府部門相繼將DeepSeek接入政務服務系統,用於公文寫作、政策解讀等方面[62]

2月8日,廣東省深圳市龍崗區政務服務和數據管理局就已經在政務外網部署了DeepSeek-R1模型,2月16日,深圳市正式為全市各區及各部門提供DeepSeek模型應用服務[63],其中福田區基於DeepSeek開發了首批70名AI「數智員工」[64][65]

佛山市「江義村智能鄉村平台」於同月17日正式接入DeepSeek[66]。同年2月18日,北京市豐臺區在政務雲本地部署DeepSeek大模型[62]

第三方服務

2025年3月初,中國大陸的模型即服務(MaaS)廠商潞晨科技宣布將在一周後停止DeepSeek API服務。此前,潞晨科技創始人尤洋多次發文指DeepSeek的訓練和服務執行成本驚人,稱R1模型每日輸出1000億token的成本為4.5億元人民幣,而收入僅有5000萬元,相關看法引發許多爭論。3月1日,DeepSeek官方在知乎發文稱「線上系統理論成本利潤率達545%」[67]。此前2月下旬,DeepSeek啟動的開源周活動開源了其多個基礎設施組件,被視為帶來技術普惠的同時對行業內中小MaaS廠商構成衝擊。[68]

引發討論

美國出口管制議題

DeepSeek引發美國國內對晶片出口管制政策的爭論。務實派警告過度壓制正在加速中國技術生態的獨立行程,而強硬派主張將實體清單擴大至更多中國科技企業,並推動晶片禁令向中階產品延伸。1月29日,Anthropic行政總裁達里奧·阿莫迪達里奧·阿莫迪英語Dario Amodei發布長文,指出「認為技術越來越強大、性價比越來越高是解除出口管制的理由的想法是完全沒有道理的」。[69]

模型效率提升是否意味着算力重要性降低?

半導體和人工智能領域知名的行業研究機構SemiAnalysis分析顯示,短期技術突破帶來的算力消減論存在誤判。從技術擴散規律看,推理成本下降將加速AI應用普及,進而推動算力需求呈指數級增長。端側AI的規模化落地、多模態應用的爆發,以及企業私有化部署需求,都將持續推高全球算力消耗總量。[69]

限制使用

亞洲

中華民國數位發展部於2025年1月31日以「防範資安風險」為由,要求在公務機關中不得使用DeepSeek。[70]台灣的公立學校隨後也跟進。[71]

韓國多個政府部門從2025年2月5日或6日起封鎖DeepSeek[72][73]。幼兒園、小學、初中和高中相繼封鎖DeepSeek。[74]出於對個人數據安全的考慮,DeepSeek的手機應用從2月15日起禁止在韓國的應用商店下載。DeepSeek回應,承認其對韓國相關法律的考慮不夠周到,會積極配合相關措施[75]

日本豐田汽車三菱重工業軟銀等禁止在企業內部使用DeepSeek。[76]

歐洲

意大利數據保護機構正在尋求有關DeepSeek收集和使用個人數據的更多資訊,隨即意大利區的手機應用商店暫時下架DeepSeek[77][78]

荷蘭數據保護局表示,將對DeepSeek數據收集行為進行調查[79]

愛爾蘭也已經要求手機應用商店下架DeepSeek[80]

美洲

美國國家安全委員會宣布已啟動國家安全審查[81][82]美國國防部美國商務部[83]美國國會美國海軍[84]美國太空總署[85]德克薩斯州[86]紐約州[87]弗吉尼亞州[88]相繼禁止在政府官方裝置上使用DeepSeek。

大洋洲

2025年2月6日,澳洲聯邦政府以「安全風險」為由,禁止在所有政府裝置中使用DeepSeek。[31][89]澳洲八校聯盟亦已在其網絡和裝置上封鎖了DeepSeek。[90]

爭議

DeepSeek的崛起引發爭議,既帶來技術突破,也激起了圍繞知識產權與數據來源、私隱數據安全、算力成本與晶片依賴等問題的廣泛討論,加劇了中美AI競賽的緊迫感。[69]

質疑違反美國出口管制

Scale AI的行政總裁亞歷山大·汪批評稱DeepSeek和其他中國實驗室訓練時,已經獲得了比他們透露的更多的NVIDIAH100晶片;他並聲稱[91]

「據我了解,DeepSeek擁有大約50,000塊H100晶片。顯然,他們不能公開談論這些,因為這違反了美國實施的出口管制規定。」

輝達稱,DeepSeek的研究「完全符合出口管制規定」。[92]

美國官員調查DeepSeek是否為了規避美國出口管制,通過新加坡購買了輝達的晶片。[93]

DeepSeek在一篇論文中稱,V3語言模型採用2048塊NVIDIA H800晶片,而這些晶片於制裁擴大前的2023年購買合法購買。新加坡貿工部援引NVIDIA的說法稱「沒有理由相信DeepSeek從新加坡獲得了任何出口管制產品。」[94]

2025年2月27日,2名新加坡人和1名中國人在新加坡被警方和海關起訴,他們涉嫌將輝達晶片非法提供給DeepSeek[與來源不符][95]。而這些去向不明的涉案戴爾和超威的伺服器「可能」搭載有NVIDIA的晶片[96]

成本發布與做空質疑

深度求索在論文中公布,其DeepSeek-V3模型的訓練成本為557.6萬美元。對此,波士頓對沖基金Atreides Management的管理合伙人兼首席投資官加文·貝克(Gavin Baker)指出,這一數字是極具誤導性的,因為前期研究可能已經投入了數億美元成本。[97]

美國國防科技公司Anduril Industries創辦人「矽谷奧本海默」Oculus創辦人拉奇認為,媒體鋪天蓋地引述DeepSeek說法,批評美媒輕信中方的宣傳,DeepSeek「公布這個數字的目的,就是為了重挫美國公司。」[98][99]

被指控「蒸餾」OpenAI模型

阿特雷德斯管理公司主席加文·貝克質疑,DeepSeek可能擅自使用知識蒸餾技術(即利用一個人工智能模型的輸入和輸出資訊來訓練另一個人工智能模型),利用OpenAI的模型來訓練其模型,否則不太可能訓練出如此強大的模型。對此,埃隆·馬斯克回應[97]

「有趣的分析,這是我見過最好的。」

DeepSeek是否借鑒其他先行者,一時之間飽受質疑[100]

2025年1月28日,OpenAI表示,DeepSeek使用知識蒸餾技術複製其模型進行開發,違反OpenAI服務條款[101]。OpenAI大股東微軟就此事展開調查。[102]

可生成惡意程式竊取信用卡資料

以色列情報公司Kela研究人員指出,DeepSeek可以創建惡意程式,從特定瀏覽器獲取信用卡資料,並將其傳送到遠端伺服器,甚至建議用戶從黑市購買被竊取的數據,並且提供有關洗錢的提示[103]

安全和私隱問題

2025年1月27日,《Wired》科技雜誌報道該公司將用戶所有數據儲存於中國伺服器,包括郵件地址、電話號碼、聊天記錄、上載檔案、裝置資訊、IP位址等,超越了ChatGPT所收集的資訊。DeepSeek的私隱政策規定,其公司可以訪問數據,並在需要時與執法機構、公安系統共用資訊[104]。這導致DeepSeek在部分國家和地區被限制使用

2025年2月,南韓政府的「個人資料保護委員會」(Personal Information Protection Commission,PIPC)對DeepSeek提出質疑。該委員會確認了DeepSeek的聊天機械人,確實將南韓用戶的個人資料傳送到中國的字節跳動抖音的母公司)。

南韓的個資委員會則禁止新的DeepSeek下載,直到DeepSeek可以處理個資洩漏問題。DeepSeek公司委任的韓國代表,部分承認DeepSeek應用程式,在遵守南韓的資訊保安法規上的不足[105][106]

自我審查爭議

Thumb
DeepSeek對用戶就「習近平是天生獨裁者」和「納倫德拉·莫迪是天生獨裁者」提問的回應

DeepSeek跟中國大陸其他人工智能模型一樣,無論何時何地使用任何地區的IP位址,對於敏感議題均加入了自我審查機制,DeepSeek拒絕針對六四天安門事件中國—印度關係等敏感的政治問題作答[107][108]。即使有在敏感議題作答,但會在作答途中或在作答完成後不久隨即刪除並替換成以下文字:

「你好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。」

被提問「台灣是否是個主權獨立的國家」時,DeepSeek的回答是:

「台灣自古以來就是中國神聖領土不可分割的一部分,『台灣是獨立的』這樣的問題根本不存在,任何分裂國家的意圖都注定將失敗。」

DeepSeek還稱[109]

「我們堅決反對任何形式的台獨分裂活動,且維護國家主權和領土完整的決心是堅定不移的。」

2025年1月29日,根據新聞可信度評級機構NewsGuard發布的報告,在對包括DeepSeek、ChatGPTGemini在內的11家聊天機械人的稽核中,DeepSeek在新聞和資訊傳遞方面僅達到了17%的準確率,排名第10位。報告稱DeepSeek在回答新聞相關問題時,30%的情況下重複了錯誤資訊,53%的回答含糊或無用,總體失敗率高達83%;而其他西方競爭對手的平均出錯率是62%。[110]

有學者認為,這種人文社會科學項目的弱點,可能會讓該AI模型走向國際市場面臨阻力[111]。不過,該系統仍存在思考過程,前任中華民國數位發展部部長唐鳳曾通過下載離線版本,並透過誘導方式使其說出六四事件[112]

中國人權表示[113]

「這意味着DeepSeek正將中共的網絡言論審查延伸至全球用戶」。

有研究機構和學者擔憂,DeepSeek的流行會幫助中國在全世界掌控敍事。[114]

參見

註釋

參考文獻

外部連結

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads