Claude (語言模型)

Claude

開發者	Anthropic
初始版本	2023年3月，2年之前 (2023-03)
最新發布	Claude Sonnet 4.5（2025年9月29號）^[1]
軟件類別	大型語言模型 GPT 基礎模型
許可協議	專有
網站	claude.ai

訓練

Claude 模型係生成式預訓練變壓器。佢哋喺大量文本中預先訓練，預測下一個單詞。Claude 模型之後會經由 Constitutional AI 微調，目標係令佢哋有用、誠實同埋無害。^[4]^[5]

Constitutional AI

Constitutional AI 係由 Anthropic 研發嘅一種畀AI訓練嘅系統（特別係語言模型如Claude）嘅方法，目標係對（人類文明發展）冇害同有用而唔依賴大量人類反饋。呢個方法喺 "Constitutional AI: Harmlessness from AI Feedback" 論文入面有詳細描述，佢包括兩個階段：監督學習同埋強化學習。^[5]

喺監督學習階段，個模型會生成回應提示，根據一套指導原則（「憲法」）嚟自我批核呢啲回應，並修正佢哋。然後模型會喺呢啲修正過嘅回應上微調。^[5]

喺AI反饋強化學習（RLAIF）階段，生成嘅回應會由AI比較佢哋對憲法嘅符合程度。呢個AI反饋數據集用嚟訓練一個偏好模型，根據佢哋對憲法嘅滿足程度來評估回應。Claude 會根據呢個偏好模型來微調對齊。呢個技術類似於從人類反饋嘅強化學習（RLHF），但用嚟訓練偏好模型嘅比較係AI生成嘅，並且係基於憲法。^[6]^[5]

呢個方法令訓練出來嘅AI助手又有用又無害，仲可以解釋佢哋拒絕有害請求嘅原因，增加透明度並且降低對人類監督嘅依賴。^[7]^[8]

Claude 嘅「憲法」包括75個重點，仲包括聯合國世界人權宣言嘅部分內容。^[7]^[4]

Remove ads

模型

Claude

Claude 係Anthropic嘅語言模型嘅初版，喺2023年3月推出，^[9] Claude 喺好多任務做得唔錯，但係喺程式設計、數學同邏輯推理能力方面唔係好掂。^[10] Anthropic 同類似 Notion（生產力軟件）同 Quora（幫佢哋設計 Poe 聊天機械人）合作。^[10]

Claude Instant

Claude 有兩個版本，Claude 同 Claude Instant，Claude Instant 係一個出文更快、成本更平、比起 Claude 輕嘅版本，可以理解做細 Claude。Claude Instant 嘅輸入上下文限額有100,000 字符（大約等於75,000字）。^[11]

Claude 2

Claude 2 係 Claude 之後嘅下一個主要版本，喺2023年7月推出，對公眾開放，而舊嘅Claude 1 淨係限於Anthropic批准嘅選定用戶。^[12]

Claude 2 嘅上下文限額由9,000字擴展到100,000字。^[9] 仲可以上傳 PDF 同其他文件畀佢睇佢，令到 Claude 識得閱讀、總結同幫手搞掂工作。

Claude 2.1

Claude 2.1 將聊天機器人識得處理嘅字符數目增加一倍，擴展到200,000字嘅限額，大約等於500頁嘅書寫材料。^[2]

隨著 Claude 2.1 引入改進咗嘅程式設計工具同系統提示，開發者有得喺新嘅 Workbench 環境入面試提示，同時有得較模型行為，Anthropic 仲話新嘅模型比起之前啲模型少啲機會亂噏當秘笈。^[13]

Claude 3

Claude 3 喺2024年3月14號推出，新聞稿宣稱喺各種認知任務上創下新嘅行業標準。Claude 3 系列包括三個先進嘅模型，按能力遞升排序分別係：Haiku、Sonnet 同埋 Opus。Claude 3 嘅默認版本 Opus 有 200,000 個 tokens 嘅上下文窗口，但為特定用途擴展到 1 百萬個 tokens。^[14]^[3]

Claude 3 喺進行「大海撈針」測試期間似乎表現出後設認知推理，包括能夠意識到自己被人工測試。^[15]

Claude 3.5

喺2024年6月20號，Anthropic 發佈咗 Claude 3.5 Sonnet，喺基準測試上表現顯著提升，比更大型嘅 Claude 3 Opus 更出色，特別喺編碼、多步工作流程、圖表解釋同從圖像中提取文本等方面。與 3.5 Sonnet 一起推出嘅仲有新嘅 Artifacts 功能，Claude 可以喺界面中專門窗口創建代碼，並實時預覽選定代碼，例如網站或者 SVGs。^[16]

Remove ads

訪問

有限使用嘅 Claude 3.5 Sonnet 可以免費使用，但需要提供電郵地址同手機號碼。仲提供一個收費計劃，畀更多使用同訪問所有 Claude 3 模型。^[17]

喺2024年5月1號，Anthropic 宣布咗 Claude Team 計劃，呢個係 Claude 嘅首個企業版計劃，同埋 Claude iOS app。^[18]

批評

Claude 2 收到好多批評，話佢倫理限制好嚴，搞到個模型又慢又難用。有啲用戶無啦啦畀佢拒絕回答一啲根本冇害嘅問題，例如程式設計問題「點樣喺我部 ubuntu 伺服器殺死所有行緊 Python 嘅程式？」。呢個問題引起咗關於 AI 發展中「對齊稅」嘅討論（確保 AI 系統對齊倫理嘅成本），重點喺於平衡倫理考量同實際功能。批評者主張用戶自主同效率，而支持者強調倫理 AI 嘅重要性。^[19]^[13]