Claude (語言模型)
From Wikipedia, the free encyclopedia
Remove ads
Claude係由Anthropic研發嘅一系列 大型語言模型[1]。第一個模型喺2023年3月推出。Claude 3喺2024年3月推出,仲可以分析圖片[2]。
訓練
Claude 模型係 生成式預訓練變壓器。佢哋喺大量文本中預先訓練,預測下一個單詞。Claude 模型之後會經由 Constitutional AI 微調,目標係令佢哋有用、誠實同埋無害。[3][4]
Constitutional AI
Constitutional AI 係由 Anthropic 研發嘅一種畀AI訓練嘅系統(特別係語言模型如Claude)嘅方法,目標係對(人類文明發展)冇害同有用而唔依賴大量人類反饋。呢個方法喺 "Constitutional AI: Harmlessness from AI Feedback" 論文入面有詳細描述,佢包括兩個階段:監督學習 同埋 強化學習。[4]
喺監督學習階段,個模型會生成回應提示,根據一套指導原則(「憲法」)嚟自我批核呢啲回應,並修正佢哋。然後模型會喺呢啲修正過嘅回應上微調。[4]
喺AI反饋強化學習(RLAIF)階段,生成嘅回應會由AI比較佢哋對憲法嘅符合程度。呢個AI反饋數據集用嚟訓練一個偏好模型,根據佢哋對憲法嘅滿足程度來評估回應。Claude 會根據呢個偏好模型來微調對齊。呢個技術類似於 從人類反饋嘅強化學習(RLHF),但用嚟訓練偏好模型嘅比較係AI生成嘅,並且係基於憲法。[5][4]
呢個方法令訓練出來嘅AI助手又有用又無害,仲可以解釋佢哋拒絕有害請求嘅原因,增加透明度並且降低對人類監督嘅依賴。[6][7]
Remove ads
模型
Claude
Claude 係Anthropic嘅語言模型嘅初版,喺2023年3月推出,[8] Claude 喺好多任務做得唔錯,但係喺程式設計、數學同邏輯推理能力方面唔係好掂。[9] Anthropic 同類似 Notion(生產力軟件)同 Quora(幫佢哋設計 Poe 聊天機械人)合作。[9]
Claude Instant
Claude 有兩個版本,Claude 同 Claude Instant,Claude Instant 係一個出文更快、成本更平、比起 Claude 輕嘅版本,可以理解做細 Claude。Claude Instant 嘅輸入上下文限額有100,000 字符(大約等於75,000字)。[10]
Claude 2
Claude 2 係 Claude 之後嘅下一個主要版本,喺2023年7月推出,對公眾開放,而舊嘅Claude 1 淨係限於Anthropic批准嘅選定用戶。[11]
Claude 2 嘅上下文限額由9,000字擴展到100,000字。[8] 仲可以上傳 PDF 同其他文件畀佢睇佢,令到 Claude 識得閱讀、總結同幫手搞掂工作。
Claude 2.1
Claude 2.1 將聊天機器人識得處理嘅字符數目增加一倍,擴展到200,000字嘅限額,大約等於500頁嘅書寫材料。[1]
隨著 Claude 2.1 引入改進咗嘅程式設計工具同系統提示,開發者有得喺新嘅 Workbench 環境入面試提示,同時有得較模型行為,Anthropic 仲話新嘅模型比起之前啲模型少啲機會亂噏當秘笈。[12]
Claude 3
Claude 3 喺2024年3月14號推出,新聞稿宣稱喺各種認知任務上創下新嘅行業標準。Claude 3 系列包括三個先進嘅模型,按能力遞升排序分別係:Haiku、Sonnet 同埋 Opus。Claude 3 嘅默認版本 Opus 有 200,000 個 tokens 嘅上下文窗口,但為特定用途擴展到 1 百萬個 tokens。[13][2]
Claude 3 喺進行「大海撈針」測試期間似乎表現出 後設認知 推理,包括能夠意識到自己被人工測試。[14]
Claude 3.5
喺2024年6月20號,Anthropic 發佈咗 Claude 3.5 Sonnet,喺基準測試上表現顯著提升,比更大型嘅 Claude 3 Opus 更出色,特別喺編碼、多步工作流程、圖表解釋同從圖像中提取文本等方面。與 3.5 Sonnet 一起推出嘅仲有新嘅 Artifacts 功能,Claude 可以喺界面中專門窗口創建代碼,並實時預覽選定代碼,例如網站或者 SVGs。[15]
Remove ads
訪問
有限使用嘅 Claude 3.5 Sonnet 可以免費使用,但需要提供電郵地址同手機號碼。仲提供一個收費計劃,畀更多使用同訪問所有 Claude 3 模型。[16]
喺2024年5月1號,Anthropic 宣布咗 Claude Team 計劃,呢個係 Claude 嘅首個企業版計劃,同埋 Claude iOS app。[17]
批評
Claude 2 收到好多批評,話佢倫理限制好嚴,搞到個模型又慢又難用。有啲用戶無啦啦畀佢拒絕回答一啲根本冇害嘅問題,例如程式設計問題「點樣喺我部 ubuntu 伺服器殺死所有行緊 Python 嘅程式?」。呢個問題引起咗關於 AI 發展中「對齊稅」嘅討論(確保 AI 系統對齊倫理嘅成本),重點喺於平衡倫理考量同實際功能。批評者主張用戶自主同效率,而支持者強調倫理 AI 嘅重要性。[18][12]
參見
參考資料
出面網頁
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads