核方法

動機與非正式解釋

核方法可被視為循例學習器：不是學習與輸入特徵相對應的固定參數集，而是「記憶」第 $i$ 個訓練樣本 $(\mathbf {x} _{i},y_{i})$ 並學習相應權 $w_{i}$ 。預測不在訓練集中的輸入（未標記輸入）是用未標記輸入 $\mathbf {x'}$ 與每個訓練輸入 $\mathbf {x} _{i}$ 的相似性函數 $k$ （稱作核）。例如，核化二分分類器通常計算相似度的加權和

{\hat {y}}=\operatorname {sgn} \sum _{i=1}^{n}w_{i}y_{i}k(\mathbf {x} _{i},\mathbf {x'} )

其中

${\hat {y}}\in \{-1,+1\}$ 是核化二分分類器對無標輸入 $\mathbf {x'}$ 的預測標籤，其隱藏的真實標籤 $y$ 是我們感興趣的；
$k\colon {\mathcal {X}}\times {\mathcal {X}}\to \mathbb {R}$ 是核函數，度量了任意一對輸入 $\mathbf {x} ,\mathbf {x'} \in {\mathcal {X}}$ 的相似性；
和的範圍是分類器訓練集中的n個有標範例 $\{(\mathbf {x} _{i},y_{i})\}_{i=1}^{n}\ (y_{i}\in \{-1,+1\})$ ；
$w_{i}\in \mathbb {R}$ 是由學習演算法確定的訓練樣本的權重；
符號函數 $\operatorname {sgn}$ 決定預測分類結果 ${\hat {y}}$ 屬於正類還是負類。

核分類器的描述可追溯至1960年代核感知器的發明。^[3]1990年代，隨着支持向量機（SVM）的流行，人們發現其在手寫辨識等任務上的表現可與神經網絡媲美。

Remove ads

數學：核技巧

核技巧避免了讓線性學習演算法學習非線性函數或決策邊界所需的顯式對映。 $\forall \mathbf {x}$ 與 $\mathbf {x'} \in {\mathcal {X}}$ （輸入空間），某些函數 $k(\mathbf {x} ,\mathbf {x'} )$ 可表示為另一空間 ${\mathcal {V}}$ 中的內積。函數 $k\colon {\mathcal {X}}\times {\mathcal {X}}\to \mathbb {R}$ 常被稱為核或核函數。「核」在數學中用於表示加權和或積分的加權函數。機器學習中某些問題比任意權函數 $k$ 更具結構性。若核能寫成「特徵對映」 $\varphi \colon {\mathcal {X}}\to {\mathcal {V}}$ ，滿足

k(\mathbf {x} ,\mathbf {x'} )=\langle \varphi (\mathbf {x} ),\varphi (\mathbf {x'} )\rangle _{\mathcal {V}}

那麼計算就能簡化很多。關鍵的約束是 $\langle \cdot ,\cdot \rangle _{\mathcal {V}}$ 必須是適當的內積。另一方面，只要 ${\mathcal {V}}$ 是內積空間，就不必明確表示出 $\varphi$ 。另一種方法來自默瑟定理：只要空間 ${\mathcal {X}}$ 匹配了合適的測度確保函數 $k$ 滿足默瑟條件，就存在隱定義的函數 $\varphi$ 。

默瑟定理類似於線性代數中將內積與任意正定矩陣相關聯的結果的推廣。實際上，默瑟條件可以簡化為這種更簡單的情況：若 $\forall T\subset X$ 擇計數測度 $\mu (T)=|T|$ （計算集合 $T$ 內部的點數），那麼默瑟定理中的積分就簡化為和式

\sum _{i=1}^{n}\sum _{j=1}^{n}k(\mathbf {x} _{i},\mathbf {x} _{j})c_{i}c_{j}\geq 0.

若對於 ${\mathcal {X}}$ 中的所有有限點序列 $(\mathbf {x} _{1},\dotsc ,\mathbf {x} _{n})$ 及所有 $n$ 個實值係數選擇 $(c_{1},\dots ,c_{n})$ （參考正定核），和式都成立，那麼函數 $k$ 滿足默瑟條件。

一些依賴於原空間 ${\mathcal {X}}$ 中任意關係的演算法在別的環境中會有線性解釋： $\varphi$ 的範圍空間。線性解釋讓我們對演算法有了更深入的了解。此外，在計算過程中通常無需直接計算 $\varphi$ ，支持向量機就是這樣。有人認為這種執行時間上的節省是其主要優點。研究人員也用它來證明現有演算法的意義和特性。

理論上講，關於 $\{\mathbf {x} _{1},\dotsc ,\mathbf {x} _{n}\}$ 的格拉姆矩陣 $\mathbf {K} \in \mathbb {R} ^{n\times n}$ （有時也稱為「核矩陣」^[4]），其中 $K_{ij}=k(\mathbf {x} _{i},\mathbf {x} _{j})$ 須是正半定（PSD）矩陣。根據經驗，對於機器學習的啟發式方法來說，若 $k$ 至少近似於相似性的直觀概念，那麼不滿足默瑟條件的函數 $k$ 的選擇可能仍有合理表現。^[5]無論 $k$ 是不是默瑟核， $k$ 仍可稱為「核」。

若核函數 $k$ 也是高斯過程中使用的協方差函數，那麼格拉姆矩陣 $\mathbf {K}$ 也可稱為協方差矩陣。^[6]

Remove ads

動機與非正式解釋

數學：核技巧

應用

常用核函數

另見

參考文獻

閱讀更多

外部連結

Wikiwand - on