表徵學習

在機器學習中，特徵學習（feature learning）或表徵學習（representation learning）^[1]是學習一個特徵的技術的集合：將原始數據轉換成為能夠被機器學習來有效開發的一種形式。它避免了手動擷取特徵的麻煩，允許電腦學習使用特徵的同時，也學習如何擷取特徵：學習如何學習。

機器學習任務，例如分類問題，通常都要求輸入在數學上或者在計算上都非常便於處理，在這樣的前提下，特徵學習就應運而生了。然而，現實世界中的數據，例如圖片、影片，以及感測器的測量值都非常的複雜、冗長又多變，如何有效的擷取出特徵並且將其表達出來成為了一個重要挑戰。傳統的手動擷取特徵需要大量的人力並且依賴於非常專業的知識。同時，還不便於推廣。這就要求特徵學習技術的整體設計非常有效，自動化，並且易於推廣。

特徵學習可以被分為兩類：監督的和無監督的，類似於機器學習。

在監督特徵學習中，被標記過的數據被當做特徵用來學習。例如神經網絡，多層感知器，(監督)字典學習。
在無監督特徵學習中，未被標記過的數據被當做特徵用來學習。例如(無監督)字典學習，獨立成分分析，自動編碼，矩陣分解^[2] ，各種聚類分析及其變形^[3]^[4]^[5]。

[1]

[2]

[3]

[4]

[5]

表徵學習

監督特徵學習

監督字典學習

神經網絡

無監督特徵學習

κ-平均演算法

主成分分析

獨立成分分析

局部線性嵌入演算法

無監督字典學習

另見

參考文獻

Wikiwand - on