深度學習
机器学习的研究分支 / 維基百科,自由的 encyclopedia
深度學習(英語:deep learning)是機器學習的分支,是一種以人工神經網路為架構,對資料進行表徵學習的演算法。[1][2][3][4][5] 深度學習中的形容詞「深度」是指在網絡中使用多層。 早期的工作表明,線性感知器不能成為通用分類器,但具有非多項式啟用功能和一個無限寬度隱藏層的網絡可以成為通用分類器。
深度學習是機器學習中一種基於對數據進行表徵學習的演算法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,人面辨識或面部表情辨識[6])。深度學習的好處是用非監督式或半監督式(英語:Semi-supervised learning)的特徵學習和分層特徵提取高效演算法來替代手工取得特徵。[7]
表徵學習的目標是尋求更好的表示方法並建立更好的模型來從大規模未標記數據中學習這些表示方法。表示方法來自神經科學,並鬆散地建立在類似神經系統中的資訊處理和對通訊模式的理解上,如神經編碼,試圖定義拉動神經元的反應之間的關係以及大腦中的神經元的電活動之間的關係。[8]
至今已有數種深度學習框架,如深度神經網絡、卷積神經網絡和深度置信網絡(英語:Deep belief network)和迴圈神經網絡已被應用在電腦視覺、語音辨識、自然語言處理、音頻辨識與生物資訊科學等領域並取得了極好的效果。