AlphaGo
由谷歌DeepMind開發,專門用來下圍棋的計算機程序 / 維基百科,自由的 encyclopedia
AlphaGo(「Go」為日文「碁」字發音轉寫,是圍棋的西方名稱),直譯為阿爾法圍棋,在英語不流通的華語社會亦被音譯為阿爾法狗[1][2]、阿法狗[3]、阿發狗[4][5]等,是於2014年開始由英國倫敦Google DeepMind開發的人工智能圍棋軟件。2017年,關於AlphaGo的電影紀錄片《AlphaGo世紀對決》正式上映[6]。
Quick Facts 首次發佈, 目前版本 ...
首次發佈 | 2014年,10年前(2014) |
---|---|
目前版本 |
|
網站 | deepmind |
Close
專業術語上來說,AlphaGo的做法是使用了蒙地卡羅樹搜尋與兩個深度神經網絡相結合的方法,一個是以藉助估值網絡(value network)來評估大量的選點,一個是藉助走棋網絡(policy network)來選擇落子,並使用強化學習進一步改善它。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。[7][8]