AlphaGo Zero

AlphaGo Zero是DeepMind 圍棋軟件 AlphaGo的最新版。2017年10月19日，AlphaGo團隊在《自然》上發表文章介紹了AlphaGo Zero，文中指出此版本不採用人類玩家的棋譜，且比之前的所有版本都要強大^[1]。通過自我對弈，AlphaGo Zero在三天內以100比0的戰績戰勝了AlphaGo Lee，花了21天達到AlphaGo Master的水平，用40天超越了所有舊版本^[2]。DeepMind聯合創始人兼CEO傑米斯·哈薩比斯說，AlphaGo Zero「不再受限於人類認知」，很強大^[3]。由於專家數據「經常很貴、不可靠或是無法取得」，不藉助人類專家的數據集訓練人工智能，對於人工智能開發超人技能具有重大意義^[4]，因為這樣的AI不是學習人，是通過對自我的反思和獨有的創造力直接超越人類。文章作者之一大衛·席爾瓦表示，摒棄向人類學習的需求，這有可能是對現有人工智能算法的拓展^[5]。

[1]

[2]

[3]

[4]

[5]