AlphaGo Zero
阿爾法圍棋抛开人类棋谱的版本 / 維基百科,自由的 encyclopedia
AlphaGo Zero是DeepMind圍棋軟件AlphaGo的最新版。2017年10月19日,AlphaGo團隊在《自然》上發表文章介紹了AlphaGo Zero,文中指出此版本不採用人類玩家的棋譜,且比之前的所有版本都要強大[1]。通過自我對弈,AlphaGo Zero在三天內以100比0的戰績戰勝了AlphaGo Lee,花了21天達到AlphaGo Master的水平,用40天超越了所有舊版本[2]。DeepMind聯合創始人兼CEO傑米斯·哈薩比斯說,AlphaGo Zero「不再受限於人類認知」,很強大[3]。由於專家數據「經常很貴、不可靠或是無法取得」,不藉助人類專家的數據集訓練人工智能,對於人工智能開發超人技能具有重大意義[4],因為這樣的AI不是學習人,是通過對自我的反思和獨有的創造力直接超越人類。文章作者之一大衛·席爾瓦表示,摒棄向人類學習的需求,這有可能是對現有人工智能算法的拓展[5]。