AlphaGo Zero
ウィキペディア フリーな encyclopedia
AlphaGo Zero(アルファ・ゴ・ゼロ)は、DeepMindの囲碁ソフトウェア(英語版)AlphaGoのバージョンである。AlphaGoのチームは2017年10月19日に学術誌Natureの論文でAlphaGo Zeroを発表した。このバージョンは人間の対局からのデータを使わずに作られており、それ以前の全てのバージョンよりも強い[1]。自分自身との対局を行うことで、AlphaGo Zeroは3日でAlphaGo Leeの強さを超え(100勝0敗)、21日でAlphaGo Masterのレベルに達し、40日で全ての旧バージョンを超えた[2]。
人間の熟練者から得られたデータは「しばしば高価で、信頼性が低く、あるいは単に利用ができない[3]」ため、こういったデータセットなしでの人工知能(AI)の訓練は超人的な能力を持つAIの開発にとって重要な影響をもたらす。DeepMindの共同創立者でCEOのデミス・ハサビスは、AlphaGo Zeroはもはや「人間の知識の限界によって制約されなかった」ため非常に強力だ、と述べた[4]。AlphaGoに関してNatureで発表されたDeepMindの論文の筆頭著者の一人であるデビッド・シルバー(英語版)は、人間からの学習の必要性を取り除くことによって、汎用AIアルゴリズムを得ることが可能である、と述べた[5]。
2017年12月、AlphaZeroと名付けられたAlphaGo Zeroの汎用バージョンが、AlphaGo Zero、トップチェスプログラム(Stockfish)、トップ将棋プログラム(elmo)を破った[6][7]。