AlphaGo対李世ドル

AlphaGo対李世乭（アルファご・たい・イ・セドル）は、韓国のプロ棋士である李世乭と、Google DeepMindが開発したコンピュータ囲碁プログラムAlphaGoの五番勝負である。

本来の表記は「AlphaGo対李世乭」です。この記事に付けられたページ名は技術的な制限または記事名の制約により不正確なものとなっています。

対局はコミ7目半の中国ルールで、持ち時間は2時間で、切れると1手1分の秒読み、ただし1分単位で合計3回の考慮時間がある^[1]。

勝者（勝ち越し者）は100万米ドルの賞金を得る。もしAlphaGoが勝利すれば、賞金はUNICEFを含むチャリティーへ寄付される^[2]。賞金に加えて、李世乭は全5戦の対局料として15万米ドル、1勝につき2万米ドルを得る^[1]。

概要

囲碁は長い間、AIの分野における難問と見なされており、チェスや将棋でコンピュータがプロ相手に勝利を収めているなか、2015年の時点でもプロ棋士の棋力には遠く及ばず、AlphaGo以外の囲碁プログラムは3子のハンディキャップを貰った置き碁でも勝ったことがなかった。しかし2015年10月、AlphaGoはヨーロッパ碁コングレスで優勝経験のあるプロ棋士である樊麾と非公開の五番勝負を行い、5勝0敗で破っていた。

そして2016年、今度はトッププロ棋士との対局を企画されたのがこの対戦である。

対局の模様は中国語、日本語、朝鮮語、英語の解説付きでライブ配信された。朝鮮語の配信はBaduk TVを通じて行われた^[3]。英語のオンライン配信はマイケル・レドモンドとアメリカ囲碁協会副会長のChris Garlockによって行われ、平均視聴者は8万人、第1局の終局近くには視聴者が10万人に達し、古力と柯潔が解説を行った中国語での第1局の配信はテンセントとLeEcoによって提供され、視聴者は約6千万人に達する^[4]など大いに注目を集めた^[5]。

この対局は1997年に行われたディープ・ブルーとガルリ・カスパロフとの間の歴史的なチェス対局と比較されている。

Remove ads

対局者

AlphaGoはGoogle DeepMindによって開発された、囲碁を打つためのコンピュータプログラムである。AlphaGoのアルゴリズムは機械学習とモンテカルロ木探索の組み合わせを用いており、人間の棋譜による教師あり学習と、自己対戦による強化の組み合わせで成り立っている。まずAlphaGoは、ネット対局場のKGSの6段以上のアマ高段者の棋譜約16万局、約3000万手を教師にして^[6]^[7]人間の打つ手を模倣できるように訓練され^[8]、実際に打たれた手を57%の確率で模倣できるようになった^[9]。次に旧バージョンのAlphaGo自身と考慮時間が極端に短い対局を繰り返す強化学習を行った^[10]。その結果、他の囲碁プログラムと500戦し499勝を収めるまでの棋力に至った^[9]。

李との対局に使用されるAlphaGoのバージョンは、樊麾との対局と同等のコンピュータパワー（1,202 CPU、176 GPU）を使う^[11]。システムは着手の「データベース」は活用しない。AlphaGoの作成者の一人は次のように説明した^[12]。

我々はAlphaGoに囲碁を打つようプログラムしたが、どんな手を思い付くのかは全く分からない。AlphaGoの手は訓練からの創発現象である。我々は単にデータセットと訓練アルゴリズムを作成しただけだ。しかし、AlphaGoが思い付く手は我々の手を離れており — そして碁打ちとして我々が思い付くものよりもずっと優れている。

李世乭は韓国棋院に所属する^[13]。1996年に12歳でプロに昇段し、それ以降に18回の世界王者となっている^[14]。李は出身の韓国において「国民的英雄」と呼ばれており、型にはまらない創造的なプレーでも知られている^[15]。李世乭は当初AlphaGoを「大勝」で破るだろうと予測した^[15]。対局の数週間前、李は韓国の名人戦で勝利した^[15]。

Remove ads

ルール

対局は五番勝負で行われ、賞金は100万米ドルである^[2]。中国ルールでコミは7目半。持ち時間は2時間で切れると1手1分の秒読み、ただし1分単位で合計3回の考慮時間がある^[1]。対局は3月9日から15日までの1週間で行われ、13時（日本・韓国標準時）から始まる^[16]。

対局

要約

視点

この対局は韓国ソウルのフォーシーズンズホテルで2016年3月に行われ、ライブでストリーミング配信される^[17]^[18]^[19]。DeepMindチームのメンバーでアマチュア6段の黄士傑がAlphaGoの代わりに盤面に着手する。AlphaGoはアメリカ合衆国に位置するサーバを使ったGoogleのクラウドコンピューティングによって動作する^[20]。

概要

さらに見る 日付, 黒番 ...

対局
	日付	黒番	白番	結果	手数
第1局	2016年3月9日	李世乭	AlphaGo	AlphaGo中押し勝ち	186
第2局	2016年3月10日	AlphaGo	李世乭	AlphaGo中押し勝ち	211
第3局	2016年3月12日	李世乭	AlphaGo	AlphaGo中押し勝ち	176
第4局	2016年3月13日	AlphaGo	李世乭	李世乭中押し勝ち	180
第5局	2016年3月15日	李世乭	AlphaGo	AlphaGo中押し勝ち	280
結果: AlphaGo 4 – 1 李世乭

第1局

AlphaGo（白）が第1局を勝利した。李は一局の大半を通して主導権を握っているように見えたが、AlphaGoが最後の20分に優位に立ち、李が投了した^[21]。李は終局後に、序盤に大きなミスを犯したと述べた。李は、序盤におけるコンピュータの戦略は「卓越」しており、AlphaGoは人間の棋士なら打たないような手を打ったと述べた^[21]。GoGameGuruでこの対局を解説したDavid Ormerodは、李の黒7を「序盤でAlphaGoの実力を試す奇妙な手」と説明した。この手を疑問手と見なし、AlphaGoの応手を「正確かつ効果的」と見なした。Ormerodは序盤はAlphaGoがリードし、李は黒81から挽回を始めたが、黒119と黒123が疑問手であり、黒129が敗着になったと説明した^[22]。韓国棋院の趙漢乗は、AlphaGoの打ち回しは2015年10月に樊麾を破った時よりも大きく改善されていたと論評した^[22]。プロ囲碁棋士マイケル・レドモンドは、コンピュータの打ち方は樊との対局時よりも積極的であったと述べた^[23]。

金成龍によれば、李世乭は102手目のAlphaGoの強手に驚かされたようである^[24]（この手の後に李は10分以上長考した）^[24]。

99手目まで

100-186手目

第2局

AlphaGo（黒）が第2局に勝利した。李は対局後に、「AlphaGoはほぼ完璧な碁を打った」^[25]、「序盤から自分がリードしたと一度も感じなかった」と述べた^[26]。

AlphaGoの作成者の一人デミス・ハサビスは、解説者がどちらが優勢か判断できなかったゲームの中盤からAlphaGoが勝利を確信していたと述べた^[26]。AlphaGoの打った37手目、四線の石に対する肩ツキはそれまでの囲碁の常識にはなかった手で、見守っていた人々を驚愕させ、「新たなパラダイムを示した」と評された^[27]。韓国棋院の安永吉（英語版）は、特にAlphaGoの黒151、157、159を賞賛した^[28]。

黒167は李に紛れを求めるチャンスを与えたようにも見え、ほとんどの解説者は悪手だと断言した。しかし、のちにこの手も多少の損の代わりに勝利を確実なものにするための正しい判断だったと考えられるようになった^[28]。

99手目まで

100-199手目

200-211手目

第3局

AlphaGo（白）が第3局に勝利した^[29]。

第2局の後、棋士の間では、AlphaGoの真の実力について、まだ強い疑いがあった。第3局ではこの疑いが晴れた。Ormerodは以下のように論評した。

AlphaGoは、経験を積んだ棋士たちが抱くその強さに対する疑いを全て晴らすように、文句の付けようのない形で勝利した。AlphaGoは恐ろしさを覚えるほど非常にうまく打ちまわした ... 李はAlphaGoに非常に厳しく一方的な攻めを見せたが、結果的にこれまで気付かれていなかったAlphaGoの真の力を明らかにしてしまった ... 李は攻めによる得を得ることができなかった ... 最高の中盤戦の名人である彼が、はっきり明確にお株を奪われたのだ^[30]。

安永吉とOrmerodは、この一局は「AlphaGoが全ての人間の棋士よりも単純に強い」^[30]ことを示したとした。AlphaGoは今までの2局では現れなかった、コンピュータには判断が難しいとされてきたコウでもミスは犯さなかった^[31]。安とOrmerodは、白148が特に注目に値すると考えた。複雑なコウ争いが起きているなか、AlphaGoはコウ争いに勝てると自信を見せ、上辺の大場に先着したのである^[30]。

黒番の李は高中国流を採用したが、AlphaGoは白12と黒の大模様に打ち込んでいった。李としてはこの白を厳しく攻めて得を図りたいところだったが、AlphaGoに簡単にサバかれてしまった^[30]。安は李の黒31が敗着であった可能性が高いとしており^[30]、アメリカ囲碁協会のAndy Jacksonは勝敗が黒35の時点で既に決していたと判断した^[32]。AlphaGoは白48から碁の主導権を握り、李は守勢を余儀無くさせた。李は黒77・79と反撃したが、AlphaGoは白90まで局面を簡明にすることに成功した。AlphaGoは下辺に大きな地模様を作り、白102から112まで、右辺や左上の白石の強化に回った。安は一連の進行を「洗練されている」と表現した^[30]。李は黒115から下辺の白地を荒らしに行ったが、AlphaGoは適切に対応した。黒131から複雑なコウを仕掛けたが、AlphaGoのミスを誘うことはできず、176手目に投了した^[30]。

99手目まで

100-176手目（122手目は113の位置、
154手目は

、
163手目は145、164手目は151、
166手目と171手目は160、169手目は145、
175手目は

）

第4局

第4局は李（白）が勝利した。DeepMindのデミス・ハサビスは、AlphaGoは79手目にミスをし、その時点では勝率が70%と見積っていたが、87手目に、その推定値が突如急落したとしている^[33]^[34]。Ormerodは87手目から101手目を典型的なモンテカルロベースのプログラムのミスと述べた^[35]。

李は、AlphaGoが「相場碁」（小さな得を積み重ねて勝ちを目指す碁）を好んでいるようであることから、アマシ作戦を選択し、足早に辺や隅に地を取った^[35]。駆け引きに強いAlphaGoであるが、「生きるか死ぬか」の局面に誘導することで、AlphaGoのわずかな得を重ねる力がほとんど無意味になる可能性があると李は考えた^[35]。李は辺や隅に地を取ることに集中し、AlphaGoが中央に模様を張る展開となった。李は白40から46と上辺のAlphaGoの模様を荒らしに行った。AlphaGoは黒47とカタツキで応じると、右辺の白と上辺の白をカラミ攻めにする構想を見せ、4子を捨て石にして黒69と上辺の白を制したかに見えた。李は白72から76としたがAlphaGoは適切に対応し、この時点で解説者らは李の打ち回しが勝ち目のないものだと感じ始めていた。しかし、「素晴らしい手筋」と表現された、白78のワリコミと82の強手によって、完全に形勢が逆転した^[35]。この手により、中央の白の一団は簡単には取られない石になり、難解な碁になった^[36]。しかし局後、78のワリコミに対し黒が正しく応手すれば手にならないことが判明した。実戦はワリコミが候補手になかったことでAlphagoは変化を読み切れず、最善を尽くせなかった結果の逆転となった。

黒83・85は適切だったが、黒87から101にかけてAlphaGoは大悪手を連発した。李は白92と中央に手をつけた時点で優勢となり、安は黒105を決定的な敗着とした。小ヨセに入った段階で、AlphaGoは逆転が不可能であると判断し投了した^[35]。これは、逆転の見込みが無いときには投了するべきだという人間の価値観に見合うよう、AlphaGoが勝率が20%未満であると判断した場合投了するよう設定されていたためである^[36]。

中国棋院の古力は、白78を「神の一手」と形容し、この手は全く想像していなかったと述べた^[35]。安も、この一局が「李世乭にとっての傑作であり、囲碁の歴史における名局となることはほぼ確実だろう」と称賛した^[35]。日本棋院の井山裕太も「勝てない相手ではないこと、人間が上回っている部分があることを証明してくれた。セドル九段に敬意を表したい」と李を称えた^[37]。李は試合後に、AlphaGoは白番の時が最も強かったと考えていると述べた^[38]。

Ormerodは、黒79から87までのAlphaGoの打ち方のまだ分析できていないが、モンテカルロ木探索を用いたアルゴリズムにおける既知の弱点によるものと考えている。モンテカルロ木探索では、重要ではないと判断された局面の木は刈り取られるようになる。そのため、ほぼ一本道の変化がある局面において、その変化の読みを省略してしまう危険があった^[39]。

99手目まで

100から180手目（177手目は

、178手目は

）

第5局

AlphaGo（白）が第5局に勝利した^[40]。この一局は接戦だったと評された。ハサビスは、ゲームの序盤にAlphaGoが「大きな失敗」をしでかした後に追い上げたものであると述べている^[40]。

第5局の手番は新たにニギリを行って決するはずであったが、第4局終了後に李が「AlphaGoは白番の方が黒番より強い。強い白番相手に打ちたい」と希望し、ハサビスが即座にこれを快諾したため、李の黒番で行われた。黒番の李は第4局同様に地で先行する戦略を取り、AlphaGoは中央に大きな勢力を得た。形勢はそれまで互角であったが、 AlphaGoが右下において石塔シボリの手筋を読み落として白48から58としたことで、李が主導権を握ることになった。しかし、 AlphaGoは代償に中央から上辺に模様を広げ、李の黒69から81までの荒らしに対し黒を小さく生かすことに成功した。Ormerodは、この黒の一連の動きが慎重すぎたと指摘した。白90でAlphaGoは形勢を互角に戻し、Ormerodが「珍しいが、微妙に印象的である」と評した、わずかに得な手を打った。地合いで不利な李は黒167・169と仕掛けるもAlphaGoは冷静に対処した。AlphaGoは完璧なヨセで優勢を維持し^[41]、AlphaGoの中押し勝ちとなった。安は、終盤の白154、186、194と特に良い手だと指摘した。

99手目まで

100-199手目(118手目は107の位置、161手目は

)

200-280手目(240手目は200の位置、271手目は

、
275手目は

、276手目は

)

Remove ads

背景

数学者のI・J・グッドは1965年に以下のように記している^[42]。1965年の時点では、まだ初心者程度に囲碁を打てるプログラムすら存在しなかった。

コンピュータの碁においては– 単にルールを守った碁というより、理にかなった碁を打つようにコンピュータをプログラムするためには – 戦略の原理を形式化する、あるいは学習プログラムを設計する必要がある。囲碁の原理はチェスよりも質的かつ神秘的であり、判断力により依存する。したがって、理にかなった碁を打つようコンピュータをプログラムすることは、チェスの場合よりもさらにいっそう難しいだろうと私は考える^[43]。

2015年まで、9路盤では一部のプログラムがプロ棋士に対して勝利できるだけの力を備えていたが、19路盤ではプロ棋士に太刀打ちできていなかった^[44]。人工知能の分野における多くの人々も、囲碁はチェスよりも人間の思考を模倣するためにより多くの要素を必要とすると考えていた^[45]。

AlphaGoはそれ以前のAIの取り組みとはニューラルネットワークを応用している点において最も大きく異なっている。ニューラルネットワークでは、評価経験則が人間によってハードコードされておらず、代わりにプログラム自身によって自分自身との対局を数千万回繰り返すことによってかなりの程度まで学ぶ。AlphaGoの開発チームでさえ、AlphaGoがどのように石の配置を評価し次の手を選択しているかを指摘することはできない。モンテカルロ木探索もAlphaGoの推論効率を改善するための主要な方法として用いられている。

コンピュータ囲碁研究の結果は、認知科学、パターン認識、機械学習といったその他の同様の分野に応用されている^[46]。

Remove ads

備考

第20回三星火災杯世界囲碁マスターズ開催後、囲碁人口の減少による広報効果の減落により存続の危機に立たされていた。しかしこのAlphaGoの対局により韓国国民の囲碁に対する関心が復活し存続が決定。しかも「夢の木選抜戦」というアマチュアの予選まで追加した^[47]。

脚注

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads

概要

対局者

ルール

対局

概要

第1局

第2局

第3局

第4局

第5局

背景

備考

関連項目

脚注