AlphaGo

komputila programo evoluigita de Google DeepMind por ludi la tabulludon Go From Wikipedia, the free encyclopedia

Remove ads

AlphaGo estas komputila programo, kiu ludas la tabulludon Goo. La programaron disvolvis DeepMind Technologies, kiu poste estis akirita de Google. La disvolviĝo de la programaro komenciĝis en 2014. [1] Ekde tiam, pluraj versioj de la programaro estis kreitaj, inkluzive de tiuj, kiuj konkuris kontraŭ profesiaj Go-ludantoj. Ekzemple, versio nomata Master estis tre sukcesa. Post retiriĝo de konkurenciva ludo, AlphaGo Master estis anstataŭigita per pli potenca versio nomata AlphaGo Zero, kiu estis tute aŭtodidakta - tio estas, ĝi lernis ludi sen analizi homajn ludojn. AlphaGo Zero poste estis anstataŭigita de AlphaZero, kiu ludis aliajn ludojn krom Goo, inkluzive de ŝako kaj ŝogio. En 2019, pli progresinta versio nomata MuZero estis publikigita, kiu povas lerni ludi tiujn ludojn sen scii la regulojn de la ludo anticipe. 

AlphaGo uzas Montekarlan arboserĉan algoritmon (MCTS) por trovi siajn movojn bazitajn sur antaŭe akirita scio uzante maŝinlernadon bazitan sur artefarita neŭrala reto. La neŭrala reto estas trejnita por identigi la plej bonajn movojn kaj la venkajn procentojn de tiuj movoj. Ĉi tiu neŭrala reto plibonigas la efikecon de arboserĉado, rezultante en pli bona movoselektado de iteracio al iteracio.

En oktobro 2015, AlphaGo konkuris kontraŭ Go-ludanto Pan Hui kaj venkis. Tio igis la programon la unua kiu venkis profesian Go-ludanton sen kompenso kaj sur plena 19x19 tabulo. En marto 2016, la programo venkis profesian Go-ludanton Lee Sedol en kvin-luda matĉo kun poentaro de 1–4. Tio igis la programon la unua kiu venkis Dan 9 Go-ludanton sen kompenso. Ĉi tiu venko estis la temo de samnoma filmo. La 22-an de decembro 2016, la venko de AlphaGo estis elektita de Science kiel unu el la Sukcesoj de la Jaro.

En majo 2017, la versio AlphaGo Master venkis la ludanton Ka Ge (中文), kiu estis rangita numero unu en la mondo dum la ludo, kun poentaro de 1–2. Post ĉi tiu venko, la Ĉina Go-Asocio (中文) aljuĝis al la programaro rangon Dan 9. Post la venko super Ka Ge, AlphaGo Zero estis lanĉita, kiu lernas ludi la ludon memlernante. AlphaGo Zero atingis venkon de 100–0 kontraŭ la versio Master. La posteulo de AlphaGo Zero, AlphaZero, estas konsiderata, ekde 2019, kiel la plej alt-rangita ludanto en Goo kaj eble en ŝako. [2] [3]

Remove ads

Referencoj

Eksteraj ligiloj

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads