Top Qs
Linha do tempo
Chat
Contexto

AlphaGo

Programa de computador desenvolvido pelo Google DeepMind para jogar o jogo de tabuleiro Go Da Wikipédia, a enciclopédia livre

Remove ads

AlphaGo é um programa de computador que joga o jogo de tabuleiro Go.[1] Foi desenvolvido pela DeepMind Technologies,[2] que mais tarde foi adquirida pelo Google. As versões subsequentes do AlphaGo tornaram-se cada vez mais poderosas, incluindo uma versão que competia com o nome de Master.[3] Depois de se aposentar do jogo competitivo, AlphaGo Master foi sucedido por uma versão ainda mais poderosa conhecida como AlphaGo Zero, que foi completamente autodidata, sem aprender com jogos humanos. AlphaGo Zero foi então generalizado em um programa conhecido como AlphaZero, que jogava jogos adicionais, incluindo xadrez e shogi. AlphaZero, por sua vez, foi sucedido por um programa conhecido como MuZero, que aprende sem ser ensinado as regras.

Thumb
Logotipo do AlphaGo

AlphaGo e seus sucessores usam um algoritmo de busca em árvore Monte Carlo para encontrar seus movimentos com base no conhecimento previamente adquirido por aprendizado de máquina, especificamente por uma rede neural artificial (um método de aprendizado profundo) por meio de treinamento extensivo, tanto do jogo humano quanto do computador.[4] Uma rede neural é treinada para identificar os melhores movimentos e as porcentagens de vitória desses movimentos. Essa rede neural melhora a força da busca em árvore, resultando em uma seleção de movimento mais forte na próxima iteração.

Em outubro de 2015, em uma partida contra Fan Hui, o AlphaGo original tornou-se o primeiro programa de computador Go a derrotar um jogador profissional de Go humano sem handicaps em um tabuleiro 19×19 de tamanho normal.[5][6] Em março de 2016, ele derrotou Lee Sedol em uma partida de cinco jogos, a primeira vez em que um programa de computador Go derrotou um profissional de 9 dan sem handicap.[7] Embora tenha perdido para Lee Sedol no quarto game, Lee renunciou no jogo final, dando um placar final de 4 jogos a 1 a favor do AlphaGo. Em reconhecimento à vitória, AlphaGo foi premiado com um 9-dan honorário da Associação de Baduk da Coreia.[8] A preparação e o desafio com Lee Sedol foram documentados em um documentário também intitulado AlphaGo,[9] dirigido por Greg Kohs. A vitória do AlphaGo foi escolhida pela revista científica Science como uma das vice-campeãs do Breakthrough of the Year em 22 de dezembro de 2016.[10]

No Future of Go Summit 2017, a versão Master do AlphaGo derrotou Ke Jie, o jogador número um do mundo na época, em uma partida de três jogos, após o qual o AlphaGo foi premiado com um 9-dan profissional pela Associação Weiqi Chinesa.[11]

Após a partida entre AlphaGo e Ke Jie, a DeepMind aposentou AlphaGo, enquanto continuava a pesquisa de IA em outras áreas.[12] O autodidata AlphaGo Zero alcançou uma vitória de 100-0 contra a versão competitiva inicial de AlphaGo, e seu sucessor AlphaZero é atualmente considerado o melhor jogador do mundo de Go, bem como possivelmente de xadrez.[13][14]

Remove ads

História

Resumir
Perspectiva

O jogo Go é considerado muito mais difícil para os computadores vencerem do que outros jogos, como o xadrez, porque seu fator de ramificação muito maior torna proibitivamente difícil o uso de métodos tradicionais de IA, como poda alfa-beta, travessia de árvore e pesquisa heurística.[5][15]

Quase duas décadas depois que o computador da IBM Deep Blue derrotou o campeão mundial de xadrez Garry Kasparov na partida de 1997, os programas Go mais fortes usando técnicas de inteligência artificial atingiram apenas o nível amador de 5 dan[4] e ainda não podiam vencer um jogador profissional de Go sem um handicap.[5][6][16] Em 2012, o programa de software Zen, rodando em um cluster de quatro PCs, venceu Masaki Takemiya (9p) duas vezes em handicaps de cinco e quatro pedras.[17] Em 2013, Crazy Stone venceu Yoshio Ishida (9p) em uma desvantagem de quatro pedras.[18]

De acordo com David Silver, da DeepMind, o projeto de pesquisa AlphaGo foi formado por volta de 2014 para testar o quão bem uma rede neural usando aprendizado profundo pode competir no jogo Go.[19] AlphaGo representa uma melhoria significativa em relação aos programas Go anteriores. Em 500 jogos contra outros programas Go disponíveis, incluindo Crazy Stone e Zen, AlphaGo rodando em um único computador venceu todos exceto um.[20] Em um confronto semelhante, AlphaGo rodando em vários computadores venceu todos os 500 jogos disputados contra outros programas Go, e 77% dos jogos jogados contra AlphaGo rodando em um único computador. A versão distribuída em outubro de 2015 usava 1.202 CPUs e 176 GPUs.[4]

Jogo contra Fan Hui

Em outubro de 2015, a versão distribuída de AlphaGo derrotou o campeão europeu de Go Fan Hui,[21] um profissional de 2 dan (de 9 dan possíveis), de cinco a zero.[6][22] Esta foi a primeira vez que um programa de computador Go derrotou um jogador humano profissional em uma placa de tamanho normal sem deficiência.[23] O anúncio da notícia foi adiado até 27 de janeiro de 2016 para coincidir com a publicação de um artigo na revista Nature[4] descrevendo os algoritmos usados.[6]

Jogo contra Lee Sedol

O AlphaGo enfrentou o jogador profissional de Go sul-coreano Lee Sedol, classificado com 9-dan, um dos melhores jogadores de Go,[16] com cinco jogos ocorrendo no Four Seasons Hotel em Seul, Coreia do Sul em 9, 10, 12, 13 e 15 de março de 2016,[24][25] que foram transmitidos por vídeo ao vivo.[26] De cinco jogos, AlphaGo venceu quatro e Lee venceu o quarto jogo, o que o tornou o único jogador humano que venceu AlphaGo em todos os seus 74 jogos oficiais.[27] AlphaGo rodou na computação em nuvem do Google com seus servidores localizados nos Estados Unidos.[28] A partida usou as regras chinesas com um komi de 7,5 pontos, e cada lado teve duas horas de tempo para pensar mais três períodos de byoyomi de 60 segundos.[29] A versão de AlphaGo jogando contra Lee usou uma quantidade semelhante de poder de computação que foi usado na partida de Fan Hui.[30] The Economist relatou que ele usou 1.920 CPUs e 280 GPUs.[31] No momento do jogo, Lee Sedol tinha o segundo maior número de vitórias em campeonatos internacionais Go no mundo, depois do sul-coreano Lee Changho, que manteve o título mundial por 16 anos.[32] Como não existe um único método oficial de classificação no Go internacional, as classificações podem variar entre as fontes. Embora às vezes fosse o melhor classificado, algumas fontes classificaram Lee Sedol como o quarto melhor jogador do mundo na época.[33][34]

O prêmio dapartida foi de US$ 1 milhão. Visto que AlphaGo venceu quatro de cinco e, portanto, a série, o prêmio será doado a instituições de caridade, incluindo a UNICEF.[35] Lee Sedol recebeu $150.000 por participar de todos os cinco jogos e $20.000 adicionais por sua vitória no Jogo 4.[29]

Remove ads

Algoritmo

A partir de 2016, o algoritmo do AlphaGo usa uma combinação de técnicas de aprendizado de máquina e de busca em árvore, combinadas com um treinamento extensivo, tanto de jogo humano quanto de computador. Ele usa a pesquisa em árvore Monte Carlo, guiada por uma "rede de valor" e uma "rede de políticas", ambas implementadas usando tecnologia de aprendizagem profunda.[4][5] Uma quantidade limitada de pré-processamento de detecção de recurso específico do jogo (por exemplo, para destacar se um movimento corresponde a um padrão nakade) é aplicada à entrada antes de ser enviada para as redes neurais.[4]

Remove ads

Estilo de jogo

Toby Manning, o árbitro da partida para AlphaGo vs. Fan Hui descreveu o estilo de jogo do programa como "conservador".[36] O estilo de jogo do AlphaGo favorece fortemente uma maior probabilidade de ganhar por menos pontos em relação à menor probabilidade de ganhar por mais pontos.[19] Sua estratégia de maximizar sua probabilidade de vitória é diferente da que os jogadores humanos tendem a fazer, que é maximizar os ganhos territoriais, e explica alguns de seus movimentos estranhos.[37]

Respostas à vitória de 2016

Comunidade de IA

A vitória da AlphaGo em março de 2016 foi um marco importante na pesquisa de inteligência artificial.[38] O Go já havia sido considerado um problema difícil no aprendizado de máquina, que deveria estar fora do alcance da tecnologia da época.[38][39][40] A maioria dos especialistas achava que um programa Go tão poderoso quanto AlphaGo estava a pelo menos cinco anos de distância.[41] Alguns especialistas pensaram que levaria pelo menos mais uma década antes que os computadores derrotassem os campeões de Go.[4][42][43] A maioria dos observadores no início das partidas de 2016 esperava que Lee derrotasse o AlphaGo.[38]

Comunidade Go

Go é um jogo popular na China, Japão e Coreia, e as partidas de 2016 foram assistidas por talvez cem milhões de pessoas em todo o mundo.[38][44] Muitos dos melhores jogadores de Go caracterizaram as jogadas pouco ortodoxas de AlphaGo como movimentos aparentemente questionáveis que inicialmente confundiram os espectadores, mas faziam sentido em retrospectiva: [42] "Todos, exceto os melhores jogadores de Go, criam seu estilo imitando os melhores jogadores. AlphaGo parece ter movimentos totalmente originais que ele mesmo cria."[38]

Remove ads

Sistemas semelhantes

O Facebook também está trabalhando em seu próprio sistema de Go, darkforest, também baseado na combinação de aprendizado de máquina e pesquisa de árvore Monte Carlo.[36][45] Embora um jogador forte contra outros programas de computador Go, no início de 2016, ainda não havia derrotado um jogador profissional humano.[46] Darkforest perdeu para CrazyStone e Zen e estima-se que tenha capacidade semelhante

à deles.[47]

Um artigo de 2018 na Nature citou a abordagem do AlphaGo como a base para um novo meio de calcular moléculas de potenciais medicamentos farmacêuticos.[48]

Remove ads

Referências

  1. «DeepMind AlphaGO». DeepMind Artificial Intelligence AlphaGo
  2. Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda (28 de janeiro de 2016). «Mastering the game of Go with deep neural networks and tree search». Nature. 529: 484–489. Bibcode:2016Natur.529..484S. ISSN 0028-0836. PMID 26819042. doi:10.1038/nature16961Acesso fechado
  3. «Google's AlphaGo gets 'divine' Go ranking». straitstimes.com. 15 de março de 2016. Consultado em 9 de dezembro de 2017
  4. «From AI to protein folding: Our Breakthrough runners-up». Science. 22 de dezembro de 2016. Consultado em 29 de dezembro de 2016
  5. «中国围棋协会授予AlphaGo职业九段 并颁发证书» (em chinês). Sohu.com. 27 de maio de 2017. Consultado em 9 de dezembro de 2017
  6. «AlphaZero Crushes Stockfish In New 1,000-Game Match». 17 de abril de 2019. Consultado em 11 de setembro de 2021
  7. Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J., Temporal Difference Learning of Position Evaluation in the Game of Go (PDF)
  8. «Computer scores big win against humans in ancient game of Go». CNN. 28 de janeiro de 2016. Consultado em 28 de janeiro de 2016
  9. John Riberio (14 de março de 2016). «AlphaGo's unusual moves prove its AI prowess, experts say». PC World. Consultado em 18 de março de 2016
  10. «Google AlphaGo AI clean sweeps European Go champion». ZDNet. 28 de janeiro de 2016. Consultado em 28 de janeiro de 2016
  11. Metz, Cade (27 de janeiro de 2016). «In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go». WIRED (em inglês). Consultado em 1 de fevereiro de 2016
  12. «Special Computer Go insert covering the AlphaGo v Fan Hui match» (PDF). British Go Journal. 2017. Consultado em 1 de fevereiro de 2016
  13. «Google's AI AlphaGo to take on world No 1 Lee Sedol in live broadcast». The Guardian. 5 de fevereiro de 2016. Consultado em 15 de fevereiro de 2016
  14. Novet, Jordan (4 de fevereiro de 2016). «YouTube will livestream Google's AI playing Go superstar Lee Sedol in March». VentureBeat. Consultado em 7 de fevereiro de 2016
  15. Yoon Sung-won (14 de março de 2016). «Lee Se-dol shows AlphaGo beatable». The Korea Times. Consultado em 15 de março de 2016
  16. «李世乭:即使Alpha Go得到升级也一样能赢». JoongAng Ilbo (em chinês). 23 de fevereiro de 2016. Consultado em 24 de fevereiro de 2016
  17. «이세돌 vs 알파고, '구글 딥마인드 챌린지 매치' 기자회견 열려» (em coreano). Korea Baduk Association. 22 de fevereiro de 2016. Consultado em 22 de fevereiro de 2016. Cópia arquivada em 3 de março de 2016
  18. «Showdown». The Economist. Consultado em 19 de novembro de 2016
  19. Steven Borowiec (9 de março de 2016). «Google's AI machine v world champion of 'Go': everything you need to know». The Guardian. Consultado em 15 de março de 2016
  20. Rémi Coulom. «Rating List of 2016-01-01». Consultado em 18 de março de 2016. Cópia arquivada em 18 de março de 2016
  21. «Korean Go master proves human intuition still powerful in Go». The Korean Herald/ANN. 14 de março de 2016. Consultado em 15 de março de 2016. Cópia arquivada em 12 de abril de 2016
  22. «Human champion certain he'll beat AI at ancient Chinese game». Associated Press. 22 de fevereiro de 2016. Consultado em 22 de fevereiro de 2016
  23. Gibney, Elizabeth (27 de janeiro de 2016). «Google AI algorithm masters ancient game of Go». Nature. 529: 445–6. Bibcode:2016Natur.529..445G. PMID 26819021. doi:10.1038/529445a
  24. Steven Borowiec; Tracey Lien (12 de março de 2016). «AlphaGo beats human Go champ in milestone for artificial intelligence». Los Angeles Times. Consultado em 13 de março de 2016
  25. Connor, Steve (27 de janeiro de 2016). «A computer has beaten a professional at the world's most complex board game». The Independent. Consultado em 28 de janeiro de 2016
  26. «Google's AI beats human champion at Go». CBC News. 27 de janeiro de 2016. Consultado em 28 de janeiro de 2016
  27. Dave Gershgorn (12 de março de 2016). «GOOGLE'S ALPHAGO BEATS WORLD CHAMPION IN THIRD MATCH TO WIN ENTIRE SERIES». Popular Science. Consultado em 13 de março de 2016
  28. Sofia Yan (12 de março de 2016). «A Google computer victorious over the world's 'Go' champion». CNN Money. Consultado em 13 de março de 2016
  29. CHOE SANG-HUN (16 de março de 2016). «Google's Computer Program Beats Lee Se-dol in Go Tournament». The New York Times. Consultado em 18 de março de 2016. More than 100 million people watched the AlphaGo-Lee matches, Mr. Hassabis said.
  30. Tian, Yuandong; Zhu, Yan. «Better Computer Go Player with Neural Network and Long-term Prediction». arXiv:1511.06410v1Acessível livremente [cs.LG]
  31. HAL 90210 (28 de janeiro de 2016). «No Go: Facebook fails to spoil Google's big AI day». The Guardian (em inglês). ISSN 0261-3077. Consultado em 1 de fevereiro de 2016
  32. «Strachey Lecture – Dr Demis Hassabis». The New Livestream. Consultado em 17 de março de 2016
  33. «Go and make some drugs The Engineer». www.theengineer.co.uk (em inglês). Consultado em 3 de abril de 2018
Remove ads

Ver também

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads