AlphaGo
由谷歌DeepMind開發,專門用來下圍棋的計算機程序 / 维基百科,自由的 encyclopedia
AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿尔法围棋,在英语不流通的华语社会亦被音译为阿尔法狗[1][2]、阿法狗[3]、阿发狗[4][5]等,是于2014年开始由英国伦敦Google DeepMind开发的人工智慧围棋软件。2017年,关于AlphaGo的电影纪录片《AlphaGo世纪对决》正式上映[6]。
Quick Facts 首次发布, 当前版本 ...
首次发布 | 2014年,10年前(2014) |
---|---|
当前版本 |
|
网站 | deepmind |
Close
专业术语上来说,AlphaGo的做法是使用了蒙特卡洛树搜索与两个深度神经网络相结合的方法,一个是以借助估值网络(value network)来评估大量的选点,一个是借助走棋网络(policy network)来选择落子,并使用强化学习进一步改善它。在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。[7][8]