热门问题
时间线
聊天
视角

大卫·席尔瓦 (计算机科学家)

软件工程师 来自维基百科,自由的百科全书

Remove ads

大卫·席尔瓦 FRS (英语:David Silver,1976年)是一名英国计算机科学家商人。他领导DeepMind强化学习研究小组,是AlphaGoAlphaZero的首席研究员和AlphaStar英语AlphaStar (software)的共同负责人。

事实速览 大卫·席尔瓦David Silver, 国籍 ...

教育

席尔瓦于1997年毕业于剑桥大学,获得阿迪生-韦斯利奖,并在那里与杰米斯·哈萨比斯结识[1]。席尔瓦于2004年回到学术界,在阿尔伯塔大学攻读强化学习的博士学位,在那里他共同提出了用于第一个硕士级9×9围棋项目的算法,并于2009年毕业[2][3]。他版本的程序MoGo是截至2009年的最强围棋程式之一[4]

职业生涯

大学毕业后,席尔瓦共同创立了电子游戏公司Elixir Studios英语Elixir Studios,并担任其首席技术官和首席程序员,获得多个技术和创新奖项[1][5]

席尔瓦在2011年被授予皇家学会大学研究奖学金,随后成为伦敦大学学院的讲师,现在是教授[6]。他关于强化学习的讲座可以在YouTube上找到[7]。席尔瓦从DeepMind成立之初就为其提供咨询,于2013年全职加入。

席尔瓦近期的研究重点是将强化学习与深度学习互相结合,包括一个直接从像素学习玩雅达利游戏的程式[8]。席尔瓦领导了AlphaGo项目,最终使其成为第一个在全尺寸围棋游戏中击败顶级职业棋手的程式[9]。随后AlphaGo获得荣誉的9段职业认证,并获得了戛纳狮子奖的创新奖[10]。之后他领导了AlphaZero的开发工作,利用同样的人工智能从头开始学习下围棋(只通过自己下棋而不是从人类游戏中学习),然后以同样的方式学习下国际象棋日本将棋,达到比其他任何计算机程序更高的等级。

席尔瓦是DeepMind发表文章最多的员工之一,引用次数超过130,000次,h指数为78[11]

他因在电脑游戏方面取得的突破性进展而被授予2019年ACM计算机奖英语ACM Prize in Computing[12]

2021年,席尔瓦因其对深度Q-学习和AlphaGo的贡献而被选为英国皇家学会院士[13]

Remove ads

参考资料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads