热门问题
时间线
聊天
视角
大卫·席尔瓦 (计算机科学家)
软件工程师 来自维基百科,自由的百科全书
Remove ads
大卫·席尔瓦 FRS (英语:David Silver,1976年—)是一名英国计算机科学家和商人。他领导DeepMind的强化学习研究小组,是AlphaGo、AlphaZero的首席研究员和AlphaStar的共同负责人。
教育
席尔瓦于1997年毕业于剑桥大学,获得阿迪生-韦斯利奖,并在那里与杰米斯·哈萨比斯结识[1]。席尔瓦于2004年回到学术界,在阿尔伯塔大学攻读强化学习的博士学位,在那里他共同提出了用于第一个硕士级9×9围棋项目的算法,并于2009年毕业[2][3]。他版本的程序MoGo是截至2009年的最强围棋程式之一[4]。
职业生涯
大学毕业后,席尔瓦共同创立了电子游戏公司Elixir Studios,并担任其首席技术官和首席程序员,获得多个技术和创新奖项[1][5]。
席尔瓦在2011年被授予皇家学会大学研究奖学金,随后成为伦敦大学学院的讲师,现在是教授[6]。他关于强化学习的讲座可以在YouTube上找到[7]。席尔瓦从DeepMind成立之初就为其提供咨询,于2013年全职加入。
席尔瓦近期的研究重点是将强化学习与深度学习互相结合,包括一个直接从像素学习玩雅达利游戏的程式[8]。席尔瓦领导了AlphaGo项目,最终使其成为第一个在全尺寸围棋游戏中击败顶级职业棋手的程式[9]。随后AlphaGo获得荣誉的9段职业认证,并获得了戛纳狮子奖的创新奖[10]。之后他领导了AlphaZero的开发工作,利用同样的人工智能从头开始学习下围棋(只通过自己下棋而不是从人类游戏中学习),然后以同样的方式学习下国际象棋和日本将棋,达到比其他任何计算机程序更高的等级。
席尔瓦是DeepMind发表文章最多的员工之一,引用次数超过130,000次,h指数为78[11]。
他因在电脑游戏方面取得的突破性进展而被授予2019年ACM计算机奖[12]
Remove ads
参考资料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads