热门问题
时间线
聊天
视角

戴維·西爾弗

软件工程师 来自维基百科,自由的百科全书

Remove ads

戴維·西爾弗(英語:David Silver;1976年)是一名英國計算機科學家商人。他領導DeepMind強化學習研究小組,是AlphaGoAlphaZero的首席研究員和AlphaStar英語AlphaStar (software)的共同負責人。

事实速览 戴維·西爾弗 David Silver, 國籍 ...

教育

西爾弗於1997年畢業於劍橋大學,獲得阿迪生-韋斯利獎,並在那裡與傑米斯·哈薩比斯結識[1]。西爾弗於2004年回到學術界,在阿爾伯塔大學攻讀強化學習的博士學位,在那裡他共同提出了用於第一個碩士級9×9圍棋項目的算法,並於2009年畢業[2][3]。他版本的程序MoGo是截至2009年的最強圍棋程式之一[4]

職業生涯

大學畢業後,西爾弗共同創立了電子遊戲公司Elixir Studios英語Elixir Studios,並擔任其首席技術官和首席程序員,獲得多個技術和創新獎項[1][5]

西爾弗在2011年被授予皇家學會大學研究獎學金,隨後成為倫敦大學學院的講師,現在是教授[6]。他關於強化學習的講座可以在YouTube上找到[7]。西爾弗從DeepMind成立之初就為其提供諮詢,於2013年全職加入。

西爾弗近期的研究重點是將強化學習與深度學習互相結合,包括一個直接從像素學習玩雅達利遊戲的程式[8]。西爾弗領導了AlphaGo項目,最終使其成為第一個在全尺寸圍棋遊戲中擊敗頂級職業棋手的程式[9]。隨後AlphaGo獲得榮譽的9段職業認證,並獲得了坎城獅子獎的創新獎[10]。之後他領導了AlphaZero的開發工作,利用同樣的人工智慧從頭開始學習下圍棋(只通過自己下棋而不是從人類遊戲中學習),然後以同樣的方式學習下西洋棋日本將棋,達到比其他任何電腦程式更高的等級。

西爾弗是DeepMind發表文章最多的員工之一,引用次數超過130,000次,h指數為78[11]

他因在電腦遊戲方面取得的突破性進展而被授予2019年ACM計算機獎英語ACM Prize in Computing[12]

2021年,西爾弗因其對深度Q-學習和AlphaGo的貢獻而被選為英國皇家學會院士[13]

Remove ads

參考資料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads