热门问题
时间线
聊天
视角
安德鲁·巴尔托
美国计算机科学家 来自维基百科,自由的百科全书
Remove ads
安德鲁·格雷特·巴尔托[1](英语:Andrew Gehret Barto;1948年—)是一名美国计算机科学家,目前是马萨诸塞大学阿默斯特分校的计算机科学荣誉教授。巴托最出名的是他对现代计算强化学习领域的基础性贡献[2]。
早年生活和教育
巴尔托于1970年以优异的成绩获得密歇根大学的数学学士学位,最初他主修的是海军建筑和工程。在阅读了麦可·A·阿比布、沃伦·麦卡洛克和沃尔特·皮茨的作品后,他开始对使用计算机和数学来建立大脑模型感兴趣,五年后,他因一篇关于细胞自动机的论文获得计算机科学博士学位[3]。
职业生涯
1977年,巴尔托加入马萨诸塞大学阿默斯特分校的资讯和计算机科学学院,担任博士后研究助理,1982年晋升为副教授,1991年晋升为正教授。2007年至2011年,他是系主任,也是神经科学和行为项目的核心教员[4]。
在马萨诸塞大学阿默斯特分校的这段时间里,巴尔托共同领导了自主学习实验室(最初是自适应网络实验室),该实验室产生强化学习的几个关键想法。理查德·S·萨顿与他合著了有影响力的《强化学习》(Reinforcement Learning: An Introduction)一书(麻省理工学院出版社1988年;2018年第二版)。巴托毕业了27名博士生,其中13人后来成为教授[4]。
获奖和荣誉
巴尔托是美国科学促进会会员、电机电子工程师学会会士与高级会士[5],以及人工智能促进协会和神经科学学会的成员。
巴尔托被授予2019年马萨诸塞大学阿默斯特分校神经科学终身成就奖、2004年IEEE的神经网络协会先锋奖[6],以及2017年IJCAI卓越研究奖。后者对他的褒奖是:
“巴尔托教授因其在强化学习的理论和应用方面的开创性和有影响的研究而受到认可。”[2]
2025年,他与他的前博士生理查德·S·萨顿因强化学习方面的工作而获得计算机协会 (Association for Computing Machinery) 颁发的图灵奖 (Turing Award): 该奖的颁奖词是:“因为开发了强化学习的概念和算法基础”。[7][7][8]
参考资料
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads