热门问题
时间线
聊天
视角

理查德·S·萨顿

加拿大计算机科学家 来自维基百科,自由的百科全书

理查德·S·薩頓
Remove ads

理查德·S·萨顿(英语:Richard S. Sutton FRS FRSC,1957/1958年 - ),加拿大电脑科学家阿尔伯塔大学计算机科学系教授、Keen Technologies研究科学家[1],被认为是现代计算机强化学习领域的奠基人[2],对该领域有诸多突出贡献,包括时序差分学习策略梯度算法英语Policy gradient method[3]

事实速览 理查德·S·萨顿Richard S. Sutton FRS FRSC, 出生 ...

2025年,他与安德鲁·巴托共同获得图灵奖[4][5]

Remove ads

参考资料

外部链接

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads