热门问题
时间线
聊天
视角
理查德·S·萨顿
加拿大计算机科学家 来自维基百科,自由的百科全书
Remove ads
理查德·S·萨顿(英语:Richard S. Sutton FRS FRSC,1957/1958年 - ),加拿大电脑科学家,阿尔伯塔大学计算机科学系教授、Keen Technologies研究科学家[1],被认为是现代计算机强化学习领域的奠基人[2],对该领域有诸多突出贡献,包括时序差分学习和策略梯度算法[3]。
![]() | 此条目可参照英语维基百科相应条目来扩充。 (2025年3月21日) |
Remove ads
参考资料
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads