热门问题
时间线
聊天
视角
李察·S·薩頓
加拿大计算机科学家 来自维基百科,自由的百科全书
Remove ads
李察·S·薩頓(英語:Richard S. Sutton FRS FRSC,1957/1958年 - ),加拿大電腦科學家,阿爾伯塔大學電腦科學系教授、Keen Technologies研究科學家[1],被認為是現代電腦強化學習領域的奠基人[2],對該領域有諸多突出貢獻,包括時序差分學習和策略梯度演算法[3]。
![]() | 此條目可參照英語維基百科相應條目來擴充。 (2025年3月21日) |
Remove ads
參考資料
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads