Рычард Сцюарт Сатан
From Wikipedia, the free encyclopedia
Remove ads
Рычард Сцюарт Сатан (англ.: Richard Stuart Sutton) — канадскі вучоны ў галіне інфарматыкі. Прафесар вылічальнай тэхнікі ва Універсітэце Альберты, навуковы супрацоўнік і галоўны навуковы кансультантам Інстытута машыннага інтэлекту Альберты, а таксама навуковы супрацоўнік «Keen Technologies»[4]. Сатан лічыцца адным з заснавальнікаў сучаснага вылічальнага навучання з падмацаваннем, які зрабіў некалькі значных унёскаў у гэтую галіну, у тым ліку ў навучанне па часавых дыферэнцыяцыях і метады градыенту палітыкі[5].
Сатан з’яўляецца членам Асацыяцыі садзейнічання развіццю штучнага інтэлекту (AAAI) з 2001 года.
У 2025 годзе разам з Эндру Барто атрымаў прэмію Цьюрынга ад Асацыяцыяй вылічальнай тэхнікі «за распрацоўку канцэптуальных і алгарытмічных асноў навучання з падмацаваннем»[6][7].
Remove ads
Узнагароды
Крыніцы
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
