Top Qs
Chronologie
Chat
Contexte
RLHF
De Wiktionnaire, le dictionnaire libre
Remove ads
Anglais
Ébauche en anglais
Cette entrée est considérée comme une ébauche à compléter en anglais. Si vous possédez quelques connaissances sur le sujet, vous pouvez les partager en modifiant dès à présent cette page (en cliquant sur le lien « modifier le wikicode »).
Étymologie
- (Date à préciser) Sigle de reinforcement learning from human feedback.
Nom commun
RLHF \Prononciation ?\
- (Intelligence artificielle) Apprentissage par renforcement à partir de rétroaction humaine.
Hyperonymes
- reinforcement learning (« apprentissage par renforcement »)
Voir aussi
- Reinforcement learning from human feedback sur l’encyclopédie Wikipédia (en anglais)

Remove ads
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads