TERMIUM Plus®
Par le Bureau de la traduction
Dans les médias sociaux
Consultez la banque de données terminologiques du gouvernement du Canada.
APPRENTISSAGE RENFORCEMENT RETROACTION HUMAINE [1 fiche]
Fiche 1 - données d’organisme interne 2025-09-25
Fiche 1, Anglais
Fiche 1, Subject field(s)
- Artificial Intelligence
Fiche 1, La vedette principale, Anglais
- reinforcement learning from human feedback
1, fiche 1, Anglais, reinforcement%20learning%20from%20human%20feedback
correct, nom
Fiche 1, Les abréviations, Anglais
- RLHF 1, fiche 1, Anglais, RLHF
correct, nom
Fiche 1, Les synonymes, Anglais
- RL from human feedback 2, fiche 1, Anglais, RL%20from%20human%20feedback
correct, nom
- RLHF 2, fiche 1, Anglais, RLHF
correct, nom
- RLHF 2, fiche 1, Anglais, RLHF
- reinforcement learning with human feedback 3, fiche 1, Anglais, reinforcement%20learning%20with%20human%20feedback
correct, nom
- RLHF 3, fiche 1, Anglais, RLHF
correct, nom
- RLHF 3, fiche 1, Anglais, RLHF
- RL with human feedback 4, fiche 1, Anglais, RL%20with%20human%20feedback
correct, nom
- RLHF 4, fiche 1, Anglais, RLHF
correct, nom
- RLHF 4, fiche 1, Anglais, RLHF
Fiche 1, Justifications, Anglais
Record number: 1, Textual support number: 1 OBS
Reinforcement learning from human feedback is used to align a pre-trained machine learning model with a specific task or behaviour. For this purpose, it relies on evaluations of the model's output by humans. The results of these evaluations are often provided to the model in the form of rewards and penalties. 5, fiche 1, Anglais, - reinforcement%20learning%20from%20human%20feedback
Fiche 1, Français
Fiche 1, Domaine(s)
- Intelligence artificielle
Fiche 1, La vedette principale, Français
- apprentissage par renforcement à partir de la rétroaction humaine
1, fiche 1, Français, apprentissage%20par%20renforcement%20%C3%A0%20partir%20de%20la%20r%C3%A9troaction%20humaine
correct, nom masculin
Fiche 1, Les abréviations, Français
Fiche 1, Les synonymes, Français
- apprentissage par renforcement avec rétroaction humaine 2, fiche 1, Français, apprentissage%20par%20renforcement%20avec%20r%C3%A9troaction%20humaine
correct, nom masculin
Fiche 1, Justifications, Français
Record number: 1, Textual support number: 1 OBS
L'apprentissage par renforcement à partir de la rétroaction humaine permet d'adapter un modèle d'apprentissage automatique préentraîné à une tâche ou à un comportement déterminé. Pour ce faire, cette technique se fonde sur les évaluations réalisées par des humains quant aux sorties produites par le modèle. Les résultats de ces évaluations sont souvent fournis au modèle sous forme de récompenses et de pénalités. 3, fiche 1, Français, - apprentissage%20par%20renforcement%20%C3%A0%20partir%20de%20la%20r%C3%A9troaction%20humaine
Fiche 1, Espagnol
Fiche 1, Justifications, Espagnol
Avis de droit d’auteur pour la banque de données TERMIUM Plus®
© Services publics et Approvisionnement Canada, 2026
TERMIUM Plus®, la banque de données terminologiques et linguistiques du gouvernement du Canada
Un produit du Bureau de la traduction
En vedette
GCtraduction (accessible uniquement sur le réseau du gouvernement du Canada)
Utilisez ce prototype d’intelligence artificielle pour traduire le contenu du gouvernement du Canada jusqu’au niveau Protégé B inclusivement. Réservé au personnel de certains ministères et organismes.
Outils d'aide à la rédaction
Les outils d’aide à la rédaction du Portail linguistique ont fait peau neuve! Faciles à consulter, ils vous donnent accès à une foule de renseignements utiles pour mieux écrire en français et en anglais.
Lexiques et vocabulaires
Accédez aux lexiques et vocabulaires du Bureau de la traduction.
- Date de modification :


