TERMIUM Plus®

Par le Bureau de la traduction

Dans les médias sociaux

Consultez la banque de données terminologiques du gouvernement du Canada.

APPRENTISSAGE RENFORCEMENT RETROACTION HUMAINE [1 fiche]

Fiche 1 2025-09-25

Anglais

Subject field(s)
  • Artificial Intelligence
OBS

Reinforcement learning from human feedback is used to align a pre-trained machine learning model with a specific task or behaviour. For this purpose, it relies on evaluations of the model's output by humans. The results of these evaluations are often provided to the model in the form of rewards and penalties.

Français

Domaine(s)
  • Intelligence artificielle
OBS

L'apprentissage par renforcement à partir de la rétroaction humaine permet d'adapter un modèle d'apprentissage automatique préentraîné à une tâche ou à un comportement déterminé. Pour ce faire, cette technique se fonde sur les évaluations réalisées par des humains quant aux sorties produites par le modèle. Les résultats de ces évaluations sont souvent fournis au modèle sous forme de récompenses et de pénalités.

Espagnol

Conserver la fiche 1

Avis de droit d’auteur pour la banque de données TERMIUM Plus®

© Services publics et Approvisionnement Canada, 2026
TERMIUM Plus®, la banque de données terminologiques et linguistiques du gouvernement du Canada
Un produit du Bureau de la traduction

En vedette

GCtraduction (accessible uniquement sur le réseau du gouvernement du Canada)

Utilisez ce prototype d’intelligence artificielle pour traduire le contenu du gouvernement du Canada jusqu’au niveau Protégé B inclusivement. Réservé au personnel de certains ministères et organismes.

Outils d'aide à la rédaction

Les outils d’aide à la rédaction du Portail linguistique ont fait peau neuve! Faciles à consulter, ils vous donnent accès à une foule de renseignements utiles pour mieux écrire en français et en anglais.

Lexiques et vocabulaires

Accédez aux lexiques et vocabulaires du Bureau de la traduction.

Date de modification :