TERMIUM Plus®

Par le Bureau de la traduction

Dans les médias sociaux

Consultez la banque de données terminologiques du gouvernement du Canada.

REWARD LEARNING [11 fiches]

Fiche 1 2026-03-10

Anglais

Subject field(s)
  • Computer Mathematics
  • Artificial Intelligence
CONT

Reinforcement learning(RL) algorithms... adapt [a] node's behavior by rewarding good decisions using a reward function.

CONT

... RL [reinforcement learning] methods require reward functions to guide the agent towards a desired behavior.

Français

Domaine(s)
  • Mathématiques informatiques
  • Intelligence artificielle
CONT

L'apprentissage par renforcement profond nécessite une fonction de récompense afin de guider le processus d'apprentissage de l'agent. La fonction de récompense telle qu'implémentée [...] guide les agents vers des comportements similaires aux algorithmes de tractographie classiques. Hors, ces algorithmes ont des problèmes connus qui ne devraient pas être émulés par les agents apprenants. De ce fait, la fonction de récompense devra être, par exemple, améliorée afin qu'elle puisse permettre aux agents apprenants de ne connecter que les régions qui devraient l'être et d'éviter les faux positifs.

Espagnol

Campo(s) temático(s)
  • Matemáticas para computación
  • Inteligencia artificial
CONT

[...] la función de recompensa es un elemento crítico en un sistema basado en aprendizaje por refuerzo. Es la única señal que indica al agente cómo de bien o mal lo está haciendo, por lo que es crítico diseñar una buena función de recompensa y estudiar varias para ver cuál es con la que mejores resultados se consiguen.

Conserver la fiche 1

Fiche 2 2026-01-08

Anglais

Subject field(s)
  • Computer Mathematics
  • Computer Programs and Programming
  • Artificial Intelligence
CONT

Reinforcement learning describes a large class of learning problems characteristic of autonomous agents interacting in an environment : sequential decision-making problems with delayed reward. Reinforcement learning algorithms seek to learn a policy(mapping from states to actions) that maximize the reward received over time.

Français

Domaine(s)
  • Mathématiques informatiques
  • Programmes et programmation (Informatique)
  • Intelligence artificielle

Espagnol

Conserver la fiche 2

Fiche 3 2025-03-24

Anglais

Subject field(s)
  • Artificial Intelligence
CONT

Reward sparsity happens when many decision steps do not come with an extrinsic reward, for instance when the reward is provided only at the end of the task.... This kind of problem poses a challenge to simple reinforcement learning algorithms as many steps won’t provide informative gradients.

Français

Domaine(s)
  • Intelligence artificielle
CONT

Malgré l'avantage de la planification (implicite ou explicite) pour les environnements hautement combinatoires, il n'en reste pas moins que la rareté des récompenses demeure un problème pour l'apprentissage par renforcement avec modèle ou l'apprentissage par renforcement sans modèle avec planification implicite. En effet, ces paradigmes sont normalement fondés sur l'exploration aléatoire. Or, dans un contexte de récompenses éparses, l'exploration aléatoire rend difficile l'observation de récompenses positives. Puisque la probabilité d'observer une récompense positive est très faible, il faut un nombre d'interactions beaucoup plus élevé.

Espagnol

Conserver la fiche 3

Fiche 4 2020-11-04

Anglais

Subject field(s)
  • Computer Mathematics
  • Computer Programs and Programming
  • Artificial Intelligence
CONT

[The] object implements a function approximator to be used as a deterministic actor within a reinforcement learning agent with a continuous action space. A deterministic actor takes observations as inputs and returns as outputs the action that maximizes the expected cumulative long-term reward, thereby implementing a deterministic policy.

Français

Domaine(s)
  • Mathématiques informatiques
  • Programmes et programmation (Informatique)
  • Intelligence artificielle

Espagnol

Conserver la fiche 4

Fiche 5 2013-06-27

Anglais

Subject field(s)
  • Experimental Education
  • Human Behaviour
CONT

Behavior analysis focuses on the principles that explain how learning takes place. Positive reinforcement is one such principle. When a behavior is followed by some sort of reward, the behavior is more likely to be repeated... Applied Behavior Analysis(ABA) is the use of these techniques and principles to bring about meaningful and positive change in behavior.

Français

Domaine(s)
  • Pédagogie expérimentale
  • Comportement humain
CONT

L’analyse appliquée du comportement [...] est une science pour laquelle les procédures dérivées des principes de l’apprentissage du comportement sont systématiquement appliquées pour améliorer les comportements sociaux significatifs vers un niveau socialement acceptable.

Espagnol

Conserver la fiche 5

Fiche 6 2008-07-18

Anglais

Subject field(s)
  • Animal Behaviour
CONT

... it is the simplest form of learning. Unlike the other forms, habituation involves not the acquisition of new responses but the loss of old ones. If an animal is given a stimulus which is not associated with any reward or punishment, it ceases to respond.(MANBE, 1979, p. 233).

OBS

... habituation is sometimes applied to cases of response decrement in which any absent reinforcement has not been identified.

Français

Domaine(s)
  • Comportement animal
DEF

Extinction graduelle d'une réaction héréditaire, consécutive à la présentation répétitive d'une situation ou d'un stimulus qui évoque cette réaction, dans des conditions où aucun renforcement - positif ou négatif - n'intervient.

CONT

Thorpe a défini cet événement, qu'on appelle «accoutumance», comme une diminution de longue durée de la réaction qui est la conséquence d'une excitation répétée, non suivie d'une situation d'excitation qui aboutit au dressage.

OBS

Le terme «habituation» est un calque de l'anglais. Cependant, son usage est répandu, en particulier dans la bibliographie récente en psychologie et en éthologie.

Espagnol

Campo(s) temático(s)
  • Comportamiento animal
DEF

Disminución progresiva de la respuesta provocada por un estímulo, debida a la frecuencia con que éste se repite.

Conserver la fiche 6

Fiche 7 2008-07-18

Anglais

Subject field(s)
  • Animal Behaviour
CONT

Under the heading of "conditioning" come all those kinds of learning which clearly involve the association of some kind of reward or punishment with the response the animal makes.

CONT

It is through operant conditioning that voluntary responses are learned.

Français

Domaine(s)
  • Comportement animal
DEF

Ensemble des opérations associatives par lesquelles on arrive à provoquer un nouveau comportement chez l'animal [...]

CONT

Le conditionnement est un terme descriptif recouvrant le fait qu'il y a changement dans la forme, la configuration ou la fréquence d'un comportement comme résultat de l'association préalable de paires de stimuli (S) et/ou d'une paire de réponse - stimulus (R - S). (MACOA, 1977, page 17).

Espagnol

Campo(s) temático(s)
  • Comportamiento animal
Conserver la fiche 7

Fiche 8 2006-03-16

Anglais

Subject field(s)
  • Training of Personnel
  • Internet and Telematics
  • Education Theory and Methods
CONT

Good teachers should expose their students to enough situations that the students will become curious enough to take learning into their own hands. In other words, the role of the teacher in a learning-by-doing scenario is to open up interesting problems and to provide tools for solving them when asked by the student to do so. Solving the problem should be its own reward, not getting a grade. The curriculum must be oriented towards, and satisfied with, the idea that students will learn what they need in order to accomplish goals. It is hoped that they will have become curious and acquired both oddball cases and routine scriptlets along the way.

Français

Domaine(s)
  • Perfectionnement et formation du personnel
  • Internet et télématique
  • Théories et méthodes pédagogiques
OBS

Pluriel : des scénarios.

OBS

scénarios (pl.) : Cette graphie, puisée des Rectifications de l'orthographe recommandées par le Conseil supérieur de la langue française, est attestée dans le Petit Robert (2006).

OBS

Un scénario d'apprentissage est une situation d'apprentissage contextualisée et complexe qui permet d'activer une ou plusieurs compétences disciplinaires tout en tenant compte d'au moins une compétence transversale et d'un domaine d'expérience de vie et qui favorise leur développement et leur maîtrise dans l'action.

Espagnol

Conserver la fiche 8

Fiche 9 2002-09-04

Anglais

Subject field(s)
  • Educational Psychology
  • Software
DEF

In behaviourist theories of learning, the presentation of a reward after the desired response has been made.

CONT

Teaching ... becomes "simply the arrangement of contingencies of reinforcement" (Skinner, 1968). Since the important event is considered to be the reinforcement and this should only follow the occurrence of desired behaviour, it follows that the teaching material should be organised so as to maximise the probability of correct responses.

OBS

Lessons for children frequently engage in activities that reinforce correct responses. This may be done with encouraging words such as "You’re doing a great job!" or with an interesting picture or animation. However, such reinforcers should have variety and should not be too time consuming, especially if they occur frequently.

Français

Domaine(s)
  • Psychologie scolaire
  • Logiciels
DEF

[...] réponse que fournit le logiciel sur la compétence dont l'élève fait preuve dans l'accomplissement d'une tâche.

CONT

Le logiciel fourni t-il à l'élève un renforcement qui lui permette de progresser vers l'atteinte des objectifs d'apprentissage (exemple : bravos, félicitations, effets sonores, éléments graphiques)?

OBS

Exemple : «Bravo! Tu as réussi cet exercice.»

Espagnol

Conserver la fiche 9

Fiche 10 1998-05-22

Anglais

Subject field(s)
  • Education Theory and Methods
  • Educational Psychology
  • Artificial Intelligence
DEF

A type of discrimination learning in which one stimulus is rewarded a certain percentage of the time and the other stimulus the remaining percentage. In such a task, it is possible either to maximize reward by always choosing the stimulus rewarded on more than 50 percent of the trials or to match by choosing each stimulus in proportion to the percentages of reward.

OBS

Note: Term defined in a specialized glossary of psychometrics.

Français

Domaine(s)
  • Théories et méthodes pédagogiques
  • Psychologie scolaire
  • Intelligence artificielle

Espagnol

Conserver la fiche 10

Fiche 11 1998-03-14

Anglais

Subject field(s)
  • Titles of International Programs
  • Education (General)
OBS

... will recognize 25 schools that will receive cash rewards to become learning sites for other Chicago schools. The program will identify and reward schools where student achievement has increased and the number of dropouts has decreased.

Français

Domaine(s)
  • Titres de programmes internationaux
  • Pédagogie (Généralités)

Espagnol

Conserver la fiche 11

Avis de droit d’auteur pour la banque de données TERMIUM Plus®

© Services publics et Approvisionnement Canada, 2026
TERMIUM Plus®, la banque de données terminologiques et linguistiques du gouvernement du Canada
Un produit du Bureau de la traduction

En vedette

GCtraduction (accessible uniquement sur le réseau du gouvernement du Canada)

Utilisez ce prototype d’intelligence artificielle pour traduire le contenu du gouvernement du Canada jusqu’au niveau Protégé B inclusivement. Réservé au personnel de certains ministères et organismes.

Outils d'aide à la rédaction

Les outils d’aide à la rédaction du Portail linguistique ont fait peau neuve! Faciles à consulter, ils vous donnent accès à une foule de renseignements utiles pour mieux écrire en français et en anglais.

Lexiques et vocabulaires

Accédez aux lexiques et vocabulaires du Bureau de la traduction.

Date de modification :