TERMIUM Plus®

From: Translation Bureau

On social media

Consult the Government of Canada’s terminology data bank.

INDEXING LANGUAGE [6 records]

Record 1 2025-03-31

English

Subject field(s)
  • Artificial Intelligence
  • Collaboration with WIPO
CONT

Various techniques may exist to synthesize data for speech dialog systems ... The n-gram models may utilize statistical algorithms to assign words to classes based on the frequency of their co-occurrence with other words. The word classes may be used in language modeling to provide a wide range of applications, such as speech recognition or grammar correction.

CONT

Language modelling is one approach that has been shown to help indexing accuracy in phonetic STD [spoken term detection] systems. Topic dependent LMs [language models] are also used to make use of topic information of the decoding documents in indexing stage. A set of topic dependent LMs were trained and used in addition to acoustic models to index the audio documents in the database.

OBS

language modeling; language modelling: designations validated by Canadian subject-field experts from Concordia University, Dalhousie University, Laval University and Microsoft Canada.

French

Domaine(s)
  • Intelligence artificielle
  • Collaboration avec l'OMPI
CONT

La modélisation du langage est utilisée pour des tâches de reconnaissance automatique de la parole, de traduction automatique, de recherche d'information, etc.

CONT

Dans le cadre d'un système de dictée vocale, le modèle de langage est construit à partir de calculs réalisés sur des textes issus de la littérature ou de la presse écrite. On maximise la taille de ces textes, de façon à affiner la modélisation de la langue en termes de successions possibles de mots.

OBS

modélisation du langage; modélisation de la langue : désignations validées par des spécialistes canadiens de l'Université Concordia, de l'Université Dalhousie, de l'Université Laval et de Microsoft Canada.

Spanish

Campo(s) temático(s)
  • Inteligencia artificial
  • Colaboración con la OMPI
CONT

Una primera aproximación a la modelización del lenguaje, de uso muy extendido, que podemos llamar estocástica, consiste en modelizar las concatenaciones posibles de unidades lingüísticas o semánticas a través de probabilidades (obtenidas a partir de su frecuencia de aparición) de ocurrencia de secuencias de unidades lingüísticas o semánticas de longitud fija (N).

Save record 1

Record 2 2024-05-09

English

Subject field(s)
  • Programming Languages
DEF

A standard language for tagging elements of documents to permit special handling such as indexing, formatting, and linking.

OBS

SGML was developed in the USA and published as an international standard (ISO 8879: 1986). By breaking down a text into its logically defined parts, SGML is freed of system and processing dependencies.

Key term(s)
  • Standard Generalized Mark-up Language

French

Domaine(s)
  • Langages de programmation
DEF

Langage normalisé pour baliser les éléments de documents pour permettre des traitements particuliers comme l'indexation, le formatage et l'établissement de liens.

Spanish

Campo(s) temático(s)
  • Lenguaje de programación
DEF

Estándar internacional para la definición de métodos de representación de texto en forma electrónica no ligados a ningún sistema ni a ningún dispositivo.

Save record 2

Record 3 2017-11-27

English

Subject field(s)
  • Programming Languages
  • Internet and Telematics
DEF

A simplified dialect of SGML (Standard Generalized Markup Language) [that] is not as powerful as SGML, but [is] much easier to use.

CONT

XML is an extension of HTML [Hypertext Markup Language] which not only describes the nature of Web content but also provides a way of indexing data. Its system of tagging data with relevant information allows applications running on other computers to respond in an appropriate way.

French

Domaine(s)
  • Langages de programmation
  • Internet et télématique
DEF

Sous-ensemble réduit et simple du langage SGML [langage normalisé de balisage généralisé] conçu [...] pour faciliter la mise en œuvre et l'interfonctionnement avec les langages complets SGML et HTML [langage hypertexte].

OBS

Il s'agit en ce moment de l'élaboration d'un profil d'application métalangue plus simple à utiliser que le langage SGML (il réduit un document de référence de 500 pages à 26). Contrairement au langage HTML, le langage XML soutient (de façon facultative) les étiquettes et les attributs définis par l'utilisateur, permet l'emboîtement dans les documents à n'importe quel degré de complexité, et peut contenir une description facultative de sa grammaire pour être utilisée par les applications qui ont besoin d'exécuter une validation structurelle.

Spanish

Campo(s) temático(s)
  • Lenguaje de programación
  • Internet y telemática
DEF

Metalenguaje extensible de etiquetas [que es una] simplificación y adaptación del SGML [lenguaje estandarizado de marcado general] que permite definir la gramática de lenguajes específicos.

OBS

XML, por su siglas en inglés.

Save record 3

Record 4 2014-02-04

English

Subject field(s)
  • Records Management (Management)
  • Document Classification (Library Science)
CONT

In library science, free language indexing permits the assignment of any word as an indexing term.

French

Domaine(s)
  • Gestion des documents (Gestion)
  • Classification des documents (Bibliothéconomie)
CONT

L'indexation en vocabulaire libre utilise les mots de la langue naturelle comme termes d'indexation, sans en contrôler la forme ni la signification.

Spanish

Save record 4

Record 5 2014-02-04

English

Subject field(s)
  • Records Management (Management)
  • Document Classification (Library Science)
  • Data Banks and Databases
CONT

The simplest method for indexing articles for bibliographic databases is extraction indexing, in which terms are extracted from the text of the article for inclusion in the index. The frequency of words in the article is determined, and the words which are found most often are included in the index. Alternatively, the words which occur most often in the article compared to their occurrence in the rest of the database, or in normal language, are included.

French

Domaine(s)
  • Gestion des documents (Gestion)
  • Classification des documents (Bibliothéconomie)
  • Banques et bases de données
CONT

L'indexation par extraction, souvent automatique, est essentiellement fondée sur les mots qui sont présents dans un document source de nature textuelle.

Spanish

Save record 5

Record 6 2013-04-24

English

Subject field(s)
  • Library Science
DEF

The terms or codes that might be used as access points in an index.

French

Domaine(s)
  • Bibliothéconomie
DEF

Langage documentaire utilisé pour fournir, dans un catalogue, une bibliographie ou un index, un accès cohérent au sujet des documents.

OBS

Il est composé d'un vocabulaire contrôlé de termes représentant des concepts et des entités, et d'une structure sémantique permettant de relier ces termes entre eux. Il peut également comporter une syntaxe pour combiner ces termes dans des chaînes.

Spanish

Campo(s) temático(s)
  • Biblioteconomía
DEF

Instrumento que permite unir el lenguaje de los documentos con la pregunta formulada por el usuario.

Save record 6

Copyright notice for the TERMIUM Plus® data bank

© Public Services and Procurement Canada, 2026
TERMIUM Plus®, the Government of Canada's terminology and linguistic data bank
A product of the Translation Bureau

Features

GCtranslate (available on the Government of Canada network only)

Use this artificial intelligence prototype to translate Government of Canada content up to and including Protected B. Available to employees of selected departments and agencies only.

Writing tools

The Language Portal’s writing tools have a new look! Easy to consult, they give you access to a wealth of information that will help you write better in English and French.

Glossaries and vocabularies

Access Translation Bureau glossaries and vocabularies.

Date Modified: