TERMIUM Plus®

From: Translation Bureau

On social media

Consult the Government of Canada’s terminology data bank.

INDEXING DOCUMENTS [11 records]

Record 1 2025-03-31

English

Subject field(s)
  • Artificial Intelligence
  • Collaboration with WIPO
CONT

Various techniques may exist to synthesize data for speech dialog systems ... The n-gram models may utilize statistical algorithms to assign words to classes based on the frequency of their co-occurrence with other words. The word classes may be used in language modeling to provide a wide range of applications, such as speech recognition or grammar correction.

CONT

Language modelling is one approach that has been shown to help indexing accuracy in phonetic STD [spoken term detection] systems. Topic dependent LMs [language models] are also used to make use of topic information of the decoding documents in indexing stage. A set of topic dependent LMs were trained and used in addition to acoustic models to index the audio documents in the database.

OBS

language modeling; language modelling: designations validated by Canadian subject-field experts from Concordia University, Dalhousie University, Laval University and Microsoft Canada.

French

Domaine(s)
  • Intelligence artificielle
  • Collaboration avec l'OMPI
CONT

La modélisation du langage est utilisée pour des tâches de reconnaissance automatique de la parole, de traduction automatique, de recherche d'information, etc.

CONT

Dans le cadre d'un système de dictée vocale, le modèle de langage est construit à partir de calculs réalisés sur des textes issus de la littérature ou de la presse écrite. On maximise la taille de ces textes, de façon à affiner la modélisation de la langue en termes de successions possibles de mots.

OBS

modélisation du langage; modélisation de la langue : désignations validées par des spécialistes canadiens de l'Université Concordia, de l'Université Dalhousie, de l'Université Laval et de Microsoft Canada.

Spanish

Campo(s) temático(s)
  • Inteligencia artificial
  • Colaboración con la OMPI
CONT

Una primera aproximación a la modelización del lenguaje, de uso muy extendido, que podemos llamar estocástica, consiste en modelizar las concatenaciones posibles de unidades lingüísticas o semánticas a través de probabilidades (obtenidas a partir de su frecuencia de aparición) de ocurrencia de secuencias de unidades lingüísticas o semánticas de longitud fija (N).

Save record 1

Record 2 2024-05-09

English

Subject field(s)
  • Programming Languages
DEF

A standard language for tagging elements of documents to permit special handling such as indexing, formatting, and linking.

OBS

SGML was developed in the USA and published as an international standard (ISO 8879: 1986). By breaking down a text into its logically defined parts, SGML is freed of system and processing dependencies.

Key term(s)
  • Standard Generalized Mark-up Language

French

Domaine(s)
  • Langages de programmation
DEF

Langage normalisé pour baliser les éléments de documents pour permettre des traitements particuliers comme l'indexation, le formatage et l'établissement de liens.

Spanish

Campo(s) temático(s)
  • Lenguaje de programación
DEF

Estándar internacional para la definición de métodos de representación de texto en forma electrónica no ligados a ningún sistema ni a ningún dispositivo.

Save record 2

Record 3 2023-09-19

English

Subject field(s)
  • Intelligence (Military)
  • Military Police
DEF

A numerical framework developed for indexing the subject matter of intelligence documents.

OBS

In addition to the subject outline, [the NATO intelligence subject code] includes a system of alphabetical or numerical symbols for geographic areas which are used with the subject classification.

OBS

NATO intelligence subject code: designation standardized by NATO.

French

Domaine(s)
  • Renseignement (Militaire)
  • Police militaire
OBS

répertoire analytique du renseignement de l'OTAN : désignation normalisée par l'OTAN.

Spanish

Campo(s) temático(s)
  • Inteligencia (militar)
  • Policía militar
DEF

Indice numérico, que relaciona los documentos sobre inteligencia. Incluye un sistema de símbolos, por orden alfabético o numérico,por zonas geográficas, que se emplea con objeto de clasificación.

Save record 3

Record 4 2013-04-09

English

Subject field(s)
  • Computer Programs and Programming
CONT

For instance, if the PDF [Portable Document Format] is a scanned, bit-mapped image it will not be directly accessible since it contains no actual textual information. Bit-mapped PDF files are not searchable by Web indexing services. This is why textual versions of documents are important(to the GoC [Government of Canada]).

French

Domaine(s)
  • Programmes et programmation (Informatique)
CONT

Par exemple, si le fichier PDF [format de document portable] est une image en mode point numérisée, il ne sera pas directement accessible puisqu'il ne contient aucune information textuelle réelle. Les services d'indexation du Web ne peuvent effectuer de recherche dans des fichiers PDF en mode point. C'est la raison pour laquelle les versions textuelles de documents sont importantes (pour le GdC [gouvernement du Canada]).

Spanish

Save record 4

Record 5 2013-03-18

English

Subject field(s)
  • Computer Programs and Programming
CONT

Bit-mapped PDF files are not searchable by Web indexing services. This is why textual versions of documents are important(to the GoC [Government of Canada]).

OBS

PDF: Portable Document Format.

French

Domaine(s)
  • Programmes et programmation (Informatique)
CONT

Les services d'indexation du Web ne peuvent effectuer de recherche dans des fichiers PDF en mode point. C'est la raison pour laquelle les versions textuelles de documents sont importantes (pour le GdC [gouvernement du Canada]).

OBS

PDF : format de document portable.

Spanish

Save record 5

Record 6 2013-03-18

English

Subject field(s)
  • Information Processing (Informatics)
CONT

For instance, if the PDF [Portable Document Format] is a scanned, bit-mapped image it will not be directly accessible since it contains no actual textual information. Bit-mapped PDF files are not searchable by Web indexing services. This is why textual versions of documents are important(to the GoC [Government of Canada]).

French

Domaine(s)
  • Traitement de l'information (Informatique)
CONT

Par exemple, si le fichier PDF [format de document portable] est une image en mode point numérisée, il ne sera pas directement accessible puisqu'il ne contient aucune information textuelle réelle. Les services d'indexation du Web ne peuvent effectuer de recherche dans des fichiers PDF en mode point. C'est la raison pour laquelle les versions textuelles de documents sont importantes (pour le GdC [gouvernement du Canada]).

Spanish

Save record 6

Record 7 2011-11-24

English

Subject field(s)
  • Information Theory
  • Internet and Telematics
DEF

[An] approach to producing intellectual content such as code, documents, indexing and decisions that results from individuals working together with no centralized authority.

French

Domaine(s)
  • Théorie de l'information
  • Internet et télématique
CONT

Les développements technologiques du dit «Web 2.0» ou encore Web sémantique permettent le développement d'une intelligence collective sur Internet. Des outils tels que les Wiki, les [signets sociaux], les moteurs sociaux de recherche (par exemple Lycos IQ) favorisent l'échange et le partage de connaissance en s'appuyant sur la mutualisation du travail (rédaction, recherche d'information, expertise) de tout un chacun.

Spanish

Campo(s) temático(s)
  • Teoría de la información
  • Internet y telemática
CONT

El concepto de inteligencia colectiva se ve impulsado con las nuevas tecnologías de la información y la comunicación, especialmente con Internet. Con la Web 2.0 aparecen nuevas formas de relacionarse, en las que los consumidores pasan a ser también creadores, como consecuencia de una gran facilidad para la aportación de información.

Save record 7

Record 8 2003-03-12

English

Subject field(s)
  • Information Processing (Informatics)
  • Internet and Telematics
  • Computer Programs and Programming
  • Programming Languages
CONT

Discussing the use of metadata, and the proper structuring of HTML documents in order to help indexing agents in their task is out of scope for this document, we will, rather, focus on the inner mechanics of indexing.

OBS

The English terminology on this record is standardized by the World Wide Web Consortium (W3C) whose role it is to establish standards relating to Internet technology. The French terminology was proposed by translators certified by the W3C and was verified by the author of this record.

French

Domaine(s)
  • Traitement de l'information (Informatique)
  • Internet et télématique
  • Programmes et programmation (Informatique)
  • Langages de programmation
CONT

Les exposés sur l'utilisation des métadonnées et la structuration exacte des documents HTML pour aider les agents d'indexation dans leur tâche ne sont pas l'objet de ce document ; nous nous concentrerons plutôt sur les mécanismes internes de l'indexation.

OBS

La terminologie anglaise de cette fiche est normalisée par le World Wide Web Consortium (consortium W3C) dont le rôle principal est d'établir les normes reliées aux technologies Internet. La terminologie française est proposée par des traducteurs agréés par le Consortium et elle a été vérifiée par l'auteur de cette fiche.

Spanish

Save record 8

Record 9 1997-11-11

English

Subject field(s)
  • International Bodies and Committees
  • Document Classification (Library Science)
OBS

ACC [Administrative Committee on Co-ordination]

French

Domaine(s)
  • Organismes et comités internationaux
  • Classification des documents (Bibliothéconomie)

Spanish

Campo(s) temático(s)
  • Organismos y comités internacionales
  • Clasificación de documentos (Biblioteconomía)
Save record 9

Record 10 1997-11-11

English

Subject field(s)
  • Organizations, Administrative Units and Committees
  • Library Science
OBS

ACC [Administrative Coordinating Committee].

French

Domaine(s)
  • Organismes, unités administratives et comités
  • Bibliothéconomie

Spanish

Campo(s) temático(s)
  • Organismos, unidades administrativas y comités
  • Biblioteconomía
Save record 10

Record 11 1976-06-19

English

Subject field(s)
  • Library Science

French

Domaine(s)
  • Bibliothéconomie

Spanish

Save record 11

Copyright notice for the TERMIUM Plus® data bank

© Public Services and Procurement Canada, 2026
TERMIUM Plus®, the Government of Canada's terminology and linguistic data bank
A product of the Translation Bureau

Features

GCtranslate (available on the Government of Canada network only)

Use this artificial intelligence prototype to translate Government of Canada content up to and including Protected B. Available to employees of selected departments and agencies only.

Writing tools

The Language Portal’s writing tools have a new look! Easy to consult, they give you access to a wealth of information that will help you write better in English and French.

Glossaries and vocabularies

Access Translation Bureau glossaries and vocabularies.

Date Modified: