2.3.3. L'analyse de corpus textuels
Les particularités de la recherche qu'on vous demande d'entreprendre
et des produits
terminologiques que vous êtes censé livrer aux utilisateurs déterminent
la portée de toute analyse de contenus spécialisés.
Si vous travaillez pour le service de communication d'une entreprise, les
employés et les clients de cette entreprise vous poseront des questions
ponctuelles sur des problèmes terminologiques spécifiques :
Quelle est la définition correcte
d'un terme rencontré?
Est-ce que l'usage qu'on
fait d'un terme dans un texte particulier est
approprié ou erroné? Quel est l'équivalent correct
d'un terme de départ dans une langue
spécialisée cible? etc. Dans ce cas, votre analyse
de corpus
textuels pour répondre à ces types de questions sera
brève,
limitée et ira droit au but. D'autre part, vos collègues
et vos clients pourraient vous demander d'entreprendre des recherches
détaillées
et complètes sur la terminologie d'un domaine ou
d'un sous-domaine, et de leur livrer cette terminologie dans une publication
de type vocabulaire monolingue,
bilingue ou multilingue. Dans ce cas, la portée de l'analyse que
vous entreprendrez dans un corpus cohérent thématiquement
sera incomparablement plus vaste et prendra beaucoup plus de temps et
de ressources.
La première chose à faire avant de se lancer dans une recherche
thématique est d'établir un répertoire ou une bibliographie
des sources écrites à dépouiller
(le corpus textuel de votre analyse de contenus spécialisés).
Il est préférable d'avoir votre répertoire électroniquement
pour vous faciliter les ajouts ou les rejets, et de coder chacune des sources
retenues afin de pouvoir les inscrire facilement après chacune des citations ou attestations
d'usage que vous aimeriez consigner ultérieurement sur vos fiches
terminologiques. Si vous utilisez ces codes lors de la saisie des fiches
dans une base de données disponible pour consultation, vous
devrez fournir aux utilisateurs un moyen simple de décodage des sources
en codes sur
vos fiches. Ce type de répertoire codé est souvent intégré dans
les grandes banques
de données terminologiques en tant que base
de données documentaires.
Votre répertoire vous aidera à rassembler un corpus textuel
très varié qui comprendra :
- documents internes ou publiés dans le domaine étudié, à grande
diffusion ou à diffusion restreinte
- bases de données, dictionnaires, ouvrages terminologiques,
diverses bibliographies
- sites et portails Internet repérables à l'aide de moteurs
de recherche ponctuelle (p. ex. WebCorp) ou thématique
(p. ex. Vivísimo)
- répertoires de publications et bibliographies obtenues par
des documentalistes en ligne (si vous disposez d'un service documentaire,
ils peuvent vous télécharger des textes trouvés
sur Internet)
- textes recommandés par vos personnes-ressources ou vos spécialistes du domaine en question (ces derniers pourraient vous aviser aussi sur la qualité de certaines publications spécialisées)
- informations et articles repérés dans les journaux et
périodiques spécialisés traitant des développements
les plus récents dans la discipline en question
- actes de colloques, conférences et symposiums
- lois et règlements en vigueur dans la spécialité visée
- glossaires, lexiques et vocabulaires internes
- manuels, brochures et dépliants
- textes promotionnels et publicitaires
Vous aurez à examiner et à évaluer
toute la documentation répertoriée, à tenir
compte des avis donnés par les spécialistes et les
autres personnes-ressources, et ce, afin de sélectionner
les textes les plus représentatifs du savoir véhiculé dans
la spécialité à l'étude. En analysant
ce contenu spécialisé,
vous serez en mesure d'adopter le système
de classement le mieux adapté pour le structurer, d'établir
les arbres de domaines et les réseaux associatifs les plus
appropriés pour le représenter, et d'en extraire les termes ou
les unités terminologiques désignant les concepts propres
du domaine.
|