4.7.2. Textes électroniques et reconnaissance optique des caractères
(ROC)
Les organismes gouvernementaux, établissements de recherche, universités
et l'entreprise privée distribuent un nombre croissant de documents électroniques
sur leur site Web, avec la permission de les télécharger. Vous
pouvez accéder à de la documentation sur le site d'associations
professionnelles, de la presse et des réseaux de télévision,
bien que cet accès ne soit pas toujours gratuit. Ces sources documentaires
sont actuellement les plus fréquemment utilisées pour effectuer
un dépouillement terminologique.
Il suffit de les trouver à l'aide des guides de recherche et de navigation
sur Internet, de les indexer et de les dépouiller avec des outils
tels qu'Isys Desktop ou AltaVista Discovery. Cependant, certains
documents ne sont parfois disponibles que sous format papier.
Si vous ne pouvez obtenir que des documents papier, vous pouvez les scanner et en faire une version électronique. Une fois le texte converti, vous pouvez utiliser un dépouilleur assisté par
ordinateur ou automatique tel que Nomino, MultiTrans ou EdiTerm.
Étant donné la technologie actuelle en matière de ROC,
cette option n'est pas recommandée pour des documents volumineux ou
pour une mise en page complexe (avec graphiques, schémas, tableaux,
plusieurs langues, etc.).
|