4.6.3. Herramientas de extracción de términos
El uso de herramientas de extracción terminológica automáticas o asistidas por computadora ayuda a minimizar las tareas repetitivas asociadas con el subrayado manual de los términos.
Algunos programas producen listas de palabras o de secuencias de palabras encontradas
en un texto o un corpus
textual que pueden ser examinadas para determinar si se trata de términos que merece la pena consignar.
La extracción
de términos, ya sea de forma automática o asistida por computadora, es un medio eficaz de "explotar" los documentos a su disposición y establecer una base
de datos terminológicos a partir del material ya existente.
Herramientas de extracción automática
Las herramientas de extracción automática permiten la extracción de términos sin intervención humana. A menudo, dado que el sistema sólo puede realizar la extracción terminológica siguiendo las instrucciones con las que ha sido programado, es preciso que una persona elimine de los ficheros resultantes las unidades seudoterminológicas. Con la ayuda de una función de indexación es posible parear automáticamente las medias fichas. Algunos productos incluyen también una función de extracción de términos a partir de textos bilingües y permiten encontrar automáticamente equivalentes para las unidades terminológicas. Algunas líneas de productos incluyen también una herramienta de alineación de textos, un módulo de creación de fichas y una memoria de los textos traducidos, todo lo anterior para facilitar la gestión de la terminología obtenida.
Herramientas de extracción asistida por computadora
Cuando el terminólogo desea
identificar él mismo los
términos que serán consignados, puede utilizar un programa de extracción
semiautomática como YVANHOÉ®, diseñado por
un terminólogo de la Oficina de Traducciones del Gobierno de Canadá.
El programa extrae los términos señalados en un documento electrónico
y los transfiere a fichas individuales junto con su contexto,
la referencia a la fuente y el número de la página.
El fichero resultante se recupera posteriormente utilizando un programa de
consignación
de datos (como LATTER® o TERMICOM®), de forma que
se pueda completar, agrupar y mejorar las fichas durante actividades de investigación
posteriores. Las fichas, una vez concluidas, se transfieren automáticamente
al banco
de datos TERMIUM®, a un programa de publicación electrónica
o a ambos.
|