Hoy hemos seguido con el tema 6, el cual nos presenta una serie de conocimientos básicos sobre la traducción asistida, concretamente de las memorias de traducción y aplicaciones complementarias. La clase de hoy ha girado en torno a las bases de datos terminológicas.
En primer lugar hemos continuado definiendo las utilidades de un programa gestor de bases de datos terminológicos, que son: Diseñar una estructura de campos específica en cada caso, almacenar y ordenar el resultado de nuestras búsquedas de términos, consultar de forma automática y el intercambio de datos (exportar e importar).
A continuación hemos visto que las bases de datos terminológicos son estructuras adaptadas a la gestión terminológica, aunque también pueden tener interacción con el procesador de textos y con la memoria de traducción. Algunos de estos progamas son: Multiterm, MemoQ, TremStar etc.
Estas bases de datos terminológicas permiten mantener la información estructurada en fichas, entradas o registros y campos.
Existen diferentes tipos de campos: alfanuméricos, booleanos, memos, autoincrementables…
Las fichas están estructuradas en diferentes niveles: nivel entrada, nivel índice y nivel término.
Tienen estructuras cada vez más flexibles.
Además estos programas nos permiten recuperar datos: para ello podemos hacer una búsqueda simple, difusa (fuzzy search) o podemos utilizar comodines o filtros.
También permiten el reconocimiento activo de la terminología: para ello se integran con la memoria de traducción y reconocen la terminología de forma automática.
Otras ventajas de las bases de datos terminológicas son su constante actualización y su mayor consistencia, que permiten reducir costes de traductores además de mejorar la calidad lingüística y reducir el coste temporal.
Una de las técnicas empleadas para gestionar terminologia es la extracción terminológica: identifican términos posibles y los sugieren al traductor (siempre es necesaria la revisión humana). Para ello puede utilizar dos tipos de análisis:
– Para el análisis lingüístico es necesario configurar el programa con los idiomas que estamos trabajando ya que cada lengua tiene sus propios patrones lingüísticos específicos de esta manera el análisis de errores es más exacto. Requiere que el corpus esté etiquetado
– En cuanto al análisis estadístico, permite la búsqueda de series de elementos léxicos repetidos. Esto sirve para todos los idiomas, pero es menos exacto.
También hemos hablado del formato de Intercambio: TBX. Se trata del formato estándar para el intercambio de terminología. Está basado en XML.
Resumen de Claudia Jaime Tamayo