Wikipedia2TBX: creación de glosarios terminológicos a partir de la Wikipedia

Quote

1. Introducción

La Wikipedia (http:wikipedia.org)  es una enciclopedia libre que se ha creado de forma colaborativa. Esta enciclopedia es, además, multilingüe, es decir, hay versiones de la Wikipedia para un gran número de lenguas. Para cada entrada de la Wikipedia disponemos de enlaces interlingüísticos, que nos llevan directamente al mismo artículo en otra lengua.Los artículos de la Wikipedia, además, están organizados por categorías. Esto hace que se puedan construir glosarios terminológicos a partir de las entradas de la Wikipedia.

El programa que presentamos en este documento es capaz de crear glosarios terminológicos multilingües a partir de la Wikipedia. Para crearlos, el programa necesita saber de qué área o áreas temáticas y cuáles son las lenguas implicadas. Con estos datos mira todas las entradas de la Wikipedia inglesa que tengan asignadas las áreas temáticas dadas y mira si tiene enlaces interlingüísticos para las lenguas requeridas. A partir de los datos que va recogiendo confecciona un glosario terminológico multilingüe y crea un fichero en formato TBX (Term Base Exchange). También puede crear un glosario en formato tabulado para OmegaT. Estos glosarios son bilingües y por lo que sólo se tienen en cuenta las dos primeras lenguas dadas en el programa, la primera como lengua de partida, y la segunda como lengua de llegada. El resto de lenguas, para la creación del glosario en formato tabulado, las ignora.

Continue reading

Nuevos cursos de verano relacionados con la traducción

Quote

Este año, en el marco de la Universidad Virtual de Verano, se ofrecen dos cursos relacionados con la traducción. Estos cursos son de 1 crédito ECTS y se realizan en julio. Los cursos son a distancia. A continuación os ofrezco un pequeño resumen de los cursos. Podéis obtener más información en este enlace.  Se ofrecen dos cursos más en catalán, si estáis interesados, consultad la siguiente entrada.

Traducción asistida con OmegaT

El traductor, en su tarea diaria, debe consultar numerosas fuentes: diccionarios, glosarios terminológicos, etc. También tiene que traducir a menudo oraciones muy parecidas a oraciones ya traducidas anteriormente (en el mismo texto o en otros traducidos anteriormente). También debe traducir textos de diferentes formatos con la necesidad de abrirlos en distintos editores. Por suerte, hay una serie de herramientas llamadas genéricamente herramientas de traducción asistida que facilitan y automatizan estas tareas. En este curso se aprenden las funciones básicas de la herramienta de traducción asistida de software libre OmegaT. Esta herramienta se está convirtiendo en el principal referente de herramientas de traducción asistida de software libre.

Localización de videojuegos

Los últimos años, el mundo digital ha vivido un progreso sin precedentes y actualmente no es extraño que los traductores se encuentren con encargos de traducción que superan las fronteras del texto e incorporan elementos audiovisuales que también tienen que ser traducidos. El objetivo de este curso es dotar a los estudiantes de una perspectiva general sobre el ámbito del software de entretenimiento, hacerlos partícipes del proceso de adaptación de un videojuego y mostrar, mediante ejemplos y prácticas concretas, la amplia variedad de textos y técnicas que tiene que dominar para enfrentarse a un encargo de este tipo. Además, se abordarán temas complementarios como el control de calidad y las posibilidades de trabajo reales.

La memoria de traducción multilingüe DGT del Acquis communautaire

Quote

El Acquis communautaire comprende la totalidad de la legislación europea, es decir, todos los tratados, regulaciones y directivas adoptadas por la Unión Europea (EU). Todos estos documentos están traducidos a 22 lenguas: búlgaro, checo, danés, holandés, inglés, estonio, alemán, griego, finlandés, francés, húngaro, italiano, lituano, maltés, polaco, portugués, rumano, eslovaco, esloveno, español y sueco .A partir de estos documentos se han creado una serie de memorias de traducción multilingües que se pueden descargar y utilizar libremente de http://langtech.jrc.ec.europa.eu/DGT-TM.html.Los usuarios seguramente preferirán tener una única memoria de traducción más grande pero que incluya únicamente su par de lenguas de trabajo. Además de las memorias de traducción, de esta página también se puede descargar una aplicación que permite extraer un único TMX con un par de lenguas. El uso de esta aplicación es muy sencillo y está plenamente documentado.

http://lpg.uoc.edu/corpus/DGTpodéis algunos pares de lenguas ya transformados a TMX y a texto tabulado. Concretamente se encuentran los pare singlés con todo las demás lenguas y también castellano con todas las demás. Espero que estos enlaces directos os resulten de utilidad.

TES (Terminology Extraction Suite): Distibución para Windows

Quote

Esta herramienta de extracción automática de terminología, desarrollada especialmente para nuestro postgrado en traducción y tecnologías, es una herramienta de software libre que permite extraer términos y buscar automáticamente equivalentes de traducción. Esta herramienta, a pesar de estar pensada para la docencia de los conceptos relacionados con la extracción automática de terminología, se puede emplear de manera muy eficiente en entornos profesionales.

La herramienta está escrita en Perl y con interfaces gráficas implementadas en Tk. Esto implica que sea necesario instalar una serie de herramientas y paquetes adicionales en el ordenador, especialmente si éste funciona bajo Windows. Este proceso no es demasiado complicado y está perfectamente explicado en los manuales que se distribuyen con la aplicación. Sea como sea, este hecho generaba algunas dificultades a los usuarios y por este motivo hemos decidido lanzar una distribución especial para Windows que no necesita ningún tipo de instalación adicional. Sólo hay que descargar el archivo zip y descomprimirlo en cualquier carpeta. A partir de aquí sólo hay que hacer doble clic sobre TES-Wizard.exe (para calcular los candidatos a términos) o sobreTES-Editor.exe (para editarlos y calcular los equivalentes de traducción).

Esta distribución para Windows se puede descargar desde: http://lpg.uoc.edu/TES/TES-09.03-win.zip

La versión fuente apta tanto para Linux, Mac como Windows (hay que tener el intérprete de Perl y algunos paquetes adicionales). se puede descargar de: http://lpg.uoc.edu/TES/TES-09.03.zip

Esperamos que esta nueva distribución facilite el trabajo a los usuarios habituales de Windows.

Recuerda que TES es una herramienta de software libre, es decir, que la puedes descargar libremente, usarla y redistribuirla entre tus colegas. Todo ello sin ningún coste de licencia y de una manera totalmente legal.

Antoni Oliver