Comparación entre OmegaT y Open Language Tools XLIFF Transeditor

Quote

Autora: Sonia Alenda Pastor

Estudiante del Posgrado en Traducción y Tecnologías de la UOC

1. Introducción

En este artículo voy a analizar en profundidad dos herramientas de traducción asistida: OmegaT y  Open Language Tools XLIFF Transeditor. Ambas son multiplataforma, gratuitas y de software libre. OmegaT puede obtenerse en la página  www.omegat.org. Los usuarios de Ubuntu pueden también descargarla desde el centro de recursos, pero esta es la versión 2.3.0_1, y está obsoleta (la última versión es la 2.5.5_3). Open Language Tools XLIFF Translation Editor se descarga desde http://java.net/projects/open-language-tools/downloads/directory/snapshots. Se recomienda también descargarse desde la misma página XLIFF Filters, que complementará al Translation Editor. La versión que podemos descargar es un “snapshot”, es decir, una versión que todavía está en desarrollo, por lo que no se ha terminado con el trabajo de QA. Esta herramienta fue realizada por Sun Microsystems, la compañía creadora de Java, para facilitar el trabajo de localización de software. Esta empresa fue adquirida por Oracle en abril de 2009.
En este trabajo se analizarán estas herramientas de acuerdo a cuatro parámetros diferentes: la interfaz, es decir, su organización, acceso del usuario a las distintas funcionalidades de la herramienta, y la ayuda o manual de instrucciones que instruye al usuario acerca de su uso; recursos de pretraducción y postraducción, es decir, cómo configurar un proyecto, creación de recursos como glosarios, memorias de traducción, traducción automática, etc. que servirán de apoyo al mismo, y facilidad para convertir el formato traducido en el formato original; formatos que permite; y por último, qué tipo de usuario y texto son más convenientes para cada herramienta.

Continue reading

Instalación del corrector ortográfico de OmegaT

Quote

La herramienta de traducción asistida OmegaT dispone de un corrector ortográfico y es muy fácil instalarlo. Es simplemente ortográfico, no gramatical, pero a menudo resulta de mucha ayuda para detectar alguna falta de ortografía. Más adelante comentaremos también la posibilidad de integrar corrección gramatical en OmegaT.

Para poder ejecutar la corrección ortográfica necesitamos tener instalado el diccionario correspondiente a la lengua de llegada. Ahora estamos hablando de diccionarios para el corrector ortográfico, no de los diccionarios que nos pueden servir para realizar consultas automáticas del significado de algunas palabras.

Instalación de un nuevo diccionario del corrector ortográfico

La instalación es muy sencilla. Hay que ir a Options> Spell checking y aparecerá la siguiente pantalla:

En esta pantalla podemos seleccionar la carpeta que contendrá los diccionarios ortográficos e instalar un nuevo diccionario pulsando sobre el botón Install new dictionary … Esta funcionalidad funcionará siempre y cuando la URL of online dictionaries sea correcta. La mejor manera de saberlo es probarlo. Si es correcta aparecerá la siguiente pantalla:

En el momento de hacer esta entrada la dirección correcta se http://download.services.openoffice.org/files/contrib/dictionaries/ de modo que si no tiene esta la puedes copiar.

De aquí seleccionamos la lengua que queremos y hacemos clic en Install. Después de la instalación en el idioma aparecerá en la lista de diccionarios instalados:

Ahora también debemos asegurarnos de que la casilla Automatically check the spelling of text esté marcada.

A partir de este momento la corrección ortográfica funcionará.

Si no funciona es posible que no coincidan los códigos de la lengua de llegada del proyecto. Lo podemos verificar yendo a Project> Properties. Si por ejemplo, tenemos la costumbre de usar un código del tipo CA para el nuestros proyectos y el diccionario espera un código del tipo ca-ES, podemos renombrar los dos archivos de la carpeta de nuestro ordenador que contiene los diccionarios o incluso copiarlos y crear una nueva versión que tengan por nombre CA.aff y CA.dic. En nuestro ejemplo hemos copiado y renombrado, por lo que mantenemos las dos versiones:

Ahora automáticamente, en la pantalla Options> Spell checking tendremos los diccionarios correspondientes a los dos códigos.

Instal·lació del corrector ortogràfic d’OmegaT

Quote

L’eina de traducció assistida OmegaT disposa d’un corrector ortogràfic i és molt fàcil instal·lar-lo. És simplement ortogràfic, no gramatical, però sovint resulta de molta ajuda per detectar errors de picatge o alguna falta d’ortografia. Més endavant comentarem també la possibilitat d’integrar correcció gramatical a OmegaT.

Per poder executar la correcció ortogràfica necessitem tenir instal·lat el diccionari corresponent a la llengua d’arribada. Ara estem parlant de diccionaris per al corrector ortogràfic, no dels diccionaris que ens poden servir per realitzar consultes automàtiques del significat d’algunes paraules.

Instal·lació d’un nou diccionari del corrector ortogràfic

La instal·lació és molt senzilla. Cal anar a Options > Spell checking i hi apareixerà la següent pantalla:

En aquesta pantalla podem seleccionar la carpeta que contindrà els diccionaris ortogràfics i instal·lar un nou diccionari clicant sobre el botó Install new dictionary… Aquesta funcionalitat funcionarà sempre i quan la URL of online dictionaries sigui correcta. La millor manera de saber-ho és provar-ho. Si és correcta apareixerà la següent pantalla:

En el moment de fer aquesta entrada l’adreça correcta és http://download.services.openoffice.org/files/contrib/dictionaries/ de manera que si no teniu aquesta la podeu copiar.

D’aquí seleccionem la llengua que volem i fem clic a Install. Després de la instal·lació al llengua apareixerà a la llista de diccionaris instal·lats:

Ara també ens hem d’assegurar que la casella Automatically check the spelling of text estigui marcada.

A partir d’aquest moment la correcció ortogràfica funcionarà.

 Si no funciona és possible que no coincideixin els codis de la llengua d’arribada del projecte. Ho podem verificar anant a Project > Properties. Si per exemple, tenim el costum de fer servir un codi del tipus CA per al nostres projectes i el diccionari espera un codi del tipus ca-ES, podem renombrar els dos arxius de la carpeta del nostre ordinador que conté els diccionaris o fins i tot copiar-los i crear una nova versió que tinguin per nom CA.aff i CA.dic. En el nostre exemple hem copiat i renombrat, de manera que mantenim les dues versions:

Ara automàticament, a la pantalla Options > Spell checking tindrem els diccionaris corresponents als dos codis.

 

 

Un MOOC sobre traducció: OT12: An Open Translation MOOC

Quote

El departament de llengües de la Open University (Regne Unit) està oferint un MOOC (Massive Open Online Course) sobre traducció. El curs ha començat avui mateix, dia 15 de octubre, però encara és possible inscriure’s. Aquest cursos són gratuïts i oberts a tothom. Et pots apuntar simplement per veure de què va, o fer les activitats i interactuar en els fòrums.

El curs està organitzat en 9 setmanes, amb la següent planificació:

Setmana 1 i 2. Subtitulació de vídeo

Setmana 3,4,5 i 6 Traducció col·laborativa de recursos oberts.

Setmana 7 i 8 Cerca i avaluació d’eines i projectes de traducció oberta

Setmana 9 Avaluació

Podeu trobar més informació sobre aquest curs a: http://www.ot12.org/

Conferencia “Cómo usar los recursos disponibles en Internet para crear bases de datos terminológicas”

Quote

El próximo día 20 de septiembre Antoni Oliver, director del posgrado en Traducción y tecnologías de la UOC, dará una conferencia sobre herramientas para aprovechar algunos recursos de Internet para crear bases de datos terminológicas.

La conferencia tendrá lugar en Sede de la UOC de Madrid (Plaza de las Cortes, 4) a las 18.30 h. La conferencia es gratuita pero es necesario inscribirse aquí.

Posteriormente, el día 4 de octubre a las 18,30 h. se ofrecerá la misma conferencia en la Sede de la UOC de Barcelona (Av. Tibidabo, 39-43, sala Jordi Pujol). Si quieres inscribirte a esta conferencia puedes inscribirte aquí.

El objetivo es ver cómo podemos crear bases de datos terminológicas en formatos utilizables en las herramientas de traducción asisitida más habituales a partir de algunos recursos disponibles en Internet. La herramienta de traducción asistida que utilizaremos en la conferencia será OmegaT, pero los archivos que generaremos se podrán utilizar en la mayoría de herramientas de traducción asistida.

En primer lugar veremos cómo aprovechar los ficheros de Terminologia Oberta del TermCat para crear archivos en formato TMX (Term Base eXchange) y de texto tabulado.

Posteriormente analizaremos algunas fuentes habituales de consulta terminológica y veremos si es posible o no extraer datos para crear bases de datos terminológicas.

Por último veremos la manera de crear bases de datos terminológicas a partir de la Wikipedia. Para ello utilizaremos la herramienta Wikipedia2TBX que ha sido presentada en esta entrada de nuestro blog.

Espero que esta conferencia os resulte interesante y contar con vuestra presencia en Madrid o en Barcelona.