La base de datos terminológica IATE, ahora es descargable

Quote

IATE, la base de datos de la Unión Europea, que ha sido un recurso de consulta básico para miles de traductores, es ahora descargable. Toda la base de datos se puede descargar en un único archivo TBX desde http://iate.europa.eu/tbxPageDownload.do.

A continuación podemos observar un ejemplo de entrada:


<termEntry id="IATE-84">
<descripGrp>
<descrip type="subjectField">1011</descrip>
</descripGrp>
<langSet xml:lang="bg">
<tig>
<term>компетенции на държави членове</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="cs">
<tig>
<term>příslušnost členských států</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="da">
<tig>
<term>medlemsstatskompetence</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="de">
<tig>
<term>Zuständigkeit der Mitgliedstaaten</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="el">
<tig>
<term>αρμοδιότητα των κρατών μελών</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="en">
<tig>
<term>competence of the Member States</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="es">
<tig>
<term>competencias de los Estados miembros</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="et">
<tig>
<term>liikmesriikide pädevus</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="fi">
<tig>
<term>jäsenvaltioiden toimivalta</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="fr">
<tig>
<term>compétence des États membres</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="ga">
<tig>
<term>inniúlacht na mBallstát</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="hu">
<tig>
<term>tagállami hatáskör</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="it">
<tig>
<term>competenza degli Stati membri</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="lt">
<tig>
<term>valstybių narių kompetencija</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">2</descrip>
</tig>
</langSet>
<langSet xml:lang="lv">
<tig>
<term>dalībvalstu kompetence</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="nl">
<tig>
<term>bevoegdheid van de lidstaten</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="pl">
<tig>
<term>kompetencje państw członkowskich</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="pt">
<tig>
<term>competência dos Estados-Membros</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="ro">
<tig>
<term>competența statelor membre ale Uniunii Europene</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="sk">
<tig>
<term>právomoci členských štátov</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="sl">
<tig>
<term>pristojnost držav članic</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="sv">
<tig>
<term>medlemsstaternas behörighet</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
</termEntry>

Como podemos observar, se trata de una base de datos multilingüe de las lenguas oficiales de la Unión Europea. No todas las entradas están en todas las lenguas. Las entradas contienen también información de campo temático (subjectField) que en esta entrada es el 1011, que corresponde a European Union Law.

En la siguiente tabla podemos observar todos los códigos de campo temático del IATE:

04 POLITICS
0406 Political framework
0411 Political Parties
0416 Electoral procedure and voting
0421 Parliament
0426 Parliamentary proceedings
0431 Politics and public safety
0436 Executive power and public service
08 INTERNATIONAL RELATIONS
0806 International affairs
0811 Cooperation policy
0816 International balance
0821 Defence
10 EUROPEAN UNION
1006 EU institutions and European civil service
1011 European Union law
1016 European construction
1021 EU finance
12 LAW
1206 Sources and branches of the law
1211 Civil law
1216 Criminal law
1221 Justice
1226 Organisation of the legal system
1231 International law
1236 Rights and freedoms
16 ECONOMICS
1606 Economic policy
1611 Economic growth
1616 Regions and regional policy
1621 Economic structure
1626 National accounts
1631 Economic analysis
20 TRADE
2006 Trade policy
2011 Tariff policy
2016 Trade
2021 International trade
2026 Consumption
2031 Marketing
2036 Distributive trades
24 FINANCE
2406 Monetary relations
2411 Monetary economics
2416 Financial institutions and credit
2421 Free movement of capital
2426 Financing and investment
2431 Insurance
2436 Public finance and budget policy
2441 Budget
2446 Taxation
2451 Prices
28 SOCIAL QUESTIONS
2806 Family
2811 Migration
2816 Demography and population
2821 Social framework
2826 Social affairs
2831 Culture and religion
2836 Social protection
2841 Health
2846 Construction and town planning
32 EDUCATION AND COMMUNICATIONS
3206 Education
3211 Teaching
3216 Organisation of teaching
3221 Documentation
3226 Communications
3231 Information and information processing
3236 Information technology and data processing
36 SCIENCE
3606 Natural and applied sciences
3611 Humanities
40 BUSINESS AND COMPETITION
4006 Business organisation
4011 Business classification
4016 Legal form of organisations
4021 Management
4026 Accounting
4031 Competition
44 EMPLOYMENT AND WORKING CONDITIONS
4406 Employment
4411 Labour market
4416 Organisation of work and working conditions
4421 Personnel management and staff remuneration
4426 Labour law and labour relations
48 TRANSPORT
4806 Transport policy
4811 Organisation of transport
4816 Land transport
4821 Maritime and inland waterway transport
4826 Air and space transport
52 ENVIRONMENT
5206 Environmental policy
5211 Natural environment
5216 Deterioration of the environment
56 AGRICULTURE, FORESTRY AND FISHERIES
5606 Agricultural policy
5611 Agricultural structures and production
5616 Farming systems
5621 Cultivation of agricultural land
5626 Means of agricultural production
5631 Agricultural activity
5636 Forestry
5641 Fisheries
60 AGRI-FOODSTUFFS
6006 Plant product
6011 Animal product
6016 Processed agricultural produce
6021 Beverages and sugar
6026 Foodstuff
6031 Agri-foodstuffs
6036 Food technology
64 PRODUCTION, TECHNOLOGY AND RESEARCH
6406 Production
6411 Technology and technical regulations
6416 Research and intellectual property
66 ENERGY
6606 Energy policy
6611 Coal and mining industries
6616 Oil industry
6621 Electrical and nuclear industries
6626 Soft energy
68 INDUSTRY
6806 Industrial structures and policy
6811 Chemistry
6816 Iron, steel and other metal industries
6821 Mechanical engineering
6826 Electronics and electrical engineering
6831 Building and public works
6836 Wood industry
6841 Leather and textile industries
6846 Miscellaneous industries
72 GEOGRAPHY
7206 Europe
7211 Regions of EU Member States
7216 America
7221 Africa
7226 Asia and Oceania
7231 Economic geography
7236 Political geography
7241 Overseas countries and territories
76 INTERNATIONAL ORGANISATIONS
7606 United Nations
7611 European organisations
7616 Extra-European organisations
7621 World organisations
7626 Non-governmental organisations

Se puede acceder a una lista mucho más detallada de los códigos de campo temático en: http://iate.europa.eu/tbx/IATE%20domain%20codes.csv

Cada entrada tiene también una información de fiabilidad (reliabilityCode) que puede tener tres niveles:

1: Fiabilidad no verificada
2: Fiabilidad mínima
3: Fiable
4: Muy fiable

Se puede encontrar una descripción completa de la información sobre los temas de la IATE en: http://iate.europa.eu/tbx/IATE%20Data%20Fields%20Explaind.htm

En fin, todos los traductores estamos de enhorabuena, ya que este es un recurso terminológico de valor incalculable. El fichero que lo contiene es de muy gran tamaño y su uso directo no será fácil. Como que la licencia permite la reutilización y redistribución, pronto apareceran glosarios asociados, de menor tamaño, que contengan algunas de las áreas temáticas y para determinadas lenguas.

Estad atentos a este blog para novedades sobre este tema.

Primer contacto con Linux (V): Máquina virtual

Quote

En esta entrada vamos a explicar cómo instalar Linux en una máquina virtual. Vamos a explicarlo para una distribución Xubuntu 12.10, pero la misma explicación es válida para cualquier otra distribución.

Esta opción es buena para la siguiente situación.

Dispongo de un ordenador con cualquier sistema operativo y quiero trabajar eventualmente con Linux manteniendo inalterado el sistema operativo habitual

Suponemos que hemos descargado una imagen de la distribución que queremos instalar y que hemos creado el disco de arranque (si no es así, consultad la siguiente entrada).

Continue reading

Primer contacto con el sistema operativo Linux

Quote

Durante los próximos días voy a publicar una serie de entradas dedicadas a dar los primeros pasos en la utilización del sistema operativo Linux. Este es un sistema operativo libre que está consiguiendo unos niveles de fiabilidad, seguridad y facilidad de uso excepcionales. Esto unido a que se puede obtener de forma gratuita, hace que sea una opción a tener muy en cuenta como sistema operativo de uso habitual. Atrás quedan los días en que Linux quedaba relegado a gurús de la informática por su dificultad de instalación y uso. Ahora instalar Linux es muy sencillo y su uso es fácil e intuitivo.

Para obtener de manera rápida los conceptos más interesantes sobre Linux y el software libre es muy recomendable la lectura del primer apartado (Presentación) del primer módulo de la asignatura Sistema Operativo GNU/Linux básico de la UOC libre que se puede obtener de aquí en castellano y de aquí en catalán.

Continue reading

Charla virtual

Quote

translationEl próximo jueves 3 de octubre a las 18 horas tendrá lugar la charla Herramientas para la gestión de proyectos de traducción en formato virtual (para los que no hayáis podido asistir a las de Madrid y Barcelona) que se organiza en el marco de la presentación del nuevo Máster de Traducción especializada de los Estudios de Artes y Humanidades de la UOC.

Para inscribirse en la charla, que irá a cargo del director académico Antoni Oliver, hay que escribir un correo a tit@uoc.edu.

Comparación entre OmegaT y Open Language Tools XLIFF Transeditor

Quote

Autora: Sonia Alenda Pastor

Estudiante del Posgrado en Traducción y Tecnologías de la UOC

1. Introducción

En este artículo voy a analizar en profundidad dos herramientas de traducción asistida: OmegaT y  Open Language Tools XLIFF Transeditor. Ambas son multiplataforma, gratuitas y de software libre. OmegaT puede obtenerse en la página  www.omegat.org. Los usuarios de Ubuntu pueden también descargarla desde el centro de recursos, pero esta es la versión 2.3.0_1, y está obsoleta (la última versión es la 2.5.5_3). Open Language Tools XLIFF Translation Editor se descarga desde http://java.net/projects/open-language-tools/downloads/directory/snapshots. Se recomienda también descargarse desde la misma página XLIFF Filters, que complementará al Translation Editor. La versión que podemos descargar es un “snapshot”, es decir, una versión que todavía está en desarrollo, por lo que no se ha terminado con el trabajo de QA. Esta herramienta fue realizada por Sun Microsystems, la compañía creadora de Java, para facilitar el trabajo de localización de software. Esta empresa fue adquirida por Oracle en abril de 2009.
En este trabajo se analizarán estas herramientas de acuerdo a cuatro parámetros diferentes: la interfaz, es decir, su organización, acceso del usuario a las distintas funcionalidades de la herramienta, y la ayuda o manual de instrucciones que instruye al usuario acerca de su uso; recursos de pretraducción y postraducción, es decir, cómo configurar un proyecto, creación de recursos como glosarios, memorias de traducción, traducción automática, etc. que servirán de apoyo al mismo, y facilidad para convertir el formato traducido en el formato original; formatos que permite; y por último, qué tipo de usuario y texto son más convenientes para cada herramienta.

Continue reading

Instalación del corrector ortográfico de OmegaT

Quote

La herramienta de traducción asistida OmegaT dispone de un corrector ortográfico y es muy fácil instalarlo. Es simplemente ortográfico, no gramatical, pero a menudo resulta de mucha ayuda para detectar alguna falta de ortografía. Más adelante comentaremos también la posibilidad de integrar corrección gramatical en OmegaT.

Para poder ejecutar la corrección ortográfica necesitamos tener instalado el diccionario correspondiente a la lengua de llegada. Ahora estamos hablando de diccionarios para el corrector ortográfico, no de los diccionarios que nos pueden servir para realizar consultas automáticas del significado de algunas palabras.

Instalación de un nuevo diccionario del corrector ortográfico

La instalación es muy sencilla. Hay que ir a Options> Spell checking y aparecerá la siguiente pantalla:

En esta pantalla podemos seleccionar la carpeta que contendrá los diccionarios ortográficos e instalar un nuevo diccionario pulsando sobre el botón Install new dictionary … Esta funcionalidad funcionará siempre y cuando la URL of online dictionaries sea correcta. La mejor manera de saberlo es probarlo. Si es correcta aparecerá la siguiente pantalla:

En el momento de hacer esta entrada la dirección correcta se http://download.services.openoffice.org/files/contrib/dictionaries/ de modo que si no tiene esta la puedes copiar.

De aquí seleccionamos la lengua que queremos y hacemos clic en Install. Después de la instalación en el idioma aparecerá en la lista de diccionarios instalados:

Ahora también debemos asegurarnos de que la casilla Automatically check the spelling of text esté marcada.

A partir de este momento la corrección ortográfica funcionará.

Si no funciona es posible que no coincidan los códigos de la lengua de llegada del proyecto. Lo podemos verificar yendo a Project> Properties. Si por ejemplo, tenemos la costumbre de usar un código del tipo CA para el nuestros proyectos y el diccionario espera un código del tipo ca-ES, podemos renombrar los dos archivos de la carpeta de nuestro ordenador que contiene los diccionarios o incluso copiarlos y crear una nueva versión que tengan por nombre CA.aff y CA.dic. En nuestro ejemplo hemos copiado y renombrado, por lo que mantenemos las dos versiones:

Ahora automáticamente, en la pantalla Options> Spell checking tendremos los diccionarios correspondientes a los dos códigos.

Conferencia “Cómo usar los recursos disponibles en Internet para crear bases de datos terminológicas”

Quote

El próximo día 20 de septiembre Antoni Oliver, director del posgrado en Traducción y tecnologías de la UOC, dará una conferencia sobre herramientas para aprovechar algunos recursos de Internet para crear bases de datos terminológicas.

La conferencia tendrá lugar en Sede de la UOC de Madrid (Plaza de las Cortes, 4) a las 18.30 h. La conferencia es gratuita pero es necesario inscribirse aquí.

Posteriormente, el día 4 de octubre a las 18,30 h. se ofrecerá la misma conferencia en la Sede de la UOC de Barcelona (Av. Tibidabo, 39-43, sala Jordi Pujol). Si quieres inscribirte a esta conferencia puedes inscribirte aquí.

El objetivo es ver cómo podemos crear bases de datos terminológicas en formatos utilizables en las herramientas de traducción asisitida más habituales a partir de algunos recursos disponibles en Internet. La herramienta de traducción asistida que utilizaremos en la conferencia será OmegaT, pero los archivos que generaremos se podrán utilizar en la mayoría de herramientas de traducción asistida.

En primer lugar veremos cómo aprovechar los ficheros de Terminologia Oberta del TermCat para crear archivos en formato TMX (Term Base eXchange) y de texto tabulado.

Posteriormente analizaremos algunas fuentes habituales de consulta terminológica y veremos si es posible o no extraer datos para crear bases de datos terminológicas.

Por último veremos la manera de crear bases de datos terminológicas a partir de la Wikipedia. Para ello utilizaremos la herramienta Wikipedia2TBX que ha sido presentada en esta entrada de nuestro blog.

Espero que esta conferencia os resulte interesante y contar con vuestra presencia en Madrid o en Barcelona.

 

Libros electrónicos bilingües

Quote

El Language Processing Group (LPG) de la UOC está llevando a cabo un proyecto para la creación de libros electrónicos bilingües interactivos. El objetivo del proyecto es publicar obras literarias en versión original con enlaces directos a los párrafos traducidos en castellano o catalán (dependiendo de la disponibilidad de la traducción) De esta manera el lector puede pasar automáticamente de la versión original a la versión traducida.

Hasta el momento se han publicado tres obras literarias en este formato:

  • The adventures of Sherlock Holmes de Arthur Conan Doyle en versión inglesa y castellana
  • Les Trois Mousquetaires de Alexandre Dumas en versión francesa y castellana
  • Игрок de Dostoyevski en versión rusa y castellana

Todas estas obras se pueden descargar en formato html, epub y mobi de la web http://lpg.uoc.edu/InLector/

El proyecto se encuentra en un estado inicial y en búsqueda de financiación. En un futuro las obras que se publiquen incluirán también el audio de la versión origial y enlaces a información adicional.

Para cualquier duda o sugerencia nos puedes escribir a inlector@gmail.com