La base de datos terminológica IATE, ahora es descargable

Quote

IATE, la base de datos de la Unión Europea, que ha sido un recurso de consulta básico para miles de traductores, es ahora descargable. Toda la base de datos se puede descargar en un único archivo TBX desde http://iate.europa.eu/tbxPageDownload.do.

A continuación podemos observar un ejemplo de entrada:


<termEntry id="IATE-84">
<descripGrp>
<descrip type="subjectField">1011</descrip>
</descripGrp>
<langSet xml:lang="bg">
<tig>
<term>компетенции на държави членове</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="cs">
<tig>
<term>příslušnost členských států</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="da">
<tig>
<term>medlemsstatskompetence</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="de">
<tig>
<term>Zuständigkeit der Mitgliedstaaten</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="el">
<tig>
<term>αρμοδιότητα των κρατών μελών</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="en">
<tig>
<term>competence of the Member States</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="es">
<tig>
<term>competencias de los Estados miembros</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="et">
<tig>
<term>liikmesriikide pädevus</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="fi">
<tig>
<term>jäsenvaltioiden toimivalta</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="fr">
<tig>
<term>compétence des États membres</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="ga">
<tig>
<term>inniúlacht na mBallstát</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="hu">
<tig>
<term>tagállami hatáskör</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="it">
<tig>
<term>competenza degli Stati membri</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="lt">
<tig>
<term>valstybių narių kompetencija</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">2</descrip>
</tig>
</langSet>
<langSet xml:lang="lv">
<tig>
<term>dalībvalstu kompetence</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="nl">
<tig>
<term>bevoegdheid van de lidstaten</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="pl">
<tig>
<term>kompetencje państw członkowskich</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="pt">
<tig>
<term>competência dos Estados-Membros</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="ro">
<tig>
<term>competența statelor membre ale Uniunii Europene</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="sk">
<tig>
<term>právomoci členských štátov</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="sl">
<tig>
<term>pristojnost držav članic</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
<langSet xml:lang="sv">
<tig>
<term>medlemsstaternas behörighet</term>
<termNote type="termType">fullForm</termNote>
<descrip type="reliabilityCode">3</descrip>
</tig>
</langSet>
</termEntry>

Como podemos observar, se trata de una base de datos multilingüe de las lenguas oficiales de la Unión Europea. No todas las entradas están en todas las lenguas. Las entradas contienen también información de campo temático (subjectField) que en esta entrada es el 1011, que corresponde a European Union Law.

En la siguiente tabla podemos observar todos los códigos de campo temático del IATE:

04 POLITICS
0406 Political framework
0411 Political Parties
0416 Electoral procedure and voting
0421 Parliament
0426 Parliamentary proceedings
0431 Politics and public safety
0436 Executive power and public service
08 INTERNATIONAL RELATIONS
0806 International affairs
0811 Cooperation policy
0816 International balance
0821 Defence
10 EUROPEAN UNION
1006 EU institutions and European civil service
1011 European Union law
1016 European construction
1021 EU finance
12 LAW
1206 Sources and branches of the law
1211 Civil law
1216 Criminal law
1221 Justice
1226 Organisation of the legal system
1231 International law
1236 Rights and freedoms
16 ECONOMICS
1606 Economic policy
1611 Economic growth
1616 Regions and regional policy
1621 Economic structure
1626 National accounts
1631 Economic analysis
20 TRADE
2006 Trade policy
2011 Tariff policy
2016 Trade
2021 International trade
2026 Consumption
2031 Marketing
2036 Distributive trades
24 FINANCE
2406 Monetary relations
2411 Monetary economics
2416 Financial institutions and credit
2421 Free movement of capital
2426 Financing and investment
2431 Insurance
2436 Public finance and budget policy
2441 Budget
2446 Taxation
2451 Prices
28 SOCIAL QUESTIONS
2806 Family
2811 Migration
2816 Demography and population
2821 Social framework
2826 Social affairs
2831 Culture and religion
2836 Social protection
2841 Health
2846 Construction and town planning
32 EDUCATION AND COMMUNICATIONS
3206 Education
3211 Teaching
3216 Organisation of teaching
3221 Documentation
3226 Communications
3231 Information and information processing
3236 Information technology and data processing
36 SCIENCE
3606 Natural and applied sciences
3611 Humanities
40 BUSINESS AND COMPETITION
4006 Business organisation
4011 Business classification
4016 Legal form of organisations
4021 Management
4026 Accounting
4031 Competition
44 EMPLOYMENT AND WORKING CONDITIONS
4406 Employment
4411 Labour market
4416 Organisation of work and working conditions
4421 Personnel management and staff remuneration
4426 Labour law and labour relations
48 TRANSPORT
4806 Transport policy
4811 Organisation of transport
4816 Land transport
4821 Maritime and inland waterway transport
4826 Air and space transport
52 ENVIRONMENT
5206 Environmental policy
5211 Natural environment
5216 Deterioration of the environment
56 AGRICULTURE, FORESTRY AND FISHERIES
5606 Agricultural policy
5611 Agricultural structures and production
5616 Farming systems
5621 Cultivation of agricultural land
5626 Means of agricultural production
5631 Agricultural activity
5636 Forestry
5641 Fisheries
60 AGRI-FOODSTUFFS
6006 Plant product
6011 Animal product
6016 Processed agricultural produce
6021 Beverages and sugar
6026 Foodstuff
6031 Agri-foodstuffs
6036 Food technology
64 PRODUCTION, TECHNOLOGY AND RESEARCH
6406 Production
6411 Technology and technical regulations
6416 Research and intellectual property
66 ENERGY
6606 Energy policy
6611 Coal and mining industries
6616 Oil industry
6621 Electrical and nuclear industries
6626 Soft energy
68 INDUSTRY
6806 Industrial structures and policy
6811 Chemistry
6816 Iron, steel and other metal industries
6821 Mechanical engineering
6826 Electronics and electrical engineering
6831 Building and public works
6836 Wood industry
6841 Leather and textile industries
6846 Miscellaneous industries
72 GEOGRAPHY
7206 Europe
7211 Regions of EU Member States
7216 America
7221 Africa
7226 Asia and Oceania
7231 Economic geography
7236 Political geography
7241 Overseas countries and territories
76 INTERNATIONAL ORGANISATIONS
7606 United Nations
7611 European organisations
7616 Extra-European organisations
7621 World organisations
7626 Non-governmental organisations

Se puede acceder a una lista mucho más detallada de los códigos de campo temático en: http://iate.europa.eu/tbx/IATE%20domain%20codes.csv

Cada entrada tiene también una información de fiabilidad (reliabilityCode) que puede tener tres niveles:

1: Fiabilidad no verificada
2: Fiabilidad mínima
3: Fiable
4: Muy fiable

Se puede encontrar una descripción completa de la información sobre los temas de la IATE en: http://iate.europa.eu/tbx/IATE%20Data%20Fields%20Explaind.htm

En fin, todos los traductores estamos de enhorabuena, ya que este es un recurso terminológico de valor incalculable. El fichero que lo contiene es de muy gran tamaño y su uso directo no será fácil. Como que la licencia permite la reutilización y redistribución, pronto apareceran glosarios asociados, de menor tamaño, que contengan algunas de las áreas temáticas y para determinadas lenguas.

Estad atentos a este blog para novedades sobre este tema.

Acerca de las herramientas TAO

Quote

por Marina Mayor

En esta pequeña reseña voy a hablar brevemente y de manera general sobre mi visión acerca de las herramientas de traducción asistida por ordenador (TAO). En primer lugar, he de decir que no me imagino cómo sería la vida de los traductores profesionales si no existieran estas herramientas, creo que desgastaríamos diccionarios a la vez de la luz y pasaríamos largas noches despiertos para llegar a traducir el volumen de palabras que hoy somos capaces de traducir gracias a estas y otras tecnologías. Aquí me gustaría añadir que valoro enormemente la gran labor de los traductores anteriores a la etapa “tecnológica”, en la que se servían únicamente de sus conocimientos y del papel para producir traducciones extraordinarias.

Es cierto que las TAO resultan más eficaces según el tipo de texto que queramos traducir, existen algunos tipos de textos que de ya por sí ofrecen un mayor número de repeticiones, como suelen ser los de carácter técnico (como manuales, guías de usuario, etc.). No obstante, la idea de que las TAO no son útiles para todos los tipos de textos no es del todo cierta. Incluso puede sacarse provecho de estas herramientas en traducción literaria, por supuesto no de igual manera, pero también resultan provechosas para el traductor.

En mi opinión, las TAO ofrecen varias ventajas clave, entre ellas la productividad, que para mí ocupa el número uno. El aprovechamiento de materiales ya traducidos no sería posible si no existieran las TAO y, me atrevo a decir, que jamás alcanzaríamos el mismo índice de productividad si no las utilizáramos (salvo que nuestro cerebro fuera capaz de almacenar una cantidad ingente de segmentos de origen y destino a modo de memoria de traducción, y hasta ahora no he tenido la suerte de conocer a nadie con este “tipo de cerebro”…).

Las repeticiones internas o con respecto a la memoria suelen jugar siempre a nuestro favor. Algunos afirman que las famosas “fuzzies” a veces estorban más que ayudan si el contexto no es el mismo, pero creo que si realizamos un buen uso de las memorias esto no tiene por qué ocurrir. Obviamente no todas las memorias se pueden aprovechar para todos los proyectos, pero sí podemos utilizar los campos para contextualizar las entradas a un mayor nivel y saber en todo momento cuando podemos fiarnos ciegamente de los resultados y cuando no. Una vez que un cliente valida una traducción (estemos de acuerdo o no con sus propuestas) y la pasamos por nuestra memoria, se convierte en un arma de trabajo muy valiosa. La coherencia que podemos alcanzar gracias al uso de la función de búsqueda de concordancia de las memorias es algo que difícilmente habríamos experimentado sin estas tecnologías.

En cuanto a desventajas he de decir que encuentro pocas y que en su mayor parte están relacionadas con el aspecto económico de las mismas. Cuando un traductor decide escoger una herramienta TAO por primera vez, existe tal variedad en el mercado que es difícil poder decantarse por una directamente. En general suele depender de la inversión económica que el traductor quiera o pueda realizar. Creo que existe una idea generalizada de que las herramientas gratuitas son peores que las de pago, pero después de conocer y utilizar nuevas herramientas, afirmo que no es cierto. El problema de la incompatibilidad se resuelve cada día mejor gracias al uso de estándares, por lo que el abanico de posibilidades que tenemos a nuestra disposición es cada vez mayor si sabemos cómo utilizarlos.

Para mí, el perfil ideal del traductor es aquel que es más versátil en cuanto al uso de herramientas, que puede adaptarse rápidamente a las nuevas tecnologías y que dispone tanto de herramientas de pago como gratuitas, por lo que puede enfrentarse a distintos proyectos independientemente de la TAO. Tras conocer y probar distintas herramientas, el traductor sabe qué es lo que resulta más cómodo para trabajar, y enseguida buscará y encontrará similitudes entre unas y otras, por lo que sabrá usarlas a su favor en función de cada circunstancia concreta.

Como en otros ámbitos de la vida, resulta muy cómodo permanecer en la famosa “zona de confort” donde todo es fácil, conocido y no es necesario cambiar nada ni aprender nada bueno “porque estamos bien como estamos y hasta ahora nos va bien así”. Para algunos nos puede resultar molesto aprender a utilizar una herramienta que quizás solo necesitemos para un proyecto específico, e incluso verlo como una pérdida de tiempo.

Pero llega un día en el que un cliente te llama y te pregunta si “ya te has actualizado” o “si podrías trabajar con esta herramienta poco conocida”, y obviamente si la respuesta es no y no estamos dispuestos a cambiar, estaremos dejando pasar oportunidades que puede que no regresen. Por lo que mi conclusión es que en esta profesión, así como en el día de día de la vida cotidiana, es que una mayor apertura de mente y una actitud de valentía suelen ser mucho mejores acompañantes que simplemente confiar en lo conocido.

Creo que los traductores más “intrépidos” pueden llegar muy lejos, al final y al cabo no sabemos que nos depara el futuro ni donde estaremos, pero estar preparado para el cambio es una muy buena manera de recibirlo.

¿CÓMO CONFIGURAR OMEGAT PARA UTILIZAR EL TRADUCTOR AUTOMÁTICO DE MICROSOFT?

Quote

Introducción

OmegaT permite la conexión con diversos sistema de traducción automática. De esta manera el programa recupera de manera automática la traducción ofrecida por el sistema de traducción automática y la muestra al usuario, que si lo desea la puede incorporar en su traducción. En esta entrada, Héctor Sevilla nos explica cómo configurar el traductor automático de Microsoft. Este sistema permite traducir hasta 2.000.000 de caracteres mensuales de manera gratuita.

 

Configuración

Primero debemos dirigirnos al sitio web www.bing.com/translator.

  1. Bajamos a la sección de noticias y clicamos la opción “Microsoft Translator API comercial está disponible vía Windows Azure Marketplace”. Eso nos redirigirá a la siguiente página:

mt1

 

  1. Aquí podemos ver que Microsoft ofrece acceso a su aplicación de traducción automática a distintos precios conforme la cantidad de palabras que en promedio se traducen al mes, pero la primera opción permite usar la aplicación de forma gratuita cuando las traducciones no exceden de dos millones de caracteres por mes. En este caso, elegiremos esa opción.
  2. Luego seremos redirigidos a una página donde registraremos nuestros datos de clientes (es necesario tener una cuenta de Windows Live para continuar).
  3. Se aceptan los términos de uso del servicio y continuamos a una página de resumen de registro dónde deben aceptarse términos de la oferta del servicio y la política de privacidad de Microsoft.
  4. Estos procedimientos terminan en la página “Información sobre la Cuenta”. A la izquierda de esta página hay un menú; su última opción es “Programadores” sobre la que debemos clicar.

mt2

 

  1. Una vez en la página dedicada a “Programadores”, debemos informarle a Microsoft que la aplicación que estaremos usando como “Programadores” es OmegaT. Los códigos de los campos “Id de cliente” y “Secreto de Cliente” que se muestran aquí son lo más importante y debemos copiarlos y pegarlos en un programa como Notepad, ya que los usaremos para editar un archivo *.ini de OmegaT.
  2. El campo “Nombre” debería tener el nombre de OmegaT y en “URI de redireccionamiento” basta con que peguemos la URL de la página de OmegaT. Luego clicamos en guardar y acabamos con el Windows Azure Marketplace.

 

mt3

 

  1. Nos dirigimos a la carpeta en que tenemos instalado el OmegaT en nuestro ordenador; posiblemente se trate de (Program Files (x86)), donde debemos buscar el archivo “OmegaT.l4J.ini”. Es recomendable cortar el archivo y pegarlo en el escritorio para evitar que Windows nos impida modificarlo debido a la configuración de seguridad que tengamos habilitada.
  2. Una vez abierto vemos que se trata de un archivo de configuración del OmegaT, cuyas dos últimas líneas están dedicadas al Microsoft Translate. Debemos notar que el archivo nos dice que para activar estos parámetros debemos remover el símbolo # que llevan adelante:

mt4

mt5

  1. Luego pegamos nuestras claves en el archivo y guardamos el archivo.
  2. Finalmente abrimos OmegaT, desplegamos el menú Opciones, y en Traducciones Automáticas habilitamos Microsoft Translator. Habiendo hecho esto tendremos las traducciones automáticas del Microsoft Translator en el panel de traducciones automáticas.
  3. Estos pasos pueden consultarse también en estos enlaces:
  1. http://wordfast.fi/blog/cat-tools/2013/05/13/machine-translation-in-omegat-for-windows/
  2. http://wiki.memsource.com/wiki/Microsoft_Translator

 

Conversión de memorias de texto tabulado a TMX con TMX Maker de LF Aligner

Quote

Introducció

Continuant amb el tema iniciat en l’entrada anterior, de la conversió de memories de traducció en format text separat per tabuladors, en aquesta entrada explicarem la manera de fer-ho amb l’eina TMX Maker. Aquesta eina es distribueix com a part del LF-Aligner (http://sourceforge.net/projects/aligner/).

Instal·lació del TMX Maker

De fet no cal instal·lar-la. Un cop descarregat i descomprimit l’arxiu zip trobareu el TMX Maker en la carpeta other tools.

Execució del TMX Maker

L’aplicació es pot executar fent-hi doble clic. S’obrirà una pantalla de Símbolo de sistema o Terminal i haurem d’arrossegar allà l’arxiu que volem transformar. MOLT IMPORTANT: l’arxiu de corpus en text tabulat ha d’estar en codificació Unicode UTF-8. Si no ho està, caldrà transformar-lo abans a aquesta codificació.

Un cop arrossegar l’arxiu i fent Enter s’inicia un diàleg que reproduïm aquí i que ens permet seleccionar les opcions de transformació:

OS detected: Windows


Drag and drop the input file (tab delimited txt in UTF-8 encoding, or xls) here
and press enter.
(Vista users: sorry, Microsoft left you out in the cold. See readme; type [scr]/
foldername/filename to run the script on files in the aligner folder.)
D:\esborrar\tabtxt2tmx\corpus-ONU-eng-spa-utf8.txt


-------------------------------------------------

Specify the path and name of the output file, or just press enter to use the sam
e path and name as your input file.
Default: D:\esborrar\tabtxt2tmx/corpus-ONU-eng-spa-utf8.tmx


-------------------------------------------------

Number of languages? This will usually be 2.
(Default: 2)


Type the language code of language 1 as used in TMX files by your CAT tool, (usu
ally EN-GB, EN-US etc.) If in doubt, export a TM into TMX with the CAT tool you
will be using and check the codes it uses. Alternatively, you can take a stab in
 the dark and hope for the best.
(Default: EN-GB) en


Type the language code of language 2.
(Default: HU) es


-------------------------------------------------

Press enter to use the autodetected date and time, or specify your own date and
time to be recorded in the TMX. Use the format yyyymmddThhmmssZ, capital T and Z
 included. See details in readme.
Autodetected default: 20131210T153436Z


-------------------------------------------------

Type the creator name you wish to be recorded in the TMX. Do not use accented le
tters or other special characters.
(Default: LF TMX maker 3.0)


-------------------------------------------------

You can add a note to your TMX. Your options are:

1) Add the contents of the last column of the txt as a note. This is the default
, just press enter to apply. This allows you to use accented characters or assig
n different notes to the various lines/segments in your TM - very useful e.g. if
 the content comes from several different documents.

2) Type the text you wish to add as note. (Accented letters and other special ch
aracters may get corrupted.)

3) Create the TMX without a note. Type "none" to apply.

leave empty/add your text/type "none": none



D:\esborrar\tabtxt2tmx/corpus-ONU-eng-spa-utf8.tmx created


-------------------------------------------------

7129 TUs have been written to the TMX. 7 segments were skipped (7 of them due to
 being half-empty).

Press Enter to quit.

Ahora ya tendremos nuestro corpus en formato TMX.

Conversión de memorias de texto tabulado a TMX con tikal de Okapi

Quote

Introducción

En esta entrada explicaremos cómo transformar una memoria de traducción que esté en formato de texto tabulado a tmx utilizando tikal de Okapi Tools (http://okapi.opentag.com/). Con las herramientas de Okapi se pueden realizar infinidad de tareas relacionadas con la traducción y la localización, entre ellas la tarea que nos ocupa.

Recordemos que una memoria de traducción en formato de texto tabulado tiene el siguiente aspecto:

segmento_lengua_A tabulador segmento_lengua_B.

Si la lengua A es inglés y la lengua B es español este mismo segmento en TMX tendría el siguiente aspecto:

tmx

Esta transformación nos permitirá utilizar las memorias de traducción en herramientas de traducción asisitida.

Transformación con Tikal

Si ejecutamos tikal sin ningún parámetro adicioal nos muestra todas sus instrucciones:

tikal1

Si nos fijamos bien (haciendo clic sobre la imagen se ampliará) existe una opción -2tmx que nos servirá para realizar la conversión a este formato. Si miramos bien los parámetros que nos pedirá veremos lo siguiente:

tikal2

Además de indicar la lengua de partida (-sl) y la de llegada (-tl) será muy importante dar el valor adecuado al parámetro -fc que es el parámetro que controla el formato del ficher de entrada. Tenemos que darle un valor de entre la lista dfe valores posibles. Esta lista la podemos obtener escribiendo:

tikal -listconf

Que nos devolverá la lista de configuraciones:

D:\okapi>tikal -listconf
-------------------------------------------------------------------------------
Okapi Tikal - Localization Toolset
Version: 2.0.23
-------------------------------------------------------------------------------
List of all filter configurations available:
 - okf_txml = Wordfast Pro TXML documents
 - okf_txml-fillEmptyTargets = Wordfast Pro TXML documents with empty targets fi
lled on output.
 - okf_itshtml5 = Configuration for standard HTML5 documents.
 - okf_doxygen = Doxygen-commented Text Documents
 - okf_wiki = Text with wiki-style markup
 - okf_mosestext = Default Moses Text configuration.
 - okf_tradosrtf = Configuration for Trados-tagged RTF files - READING ONLY.
 - okf_rainbowkit = Configuration for Rainbow translation kit.
 - okf_rainbowkit-package = Configuration for Rainbow translation kit package.
 - okf_rainbowkit-noprompt = Configuration for Rainbow translation kit (without
prompt).
 - okf_mif = Adobe FrameMaker MIF documents
 - okf_archive = Configuration for archive files
 - okf_transifex = Transifex project with prompt when starting
 - okf_transifex-noPrompt = Transifex project without prompt when starting
 - okf_xini = Configuration for XINI documents from ONTRAM
 - okf_xini-noOutputSegmentation = Configuration for XINI documents from ONTRAM
(fields in the output are not segmented)
 - okf_xliff = Configuration for XML Localisation Interchange File Format (XLIFF
) documents.
 - okf_openxml = Microsoft Office documents (DOCX, XLSX, PPTX).
 - okf_openoffice = OpenOffice.org ODT, ODS, ODP, ODG, OTT, OTS, OTP, OTG docume
nts
 - okf_simplification = Configuration for extracting resources from an XML file.
 Resources and then codes are simplified.
 - okf_simplification-xmlResources = Configuration for extracting resources from
 an XML file. Resources are simplified.
 - okf_simplification-xmlCodes = Configuration for extracting resources from an
XML file. Codes are simplified.
 - okf_properties = Java properties files (Output used \uHHHH escapes)
 - okf_properties-outputNotEscaped = Java properties files (Characters in the ou
tput encoding are not escaped)
 - okf_properties-skypeLang = Skype language properties files (including support
 for HTML codes)
 - okf_properties-html-subfilter = Java Property content processed by an HTML su
bfilter
 - okf_dtd = Configuration for XML DTD documents (entities content)
 - okf_html = HTML or XHTML documents
 - okf_html-wellFormed = XHTML and well-formed HTML documents
 - okf_po = Standard bilingual PO files
 - okf_po-monolingual = Monolingual PO files (msgid is a real ID, not the source
 text).
 - okf_regex = Default Regex configuration.
 - okf_regex-srt = Configuration for SRT (Sub-Rip Text) sub-titles files.
 - okf_regex-textLine = Configuration for text files where each line is a text u
nit
 - okf_regex-textBlock = Configuration for text files where text units are separ
ated by 2 or more line-breaks.
 - okf_regex-macStrings = Configuration for Macintosh .strings files.
 - okf_ts = Configuration for Qt TS files.
 - okf_tmx = Configuration for Translation Memory eXchange (TMX) documents.
 - okf_xml = Configuration for generic XML documents (default ITS rules).
 - okf_xml-resx = Configuration for Microsoft RESX documents (without binary dat
a).
 - okf_xml-MozillaRDF = Configuration for Mozilla RDF documents.
 - okf_xml-JavaProperties = Configuration for Java Properties files in XML.
 - okf_xml-AndroidStrings = Configuration for Android Strings XML documents.
 - okf_xml-WixLocalization = Configuration for WiX (Windows Installer XML) Local
ization files.
 - okf_idml = Adobe InDesign IDML documents
 - okf_json = Configuration for JSON files
 - okf_phpcontent = Default PHP Content configuration.
 - okf_ttx = Configuration for Trados TTX documents.
 - okf_pensieve = Configuration for Pensieve translation memories.
 - okf_vignette = Default Vignette Export/Import Content configuration.
 - okf_vignette-nocdata = Vignette files without CDATA sections.
 - okf_railsyaml = Ruby on Rails YAML files
 - okf_xmlstream = Large XML Documents
 - okf_xmlstream-dita = DITA XML
 - okf_xmlstream-JavaPropertiesHTML = Java Properties XML with Embedded HTML
 - okf_versifiedtxt = Versified Text Documents
 - okf_table = Table-like files such as tab-delimited, CSV, fixed-width columns,
 etc.
 - okf_table_csv = Comma-separated values, optional header with field names.
 - okf_table_catkeys = Haiku CatKeys resource files
 - okf_table_src-tab-trg = 2-column (source + target), tab separated files.
 - okf_table_fwc = Fixed-width columns table padded with white-spaces.
 - okf_table_tsv = Columns, separated by one or more tabs.
 - okf_plaintext = Plain text files.
 - okf_plaintext_trim_trail = Text files; trailing spaces and tabs removed from
extracted lines.
 - okf_plaintext_trim_all = Text files; leading and trailing spaces and tabs rem
oved from extracted lines.
 - okf_plaintext_paragraphs = Text files extracted by paragraphs (separated by 1
 or more empty lines).
 - okf_plaintext_spliced_backslash = Spliced lines filter with the backslash cha
racter (\) used as the splicer.
 - okf_plaintext_spliced_underscore = Spliced lines filter with the underscore c
haracter (_) used as the splicer.
 - okf_plaintext_spliced_custom = Spliced lines filter with a user-defined splic
er.
 - okf_plaintext_regex_lines = Plain Text Filter using regex-based linebreak sea
rch. Extracts by lines.
 - okf_plaintext_regex_paragraphs = Plain Text Filter using regex-based linebrea
k search. Extracts by paragraphs.
 - okf_odf = XML OpenDocument files (e.g. use inside OpenOffice.org documents).

La que nos interesa es:

- okf_table_csv = Comma-separated values, optional header with field names.

Así pues, para realizar la conversión tenemos que escribir (si el fichero a transformar se llama corpus-ONU-eng-spa.txt):

tikal -2tmx corpus-ONU-eng-spa.txt -sl en -tl es -fc okf_table_src-tab-trg

Y el sistema realizará el proceso de conversió y escribirá:

-------------------------------------------------------------------------------
Okapi Tikal - Localization Toolset
Version: 2.0.23
-------------------------------------------------------------------------------
Conversion to TMX
Source language: en
Target language: es
Default input encoding: windows-1252
Filter configuration: okf_table_src-tab-trg
Output: corpus-ONU-eng-spa.txt.tmx
Input: /D:/okapi/corpus-ONU-eng-spa.txt
Done in 3.568s

El fichero transformado se llama corpus-ONU-eng-spa.txt.tmx

Primer contacto con Linux (V): Máquina virtual

Quote

En esta entrada vamos a explicar cómo instalar Linux en una máquina virtual. Vamos a explicarlo para una distribución Xubuntu 12.10, pero la misma explicación es válida para cualquier otra distribución.

Esta opción es buena para la siguiente situación.

Dispongo de un ordenador con cualquier sistema operativo y quiero trabajar eventualmente con Linux manteniendo inalterado el sistema operativo habitual

Suponemos que hemos descargado una imagen de la distribución que queremos instalar y que hemos creado el disco de arranque (si no es así, consultad la siguiente entrada).

Continue reading

Primer contacto con Linux (IV): Instalador de Ubuntu para Windows

Quote

En esta nueva entrada vamos a explicar una opción muy adecuada para aquellas personas que se encuentre en la siguiente situación:

Dispongo de un ordenador con Windows y dispongo de suficiente espacio en disco. Quiero probar Linux más a fondo, pero no quiero realizar una instalación completa con particiones

 

NOTA: no utilices esta opción si tienes Windows 8.

Ubuntu dispone de un instalador para Windows que lo que hace es instalar Ubuntu en el sistema de archivos de Windows. Una vez instalado, si reiniciamos el equipo nos aparecerá una opción para escoger si queremos iniciar el ordenador en Linux o en Windows. Ubuntu se instala en el sistema de archivos de Windows, como cualquier otra aplicación, y no requiere realizar ningún tipo de partición en nuestro disco duro.

Podemos obtener el instalador (denominado Wubi) del siguiente enlace http://www.ubuntu.com/download/desktop/windows-installer.

Continue reading

Primer contacto con Linux (III): Arranque por USB

Quote

En la pasada entrada sobre el primer contacto con Linux aprendimos a crear un DVD de arranque. Con este DVD podemos arrancar el sistema y probar Linux y también podemos realizar la instalación (que explicaremos en una próxima entrada). En la presente entrada explicaremos la solución para probar Linux o instalarlo en aquellos casos que nuestro ordenador no disponga de unidad de DVD (la situación es típica cuando queremos instalar Linux en un NetBook, por ejemplo).

En este caso tenemos que descargar la imagen de Ubuntu/Xubuntu o Linux Mint como se explicó en una entrada anterior.

[lo que explico a continuación es un resumen/traducción de la información que aparece en el siguiente enlace: http://www.ubuntu.com/download/help/create-a-usb-stick-on-windows]

Continue reading

Primer contacto con Linux (II): Creación del DVD de arranque e instalación

Quote

En esta segunda parte de nuestro primer contacto con Linux vamos a aprender a descargar (seguramente ya lo habréis hecho) la imagen del DVD, crear el DVD de arranque e instalación y hacer una primera prueba de Linux sin instalar nada en nuestro sistema.

Lo que expliquemos hoy será útil para el primer caso de los comentados en la primera parte: es decir, dispongo de un ordenador con Windows y quiero probar Linux de manera rápida, sólo para tener una idea de cómo es.

Continue reading

Primer contacto con el sistema operativo Linux

Quote

Durante los próximos días voy a publicar una serie de entradas dedicadas a dar los primeros pasos en la utilización del sistema operativo Linux. Este es un sistema operativo libre que está consiguiendo unos niveles de fiabilidad, seguridad y facilidad de uso excepcionales. Esto unido a que se puede obtener de forma gratuita, hace que sea una opción a tener muy en cuenta como sistema operativo de uso habitual. Atrás quedan los días en que Linux quedaba relegado a gurús de la informática por su dificultad de instalación y uso. Ahora instalar Linux es muy sencillo y su uso es fácil e intuitivo.

Para obtener de manera rápida los conceptos más interesantes sobre Linux y el software libre es muy recomendable la lectura del primer apartado (Presentación) del primer módulo de la asignatura Sistema Operativo GNU/Linux básico de la UOC libre que se puede obtener de aquí en castellano y de aquí en catalán.

Continue reading