Matrícula oberta!

Quote

Us informem que s’ha obert ja la matrícula dels cursos d’especialització sobre traducció que comencen el març de 2014:

Aquest any, la UOC ofereix un descompte del 10% sobre totes les matrícules que es formalitzin abans del 17 de gener. Aquest descompte serà addicional a altres descomptes (titulats i membres de la comunitat UOC i carnet jove), fins arribar com a màxim fins al 20%. A més, cal tenir en compte que la matrícula no es cobrarà fins al mes de març.

També us podeu matricular lliurement d’assignatures soltes, via Ateneu.

¿CÓMO CONFIGURAR OMEGAT PARA UTILIZAR EL TRADUCTOR AUTOMÁTICO DE MICROSOFT?

Quote

Introducción

OmegaT permite la conexión con diversos sistema de traducción automática. De esta manera el programa recupera de manera automática la traducción ofrecida por el sistema de traducción automática y la muestra al usuario, que si lo desea la puede incorporar en su traducción. En esta entrada, Héctor Sevilla nos explica cómo configurar el traductor automático de Microsoft. Este sistema permite traducir hasta 2.000.000 de caracteres mensuales de manera gratuita.

 

Configuración

Primero debemos dirigirnos al sitio web www.bing.com/translator.

  1. Bajamos a la sección de noticias y clicamos la opción “Microsoft Translator API comercial está disponible vía Windows Azure Marketplace”. Eso nos redirigirá a la siguiente página:

mt1

 

  1. Aquí podemos ver que Microsoft ofrece acceso a su aplicación de traducción automática a distintos precios conforme la cantidad de palabras que en promedio se traducen al mes, pero la primera opción permite usar la aplicación de forma gratuita cuando las traducciones no exceden de dos millones de caracteres por mes. En este caso, elegiremos esa opción.
  2. Luego seremos redirigidos a una página donde registraremos nuestros datos de clientes (es necesario tener una cuenta de Windows Live para continuar).
  3. Se aceptan los términos de uso del servicio y continuamos a una página de resumen de registro dónde deben aceptarse términos de la oferta del servicio y la política de privacidad de Microsoft.
  4. Estos procedimientos terminan en la página “Información sobre la Cuenta”. A la izquierda de esta página hay un menú; su última opción es “Programadores” sobre la que debemos clicar.

mt2

 

  1. Una vez en la página dedicada a “Programadores”, debemos informarle a Microsoft que la aplicación que estaremos usando como “Programadores” es OmegaT. Los códigos de los campos “Id de cliente” y “Secreto de Cliente” que se muestran aquí son lo más importante y debemos copiarlos y pegarlos en un programa como Notepad, ya que los usaremos para editar un archivo *.ini de OmegaT.
  2. El campo “Nombre” debería tener el nombre de OmegaT y en “URI de redireccionamiento” basta con que peguemos la URL de la página de OmegaT. Luego clicamos en guardar y acabamos con el Windows Azure Marketplace.

 

mt3

 

  1. Nos dirigimos a la carpeta en que tenemos instalado el OmegaT en nuestro ordenador; posiblemente se trate de (Program Files (x86)), donde debemos buscar el archivo “OmegaT.l4J.ini”. Es recomendable cortar el archivo y pegarlo en el escritorio para evitar que Windows nos impida modificarlo debido a la configuración de seguridad que tengamos habilitada.
  2. Una vez abierto vemos que se trata de un archivo de configuración del OmegaT, cuyas dos últimas líneas están dedicadas al Microsoft Translate. Debemos notar que el archivo nos dice que para activar estos parámetros debemos remover el símbolo # que llevan adelante:

mt4

mt5

  1. Luego pegamos nuestras claves en el archivo y guardamos el archivo.
  2. Finalmente abrimos OmegaT, desplegamos el menú Opciones, y en Traducciones Automáticas habilitamos Microsoft Translator. Habiendo hecho esto tendremos las traducciones automáticas del Microsoft Translator en el panel de traducciones automáticas.
  3. Estos pasos pueden consultarse también en estos enlaces:
  1. http://wordfast.fi/blog/cat-tools/2013/05/13/machine-translation-in-omegat-for-windows/
  2. http://wiki.memsource.com/wiki/Microsoft_Translator

 

Conversión de memorias de texto tabulado a TMX con TMX Maker de LF Aligner

Quote

Introducció

Continuant amb el tema iniciat en l’entrada anterior, de la conversió de memories de traducció en format text separat per tabuladors, en aquesta entrada explicarem la manera de fer-ho amb l’eina TMX Maker. Aquesta eina es distribueix com a part del LF-Aligner (http://sourceforge.net/projects/aligner/).

Instal·lació del TMX Maker

De fet no cal instal·lar-la. Un cop descarregat i descomprimit l’arxiu zip trobareu el TMX Maker en la carpeta other tools.

Execució del TMX Maker

L’aplicació es pot executar fent-hi doble clic. S’obrirà una pantalla de Símbolo de sistema o Terminal i haurem d’arrossegar allà l’arxiu que volem transformar. MOLT IMPORTANT: l’arxiu de corpus en text tabulat ha d’estar en codificació Unicode UTF-8. Si no ho està, caldrà transformar-lo abans a aquesta codificació.

Un cop arrossegar l’arxiu i fent Enter s’inicia un diàleg que reproduïm aquí i que ens permet seleccionar les opcions de transformació:

OS detected: Windows


Drag and drop the input file (tab delimited txt in UTF-8 encoding, or xls) here
and press enter.
(Vista users: sorry, Microsoft left you out in the cold. See readme; type [scr]/
foldername/filename to run the script on files in the aligner folder.)
D:\esborrar\tabtxt2tmx\corpus-ONU-eng-spa-utf8.txt


-------------------------------------------------

Specify the path and name of the output file, or just press enter to use the sam
e path and name as your input file.
Default: D:\esborrar\tabtxt2tmx/corpus-ONU-eng-spa-utf8.tmx


-------------------------------------------------

Number of languages? This will usually be 2.
(Default: 2)


Type the language code of language 1 as used in TMX files by your CAT tool, (usu
ally EN-GB, EN-US etc.) If in doubt, export a TM into TMX with the CAT tool you
will be using and check the codes it uses. Alternatively, you can take a stab in
 the dark and hope for the best.
(Default: EN-GB) en


Type the language code of language 2.
(Default: HU) es


-------------------------------------------------

Press enter to use the autodetected date and time, or specify your own date and
time to be recorded in the TMX. Use the format yyyymmddThhmmssZ, capital T and Z
 included. See details in readme.
Autodetected default: 20131210T153436Z


-------------------------------------------------

Type the creator name you wish to be recorded in the TMX. Do not use accented le
tters or other special characters.
(Default: LF TMX maker 3.0)


-------------------------------------------------

You can add a note to your TMX. Your options are:

1) Add the contents of the last column of the txt as a note. This is the default
, just press enter to apply. This allows you to use accented characters or assig
n different notes to the various lines/segments in your TM - very useful e.g. if
 the content comes from several different documents.

2) Type the text you wish to add as note. (Accented letters and other special ch
aracters may get corrupted.)

3) Create the TMX without a note. Type "none" to apply.

leave empty/add your text/type "none": none



D:\esborrar\tabtxt2tmx/corpus-ONU-eng-spa-utf8.tmx created


-------------------------------------------------

7129 TUs have been written to the TMX. 7 segments were skipped (7 of them due to
 being half-empty).

Press Enter to quit.

Ahora ya tendremos nuestro corpus en formato TMX.

Conversión de memorias de texto tabulado a TMX con tikal de Okapi

Quote

Introducción

En esta entrada explicaremos cómo transformar una memoria de traducción que esté en formato de texto tabulado a tmx utilizando tikal de Okapi Tools (http://okapi.opentag.com/). Con las herramientas de Okapi se pueden realizar infinidad de tareas relacionadas con la traducción y la localización, entre ellas la tarea que nos ocupa.

Recordemos que una memoria de traducción en formato de texto tabulado tiene el siguiente aspecto:

segmento_lengua_A tabulador segmento_lengua_B.

Si la lengua A es inglés y la lengua B es español este mismo segmento en TMX tendría el siguiente aspecto:

tmx

Esta transformación nos permitirá utilizar las memorias de traducción en herramientas de traducción asisitida.

Transformación con Tikal

Si ejecutamos tikal sin ningún parámetro adicioal nos muestra todas sus instrucciones:

tikal1

Si nos fijamos bien (haciendo clic sobre la imagen se ampliará) existe una opción -2tmx que nos servirá para realizar la conversión a este formato. Si miramos bien los parámetros que nos pedirá veremos lo siguiente:

tikal2

Además de indicar la lengua de partida (-sl) y la de llegada (-tl) será muy importante dar el valor adecuado al parámetro -fc que es el parámetro que controla el formato del ficher de entrada. Tenemos que darle un valor de entre la lista dfe valores posibles. Esta lista la podemos obtener escribiendo:

tikal -listconf

Que nos devolverá la lista de configuraciones:

D:\okapi>tikal -listconf
-------------------------------------------------------------------------------
Okapi Tikal - Localization Toolset
Version: 2.0.23
-------------------------------------------------------------------------------
List of all filter configurations available:
 - okf_txml = Wordfast Pro TXML documents
 - okf_txml-fillEmptyTargets = Wordfast Pro TXML documents with empty targets fi
lled on output.
 - okf_itshtml5 = Configuration for standard HTML5 documents.
 - okf_doxygen = Doxygen-commented Text Documents
 - okf_wiki = Text with wiki-style markup
 - okf_mosestext = Default Moses Text configuration.
 - okf_tradosrtf = Configuration for Trados-tagged RTF files - READING ONLY.
 - okf_rainbowkit = Configuration for Rainbow translation kit.
 - okf_rainbowkit-package = Configuration for Rainbow translation kit package.
 - okf_rainbowkit-noprompt = Configuration for Rainbow translation kit (without
prompt).
 - okf_mif = Adobe FrameMaker MIF documents
 - okf_archive = Configuration for archive files
 - okf_transifex = Transifex project with prompt when starting
 - okf_transifex-noPrompt = Transifex project without prompt when starting
 - okf_xini = Configuration for XINI documents from ONTRAM
 - okf_xini-noOutputSegmentation = Configuration for XINI documents from ONTRAM
(fields in the output are not segmented)
 - okf_xliff = Configuration for XML Localisation Interchange File Format (XLIFF
) documents.
 - okf_openxml = Microsoft Office documents (DOCX, XLSX, PPTX).
 - okf_openoffice = OpenOffice.org ODT, ODS, ODP, ODG, OTT, OTS, OTP, OTG docume
nts
 - okf_simplification = Configuration for extracting resources from an XML file.
 Resources and then codes are simplified.
 - okf_simplification-xmlResources = Configuration for extracting resources from
 an XML file. Resources are simplified.
 - okf_simplification-xmlCodes = Configuration for extracting resources from an
XML file. Codes are simplified.
 - okf_properties = Java properties files (Output used \uHHHH escapes)
 - okf_properties-outputNotEscaped = Java properties files (Characters in the ou
tput encoding are not escaped)
 - okf_properties-skypeLang = Skype language properties files (including support
 for HTML codes)
 - okf_properties-html-subfilter = Java Property content processed by an HTML su
bfilter
 - okf_dtd = Configuration for XML DTD documents (entities content)
 - okf_html = HTML or XHTML documents
 - okf_html-wellFormed = XHTML and well-formed HTML documents
 - okf_po = Standard bilingual PO files
 - okf_po-monolingual = Monolingual PO files (msgid is a real ID, not the source
 text).
 - okf_regex = Default Regex configuration.
 - okf_regex-srt = Configuration for SRT (Sub-Rip Text) sub-titles files.
 - okf_regex-textLine = Configuration for text files where each line is a text u
nit
 - okf_regex-textBlock = Configuration for text files where text units are separ
ated by 2 or more line-breaks.
 - okf_regex-macStrings = Configuration for Macintosh .strings files.
 - okf_ts = Configuration for Qt TS files.
 - okf_tmx = Configuration for Translation Memory eXchange (TMX) documents.
 - okf_xml = Configuration for generic XML documents (default ITS rules).
 - okf_xml-resx = Configuration for Microsoft RESX documents (without binary dat
a).
 - okf_xml-MozillaRDF = Configuration for Mozilla RDF documents.
 - okf_xml-JavaProperties = Configuration for Java Properties files in XML.
 - okf_xml-AndroidStrings = Configuration for Android Strings XML documents.
 - okf_xml-WixLocalization = Configuration for WiX (Windows Installer XML) Local
ization files.
 - okf_idml = Adobe InDesign IDML documents
 - okf_json = Configuration for JSON files
 - okf_phpcontent = Default PHP Content configuration.
 - okf_ttx = Configuration for Trados TTX documents.
 - okf_pensieve = Configuration for Pensieve translation memories.
 - okf_vignette = Default Vignette Export/Import Content configuration.
 - okf_vignette-nocdata = Vignette files without CDATA sections.
 - okf_railsyaml = Ruby on Rails YAML files
 - okf_xmlstream = Large XML Documents
 - okf_xmlstream-dita = DITA XML
 - okf_xmlstream-JavaPropertiesHTML = Java Properties XML with Embedded HTML
 - okf_versifiedtxt = Versified Text Documents
 - okf_table = Table-like files such as tab-delimited, CSV, fixed-width columns,
 etc.
 - okf_table_csv = Comma-separated values, optional header with field names.
 - okf_table_catkeys = Haiku CatKeys resource files
 - okf_table_src-tab-trg = 2-column (source + target), tab separated files.
 - okf_table_fwc = Fixed-width columns table padded with white-spaces.
 - okf_table_tsv = Columns, separated by one or more tabs.
 - okf_plaintext = Plain text files.
 - okf_plaintext_trim_trail = Text files; trailing spaces and tabs removed from
extracted lines.
 - okf_plaintext_trim_all = Text files; leading and trailing spaces and tabs rem
oved from extracted lines.
 - okf_plaintext_paragraphs = Text files extracted by paragraphs (separated by 1
 or more empty lines).
 - okf_plaintext_spliced_backslash = Spliced lines filter with the backslash cha
racter (\) used as the splicer.
 - okf_plaintext_spliced_underscore = Spliced lines filter with the underscore c
haracter (_) used as the splicer.
 - okf_plaintext_spliced_custom = Spliced lines filter with a user-defined splic
er.
 - okf_plaintext_regex_lines = Plain Text Filter using regex-based linebreak sea
rch. Extracts by lines.
 - okf_plaintext_regex_paragraphs = Plain Text Filter using regex-based linebrea
k search. Extracts by paragraphs.
 - okf_odf = XML OpenDocument files (e.g. use inside OpenOffice.org documents).

La que nos interesa es:

- okf_table_csv = Comma-separated values, optional header with field names.

Así pues, para realizar la conversión tenemos que escribir (si el fichero a transformar se llama corpus-ONU-eng-spa.txt):

tikal -2tmx corpus-ONU-eng-spa.txt -sl en -tl es -fc okf_table_src-tab-trg

Y el sistema realizará el proceso de conversió y escribirá:

-------------------------------------------------------------------------------
Okapi Tikal - Localization Toolset
Version: 2.0.23
-------------------------------------------------------------------------------
Conversion to TMX
Source language: en
Target language: es
Default input encoding: windows-1252
Filter configuration: okf_table_src-tab-trg
Output: corpus-ONU-eng-spa.txt.tmx
Input: /D:/okapi/corpus-ONU-eng-spa.txt
Done in 3.568s

El fichero transformado se llama corpus-ONU-eng-spa.txt.tmx