Friday 18 May 2012

LF Aligner: el alineador automático de código abierto


Hace ya un tiempo que descubrí en un foro este maravilloso programa que sirve para alinear automáticamente textos traducidos con sus respectivos originales y crear una memoria de traducción en el estándar TMX con los resultados obtenidos. Para los que no sepan en qué contextos les puede venir bien los alineamientos de documentos ya traducidos, os pongo tres ejemplos:

  • Si te acabas de montar en el tren de las memorias de traducción y anteriormente tradujiste documentos a pelo desde Word o similar, alinear tu trabajo te servirá para que esas traducciones se conviertan en referencia dentro de una TM que podrás utilizar con la herramienta de traducción asistida de tu elección.
  • El cliente te acaba de mandar un proyecto con referencia consistente en documentos originales y su traducción.
  • Has conseguido encontrar por Internet un pdf traducido y su respectivo original, los cuales te vienen genial como referencia de la traducción con tanta terminología que tienes entre manos.

Si nos dedicamos a buscar cada término que queremos consultar en el original y, a posteriori, tenemos que localizar la zona del documento traducido en el que aparece su equivalente, ya podemos ir solicitando extensiones en la fecha de entrega porque malgastaríamos un tiempo muy valioso. No obstante, si logramos alinear correctamente esos documentos, se puede crear una memoria bilingüe que importaremos en nuestra CAT favorita (o en el extraordinario ApSIC Xbench) para poder realizar esas búsquedas rápidamente.

No sé si alguna vez habéis utilizado los programas de alineación que vienen incluidos en la mayoría de los programas de traducción asistida del mercado como WinAlign de Trados, Wordfast Aligner, Align en SDLX o MemoQ Aligner: para verificar los datos alineados y lograr unos resultados de calidad razonables, realmente hay que poner mucha concentración y tiempo de tu parte. Cuando trabajaba como traductor en plantilla, a veces tenía que alinear traducciones de este modo y, pasadas varias horas o incluso días, el trabajo se convertía en un suplicio que me hacía reflexionar sobre el valor real de mi trabajo; es decir, me daba la impresión de que no merecía la pena invertir tanto tiempo y energía en una tarea tan tediosa. Pero, gracias a LF Aligner y al algoritmo en el que se basa, todo este tiempo puede verse reducido en gran medida, debido a que automatiza los procesos necesarios consiguiendo prácticamente los mismos resultados.

Antes de adentrarnos en el programa, os voy a contar cómo di con él y así entenderéis mejor lo que os puede ofrecer. Gracias a sitios web como Linguee, que se dedican a buscar la traducción de términos comparando textos online traducidos con los originales de una manera bastante automática, me dio por investigar si ya habría alguna herramienta que permitiera esto mismo con tus propios textos o con la referencia de un proyecto. Al poco tiempo, encontré uno que justamente lo logra con unos resultados francamente buenos: Alignfactory. Lo único es que sus precios no están pensados precisamente para trabajadores independientes (como podéis en el enlace anterior) y solo he podido corroborar sus fantásticas funciones mediante YouAlign, una web desde la que se puede utilizar el potente motor de la herramienta a modo de prueba en un máximo de 100 segmentos.

De ahí, di a parar en el foro que os comentaba, en donde encontré justo lo que buscaba: LF Aligner, la alternativa perfecta de código abierto que consigue alinear documentos de una manera parecida a Alignfactory y que no se basa únicamente en los parámetros y segmentación de los alineadores tradicionales, sino en un maravilloso algoritmo –igualmente de código abierto–, llamado Hunalign, el cual alinea las fuentes de datos multilingües de manera automática. Este algoritmo obtiene tan buenos resultados porque, aparte de la segmentación habitual, también tiene en cuenta la longitud de las frases, un diccionario interno y “magia negra”, en palabras del creador de LF Aligner, un traductor húngaro con notables inquietudes por la programación.

Aunque su interfaz en estos momentos no sea muy user-friendly que digamos (aunque, como me ha comentado su creador, muy pronto va a publicar la primera gran actualización que va a dotar al programa de una interfaz de estilo GUI), su uso es sumamente sencillo: primero, tenemos que situar los dos documentos a alinear en una misma carpeta; abrimos el ejecutable y, tras elegir el formato de los archivos que queremos alinear y seleccionarlos (si se produce algún error, aseguraos de que no haya acentos u otros caracteres especiales en la ruta ni en el nombre del archivo), vamos respondiendo a las preguntas que nos hace el programa. En uno de los pasos, podemos abrir un archivo Excel para revisar los alineamientos antes de crear la memoria en TMX. Este es el único paso en el que vamos a tener que poner algo de nuestra parte y si no necesitamos que esté todo perfecto, podemos ignorarlo.

Además de ser compatible con numerosos formatos, incluso .docx o .pdf (este último es recomendable exportarlo en txt UTF-8 con un programa de edición de pdf como Adobe Acrobat Pro antes de ser procesado por el programa), LF-Aligner cuenta con la posibilidad de descargar automáticamente documentos traducidos de la Comisión Europea, el Parlamento Europeo y la legislación de la Unión Europea. Os recomiendo que os leáis el documento Readme, que viene incluido en la carpeta de instalación, para obtener información más detallada de lo que os puede ofrecer esta herramienta única, así como consejos de uso y soluciones a los errores más habituales que pueden producirse al alinear documentos.

Como comentaba antes, ya os mantendremos informados desde el Calco sobre todas las novedades de la versión que está a punto de publicarse y que supondrá una mayor accesibilidad para esos usuarios que de primeras desconfíen de la interfaz MS-DOS de la vieja escuela con la que en estos momentos cuenta la herramienta.  


7 comments:

Unknown said...

Tremendo hallazgo. Lo voy a probar este mismo fin de semana. Estoy un poquillo cansado del de DVX.

José Carlos Gil said...

La verdad que desde que empecé en el Calco tenía pensado hablar de AF Aligner; pero mejor haber esperado porque desde entonces ha afinándose por medio de nuevas versiones y ahora mismo está ya muy completito.

María Ferreiro said...

Hola, José Carlos:
Me alegro mucho de que te hayas decidido a hacer una entrada sobre LF Aligner. Yo lo descubrí en octubre y lo he utilizado infinidad de veces. Eso sí, no he conseguido alinear documentos en Word por alguna razón que todavía no he descubierto. Estoy de acuerdo contigo en que quizás sería más fácil difundir su uso si en lugar utilizar la ventana de comandos, el programa contara con una interfaz gráfica propia. Salvo ese detalle, a mí me parece una herramienta estupenda.

Martín Márquez said...

Muchísimas gracias. Funciona de maravilla!

José Carlos Gil said...

@ María: yo sí que he logrado alinear documentos Word, por lo que algo te estarás dejando por el camino. Léete el Readme, que en realidad es un manual bastante completo de la aplicación.
@ Martín: ¡me alegro! :)

Jordi Balcells said...

Gracias por descubrirme este pequeño gran programa. Nos abre grandes posibilidades a los que no disfrutamos de MemoQ y su LiveDocs.

José Carlos Gil said...

Hola Jordi. No he probado nunca LiveDocs pero creo que el binomio LF-Aligner + Xbench es difícil de batir :)