El décimo arte: abril 2012

En clase seguimos con cosas del Déjà Vu, lo último que hemos hecho es un proyecto de traducción sirviéndonos de una memoria de traducción, hecha a partir de un .tmx dado, a la que le hemos incorporado un lexicon construido en ese mismo momento.

No quiero entrar en gran detalle porque cada programa es un mundo, pero básicamente hemos creado un proyecto consistente en traducir el manual de un iPhone (texto original dado en docx), y para ello nos hemos servido del texto en inglés y español del manual del iPad (tmx, que combina dos txts), de esa forma cosas como "User's Guide", "Chapter" o "How to install the device" nos vendrán pretraducidas como sugerencia, a solo un click de poder incorporarse en nuestro texto meta. Es importante señalar que el programa tiene sus límites, a veces hay cosas que podrían automatizarse más, como los códigos, que a veces los da mal ordenados, otras veces da sugerencias evidentemente malas, etc. Esto es porque básicamente NO es un traductor automático, la idea es que el esfuerzo se reduzca, pero las equivalencias exactas son escasas y por tanto el trabajo nunca se hace solo. Igual de obvio es decir que una memoria excelente dará una asistencia excelente, and so on.

El lexicon, es otro elemento complementario al proyecto como lo son las memorias, y son una especie de minibase terminológica improvisada a partir del texto original, si lo construyes con el programa, o bien puede ser un elemento que le den a uno para facilitarle la tarea. En el primer caso al construir el lexicon, nos extrae palabras que se repiten (podemos limitar la cantidad de palabras que construyen el término y después nos muestra cuánto se repiten) en el texto original. Lo que hace le programa exactamente es extraer los términos (como LexTerm); borrando unas entradas o traduciendo las otras (en la columna vacía destinada a los términos en lengua meta), acabaremos con un lexicon filtrado con terminología específica para el documento origen, que nos dará un servicio parecido al de la memoria, más centrado en el término especializado que en segmentos equivalentes y mucho más orientado a traducir ese texto en particular (las memorias son más amplias). Filtrar los términos que merecen la pena y traducirlos es un trabajo considerable, y teniendo una buena memoria es probable que uno se cuestione si le interesa o no hacerlo. La otra posibilidad es que un cliente, o un compañero de trabajo o quien sea, nos facilite un lexicon trabajado de ese texto original del que servirnos. El lexicon, normalmente en txt, también propone sugerencias como la memoria. Es importante también saber que texto meta, original, memoria, lexicon y otros elementos se suelen poder importar a todo tipo de formatos.

Hasta Semana Santa hemos estado tratando la traducción automática y la asistida, y las memorias de traducción.

La traducción automática consiste en dar un texto a un programa y que él lo traduzca. Hay dos formas en las que el humano puede intervenir. La primera es enmendar el texto final, que tendrá errores de distintos tipos según la tipología textual. La segunda es enmendar el texto origen para que el programa dé mejores resultados (cosa que hay que hacer con mucho tino y práctica si no se quiere empeorar el resultado). En el primer caso la informática asiste al humano, en el segundo el humano asiste al software.

Acerca de esta cuestión hicimos dos prácticas, una era probar el traductor de google sin más y luego corregir un poco el texto de llegada catalogando los errores. La conclusión es que si el texto es especializado, al ser un lenguaje unívoco, simple y directo, el software funciona relativamente bien tras una pertinente revisión humana. La segunda prueba consistió en probar a cambiar cosas de un texto origen para ver si con eso mejorábamos el texto de llegada. Depende mucho de los cambios que se hagan, se pierde o se gana, pero es importante tener en cuenta este mecanismo porque si uno da con una serie de retoques que facilitan luego la producción del texto de llegada los puede ir introduciendo en sus textos de origen para allanar el camino. Es mucho más humano hacer lo primero, enmendar el texto de llegada, pero asusta bastante saber que ser nosotros los que ayudemos al programa también puede dar buenos resultados.

La otra cara del software para traductores son las memorias de traducción. Esto es algo mucho más humano, son listas de equivalentes en varios idiomas que uno se hace para que luego cuando esté traduciendo, el programa le vaya sugiriendo resultados que ya previamente hemos usado en otros textos, ya sean palabras, construcciones, oraciones, párrafos. Funcionan exactamente al revés que los programas de traducción automática en cuanto a que el trabajo inicial es mucho mayor (que darle al botón de traducir) pero los frutos son mucho mejores ya que somos nosotros los que hacemos las cosas y no un programa, conque habrá mucha menos revisión. Es especialmente útil para textos rutinarios y repetitivos especializados donde X en inglés es Y en español sin vuelta de hoja.

Sobre las memorias de traducción lo que hemos trabajado es la alineación. La alineación consiste en tomar dos textos paralelos (textos iguales o casi iguales en distintos idiomas) y a partir de ahí sacar una lista de segmentos equivalentes ya sea estructurados en párrafos u oraciones. Ejemplos de textos paralelos por excelencia serían prospectos farmacéuticos, manuales de instrucciones y cualquier tipo de texto prescriptivo multilingüe.

Para hacer esto necesitamos tener dos .txt (word y adobe tienen convertores), esos dos .txt los pasaríamos al Bitext (que nos permite unir y cortar párrafos y hacer retoques en los segmentos), que nos daría un .tmx. El .tmx después se puede incorporar a una memoria de traducción (con dejà vu por ejemplo). Otras aplicaciones funcionan con otros formatos como rtf.

¿Y qué podemos concluir de toda esta pequeña investigación?

- La traducción automática y asistida es un hecho en la vida del traductor moderno y en la vida de los que no conocen varios idiomas, especialmente en los textos especializados, que son los que más demanda tienen y los más compatibles con esta tecnología.

- La traducción automática sin revisión es bastante desastrosa.

- La traducción automática con revisión puede dar buenos resultados en textos rutinarios, repetitivos, mecánicos, especializados, técnicos.

- Revisar una traducción automática es un trabajo considerable que puede igualar o superar al de la traducción humana.

- Mecanizar los procedimientos de revisión dará un buen ritmo de trabajo.

- Se debe tener en consideración el revisar el original para que el software funcione mejor: los resultados son algo erráticos al principio, pero si se controla puede ayudar.

- Las memorias de traducción son una gran ayuda, dan bastante trabajo inicial pero son la herramienta más útil que tenemos. Minimizan mucho la revisión y el trabajo cuando la inversión de tiempo inicial se ha amortizado.

- Los textos que no son unívocos, claros, transparentes y dan lugar a interpretaciones o ambigüedades como los literarios, cinematográficos, artísticos, etc. son intratables con este software.

AH, una cosa, he borrado algunos comentarios porque me di cuenta de que no eran del todo pertinentes en un blog didáctico con supervisión del profesorado de la UAM. Espero no haber ofendido a nadie.

El décimo arte

¿Dónde estoy?

martes, 24 de abril de 2012

Proyecto con memoria y lexicon

martes, 3 de abril de 2012

Recap de Semana Santa

Seguidores

Datos personales