Los traductores online comienzan a lograr resultados “más humanos”

Los traductores online comienzan a lograr resultados “más humanos”

Por Marcelo Bellucci
En lo que se considera un avance capital en la búsqueda de la universalización de los idiomas, esta semana Google presentó un sistema que describe como la mayor evolución de su traductor en los últimos 10 años. La tecnología bautizada como Traducción Neuronal Mecanizada (NMT), mediante técnicas de aprendizaje profundo, le aporta a la oración claridad sintáctica y orden gramatical. Lo que aproxima a Google Translate, que ejecuta unas 1.000 millones de traducciones diarias, a los niveles de precisión humana. Microsoft también presentó un nuevo sistema de traducción esta semana.
La nueva herramienta de Google, tanto en formato Web como app, que lleva años de ajuste en los laboratorios de Google Brain, aprovecha la eficacia que aportan las redes neuronales y los algoritmos que manejan de datos.
Comparado con los métodos de traducción online tradicionales, que ofrecen una versión literal o robótica, su capacidad interpretativa reduce entre un 55% y un 85% los errores más frecuentes.
Google-Translate-bloques-texto-traducir_CLAIMA20161123_0341_28
El método que emplea NMT traduce oraciones completas intentando darles un significado homogéneo. “Anteriormente, las traducciones eran fragmentadas, ya que la plataforma tomaba las palabras por separado y después, procuraba otorgarles un sentido general. Ahora, la unidad sintáctica que uno ingresa en la caja del sistema informático, se traduce como en bloque buscando una composición colectiva”, señala Matías Fuentes, responsable de comunicación de producto de Google Argentina.
El nuevo método de traducción que se incorpora en Google Translate, incluye un total de 8 pares de idiomas de y hacia inglés: español, francés, alemán, portugués, chino, japonés, coreano y turco. Estos representan las lenguas nativas de alrededor de un tercio de la población mundial, que cubre más del 35% de todas las consultas.
El software de aprendizaje profundo procura imitar la actividad de las distintas capas de neuronas en la corteza cerebral con el fin de procesar enormes cantidades de datos para resolver problemas que los seres humanos consiguen de forma intuitiva. Gracias a esta mayor profundidad, se lograron avances en áreas tan diversas como la percepción de objetos, la traducción automática y el reconocimiento de voz.
“Este sistema computacional está buscando emular el funcionamiento de las neuronas del sistema humano, algo que le permite aprender de cada intento. Y en cada consulta que se realiza, pretende aplicar todo ese conocimiento que va acumulando. Y si bien a simple vista el Google Translate no muestra grandes cambios, de a poco se va a ir reflejando en las respuestas que ofrece” apunta Fuentes.
Para la traducción automática, Google está utilizando un tipo de red neuronal profunda llamada LSTM, cuya virtud es retener la información, tanto a corto como a mediano plazo, como si fuera una memoria humana, permitiéndole aprender de forma más compleja.
Para evaluar la actividad del software, Google pidió a unos participantes que puntuaran su grado de satisfacción, en una escala del 1 al 6, a una misma traducción de texto realizada por humanos y su NMT. Los resultados fueron sorprendentes, ya que sin saber quien la había realizado, el sistema obtuvo una calificación de 5,43 mientras el equipo humano alcanzó los 5,5, según afirmó Google.
Y si bien las mejoras son significativas, los desarrolladores son conscientes de que aún hay un amplio trecho por mejorar. “La traducción automática no ha sido solucionada y NMT puede cometer importante errores que no escaparían a un humano, como dejar palabras en blanco o traducir mal nombres propios o términos extraños”, dicen los responsables del proyecto.
En la misma dirección se desplaza el Microsoft Translator que gracias al funcionamiento de las redes neuronales, que captan mejor el contexto de frases, apunta que los resultados sean más efectivos de los que se ofrecen en la actualidad y se parezcan más a lo que un ser humano conocedor de cada idioma pueda interpretar.
Uno de sus logros de este sistema, que como el de Google opera tanto en la versión Web como en el móvil, es convertir cada combinación de palabras en un vector capaz de establecer si en el contexto de la oración “temporal”, por ejemplo, es una tormenta, el adjetivo relativo al tiempo o el hueso del cráneo. Además del español, trabaja con portugués, el francés, el alemán, el chino, el ruso y el árabe. Próximamente, se irán sumando nuevos vínculos.
Y si la intención es preservar la pureza de las traducciones, Quality Translation 21 es un proyecto financiado con fondos de la Unión Europea que pretende entregar algo distinto. En casi todos los traductores para pasar del italiano al libanés, por ejemplo, el texto deberá pasar primero por una aproximación en inglés y de ahí a la otra lengua. Traslation 21 busca “eliminar el intermediario”, traduciendo de cualquier idioma a otro.
CLARIN