Joven investigador vasco revoluciona el mundo de la traducción mediante inteligencia artificial
Mikel Artetxe, investigador del sector de Investigación en Inteligencia Artificial de Facebook, revoluciona el mundo de la traducción con su tesis de doctorado.
Mikel Artetxe, científico del Facebook AI Research en Londres, es doctor en ingeniería informática por la Universidad del País Vasco (UPV/EHU), gracias a una tesis que ha revolucionado el campo de la traducción automática. Su sistema es capaz de aprender a traducir de un idioma a otro sin usar diccionarios ni traducciones previas.
Artetxe recogió este jueves 18 uno de los Premios de Investigación Sociedad Científica Informática de España (SCIE) - Fundación BBVA. Con él, han sido premiados un total de diecisiete investigadores españoles: nueve de la edición de 2020 y ocho de la de 2021; seis cada año, como Artetxe, en la categoría Investigadores Jóvenes Informáticos, además de un total de cinco Premios Nacionales de Informática.
Tras recibir el Premio, Artetxe arrancó su discurso con un párrafo que, según desveló después, había sido escrito por una máquina. Y lo culminó corrigiendo algunos datos que el sistema se había inventado sobre su vida, aunque la gramática y sintaxis habían resultado impecables.
¿En qué se diferencia la traducción automática en la que usted ha trabajado de los otros sistemas?
Los tradicionales son sistemas supervisados. Eso significa que parten de ejemplos existentes del problema a resolver. En este caso, traducciones existentes: si queremos traducir del castellano al inglés, tomaríamos de partida un montón de frases en castellano y sus traducciones correspondientes, hechas por un humano, en inglés. La máquina, partiendo de estos ejemplos, aprendería a traducir estos dos idiomas.
¿Y su nueva alternativa?
El paradigma no supervisado funciona sin traducciones existentes. Partiríamos de un montón de frases en castellano y frases en inglés, pero serían frases diferentes, no traducciones la una de la otra. Usando solamente eso, obtenemos un traductor.
La máquina aprende ella sola con lo que encuentra, como Tarzán en la selva...
Por hacer una analogía, es como si yo a ti te diera un montón de libros en árabe y otro montón de libros en chino, pero libros distintos. Y con eso y nada más tienes que aprender a traducir entre el árabe y el chino.
¿Ha alcanzado ya su límite la traducción automática o podrá con Dostoyevski?
No es lo mismo traducir un manual de intrucciones que traducir un texto periodístico o un libro de poesía. No es la misma dificultad, y tampoco es la misma la expectativa del lector. En un libro de poesía o una novela no queremos solamente entender lo que significa, también queremos disfrutar, y la forma tiene importancia. El dominio también es importante: si entrenamos a un sistema con textos periodísticos, luego no andará muy fino traduciendo libros de poesía, y al revés.
¿Se ha llegado ya al nivel de un texto periodístico?
El texto periodístico es donde se ha centrado más la investigación en traducción automática. Hay resultados que dicen que, siempre bajo determinadas condiciones, que la traducción automática ha llegado al nivel humano. Yo creo que esto hay que cogerlo con pinzas. Nadie que trabaje en traducción automática dirá que esto ya está resuelto.
En este punto, Artetxe recuerda que ya hay resultados de evaluadores externos que han puntuado mejor a textos traducidos por máquinas que por humanos, sin saber cuál era cuál. Pero insiste en que hay que tener cuidado al interpretarlos. Para empezar, no todos los humanos traducimos igual. Destaca, en cualquier caso, que la inteligencia artificial dio «un salto cualitativo importante» hace unos 10 años, gracias a la aplicación práctica de técnicas como el aprendizaje profundo y las redes neuronales.
Uno de los actuales retos, admite, es entender los sesgos que pueden tener las máquinas, las cuales parten de datos humanos y, en ocasiones, sesgados. «La cuestión es que muchas veces las máquinas pueden incluso amplificar esos sesgos, y queremos tener un cierto control o, por lo menos, conocer y entender, caracterizar, los sesgos que pueda tener una máquina». No hay que «temer» a la tecnología, propone, pero sí «ser conscientes».
¿Vamos a perder el trabajo periodistas y traductores?
No sé. A lo mejor, si eso pasa, a mí también me quitan el trabajo, porque ya no tendré nada que hacer. Creo que es difícil que lleguen a reemplazar por completo a los humanos en muchas tareas. Pero, seguramente, está sucediendo y sucederá que la intervención humana sea cada vez menor, igual que se dio en la industrialización, que nunca llegó a reemplazar del todo a los humanos... Yo creo que seguro que avanzamos en ese sentido, y bienvenido sea. Si en un futuro podemos tener todo lo que tenemos hoy, o más, trabajando menos, pues mira qué bien. Lógicamente, necesitaremos que se distribuya de una manera adecuada.
Pero eso no lo sabe hacer una máquina.
Eso es un problema social, lógicamente, sí.