Meta (Facebook) presenta una inteligencia artificial capaz de traducir un discurso en tiempo real
Meta, la compañía tecnológica de Mark Zuckerberg, presentó a finales de agosto su nuevo modelo de inteligencia artificial (IA) para hacer traducciones y transcripciones de casi cien idiomas. Bajo el nombre de SeamlessM4T, este revolucionario modelo multimodal y multilingüe puede reducir los retrasos en los procesos de traducción e incluso es capaz de traducir de voz a texto en casi cien idiomas de entrada y salida, traducir de voz a voz en casi cien idiomas de entrada y 36 de salida, traducir de texto a texto en cerca de cien idiomas y traducir de texto a voz en cien idiomas de entrada y 35 de salida.
Sin embargo, gracias a una arquitectura 'v2' actualizada, Meta mejora esta herramienta con dos funciones nuevas para que las traducciones conversacionales sean más espontáneas y expresivas.
La primera de las dos características nuevas es SeamlessExpression que, como se puede leer en el nombre, traslada las expresiones a un discurso traducido —como el volumen, el tono emocional, la velocidad del habla y las pausas—. Además, teniendo en cuenta que hasta ahora los discursos traducidos siempre sonaban bastante robóticos, este avance es útil para el uso del diario y la producción de contenidos.
Por otro lado, la segunda característica es SeamlessStreaming, que va traduciendo un discurso mientras el orador habla, permitiendo así que otros escuchen la traducción mucho más rápido. No obstante, todavía hay una breve latencia de poco menos de dos segundos —aunque es importante mencionar que los usuarios no tienen que esperar hasta que alguien termine una oración para conseguir una traducción—.