twitter account

Llega ChatGPT-4o, el nuevo modelo de Inteligencia Artificial: más rápido y potente

14/05/2024

Con Xataka

Mira Murati, directora de tecnología de OpenAI, durante la presentación de GPT-4o / 20bits

OpenAI anunció el lunes un nuevo modelo de inteligencia artificial (IA). Estamos hablando de GPT-4o, que se presenta como el producto más “inteligente y rápido” de la historia de la compañía dirigida por Sam Altman.

El nuevo modelo de ChatGPT de Inteligencia Artificial es mucho más rápido y mejora sus capacidades en texto, visión y audio.

GPT-4o es multimodal de forma nativa, característica que aborda el problema de la latencia y permite una interacción "en tiempo real". Una buena noticia es que este prometedor modelo estará disponible para todos los usuarios de ChatGPT, incluso para aquellos que utilizan la versión gratuita.

Más de la mitad de los internautas en España recuerre a la IA aunque genera desconfianza e inquietudEl nuevo modelo de ChatGPT Inteligencia Artificial ya está aquí. Es mucho más rápido y mejora sus capacidades en texto, visión y audio”. Es GPT-4o y convierte el ChatGPT en un asistente personal digital, capaz de entablar y traducir conversaciones en tiempo real, ahora en más de 50 idiomas.

El nuevo modelo de IA llegará a las distintas versiones a lo largo de las próximas semanas, pero mientras tanto se van publicando pormenores de lo que 'venden' como la octava maravilla.

“El modelo tiene capacidad de respuesta en tiempo real. Esto significa que no tienes que esperar ese incómodo retraso de dos o tres segundos para que dé una respuesta”. Además, el GPT 4o funciona como nuevo asistente de voz capaz de comentar con los usuarios textos, pero también imágenes grabadas en tiempo real.

El ChatGPT 4o resuelve ecuaciones, analiza gráficos e incluso puede expresarse de forma sarcástica y cariñosa. La última versión del CHATGPT estará disponible para cualquier usuario sin suscripción de pago.

La CTO de OpenAI, Muri Murati, dijo durante la transmisión que el nuevo modelo de IA tiene una "inteligencia al nivel de GPT-4", pero mejora en sus capacidades de texto, audio y visión. Este avance tecnológico ha permitido, entre otras cosas, desarrollar un nuevo modo de voz.

El modo de voz original de ChatGPT ofrecía respuestas con una latencia promedio de 2,8 segundos en GPT-3.5 y 5,4 segundos en GPT-4. El nuevo modo de voz rebaja el tiempo de respuesta hasta los 320 milisegundos y, gracias a GPT-4o, llega con un sistema de interacción mucho más natural.

Cuando esté disponible nos encontraremos con un asistente al que podremos hablarle en lenguaje completamente natural, como lo haríamos con otra persona. Por ejemplo, podremos interrumpirle mientras responde. Se trata de características que no habíamos visto en ninguna IA hasta el momento.

En la demostración en vivo hemos visto otras cosas realmente sorprendentes. El modelo no solo responde al instante, sino que también brinda respuestas en diferentes tonos de voz e incluso puede reír, cantar, tener diferentes estados de ánimo y resolver problemas matemáticos.