La nueva actualización de Chatgpt te permite hablar con emociones

La función “Sé mis ojos” es un avance revolucionario que permite a la IA describir en tiempo real lo que aparece en imágenes, incluso detectando emociones en expresiones faciales.

Chatgpt 4

Por Yolaisi García

19 de mayo 2024

El lunes pasado, OpenAI dio un paso audaz al presentar su última versión de ChatGPT, denominada GPT-4o (“o” de “omni”). Esta nueva actualización, disponible gratuitamente para todos los usuarios con funcionalidades mejoradas para suscriptores, representa un salto hacia adelante en la convergencia de chatbots, asistentes de voz y procesamiento de imágenes.

Según informes del New York Times, mientras otros gigantes tecnológicos están adaptando sus asistentes de voz a la forma de los chatbots, OpenAI está llevando su chatbot a la esfera de los asistentes de voz, redefiniendo así la interacción usuario-máquina.

Una de las características más destacadas de GPT-4o es su capacidad para mantener conversaciones fluidas y emotivas, respondiendo a solicitudes de audio en un tiempo comparable al de una conversación humana en inglés y permitiendo a los usuarios interrumpir en cualquier momento. Además, este modelo es capaz de generar respuestas con diferentes estilos emocionales, desde lo dramático hasta lo sarcástico.

La función “Sé mis ojos” es un avance revolucionario que permite a la IA describir en tiempo real lo que aparece en imágenes, incluso detectando emociones en expresiones faciales. Esta colaboración con Be My Eyes busca mejorar la accesibilidad para personas con discapacidad visual.

GPT-4o también destaca por su capacidad de traducción en tiempo real y asistencia en reuniones, donde puede transcribir, tomar notas y resumir los eventos. Además, puede ayudar con tareas matemáticas complejas sin revelar directamente la respuesta, brindando una guía interactiva para el usuario.

La inclusión de funcionalidades de generación de imágenes, como las de Dall-E, añade otra capa de versatilidad al modelo, permitiendo la creación de imágenes a partir de comandos de texto o la transformación de fotos en caricaturas, entre otras opciones.

Sin embargo, la presentación no estuvo exenta de fallos, como la confusión de la IA al identificar objetos o interrumpir incómodamente en la conversación. Estos incidentes subrayan la necesidad de seguir refinando la tecnología para mejorar su fiabilidad y seguridad.

Te puede interesar: ChatGPT podrá traducir en simultáneo; acciones de Duolingo caen

A pesar de esto, el lanzamiento de GPT-4o señala la dirección futura de OpenAI hacia la creación de un asistente virtual más completo, capaz de recordar interacciones pasadas y manejar múltiples modalidades de entrada de manera instantánea. Aunque aún queda por ver cómo se comportará esta tecnología a gran escala, los primeros indicios sugieren que OpenAI está a la vanguardia de la innovación en la interacción hombre-máquina.

Temas relacionados