La presentación de novedades de primavera de OpenAI no deja indiferente a nadie. En esta ocasión se presenta un nuevo modelo de Inteligencia Artificial, que han venido a denominar ChatGPT Omni, capaz de integrar en el modelo de IA texto, audio y video. De esta forma, la cámara y el micrófono de nuestros dispositivos se convierten en nuevos sentidos, que logra fusionar de forma increíble, tal como se muestra en el directo de la presentación, hace escasas horas.
En comparación con Google Gemini, las respuestas que ofrece parecen ser proporcionadas en tiempo real, con unos tiempos de reacción similares a los de un ser humano, siendo capaz de articular, relacionar y procesar nuestra conversación, peticiones, imágenes y vídeo que vayamos proporcionando. Resulta increíble observar cómo es capaz de adaptar la entonación al estado de ánimo de la conversación, parar en su locución cuando es interrumpida para retomar los planteamientos que su interlocutor indica en cada momento. También parece capaz de interpretar gráficas estadísticas, código fuente y comentarlo usando la voz. Esta fantástica integración estará disponible para las versiones de pago, en las próximas semanas.
ChatGPT4 de acceso abierto
Por otra parte OpenAI ha decidido liberar la versión de ChatGPT 4, lo que resulta en sí mismo una revolución. Si ya nos parecía increíble lo que se podía conseguir con ChatGPT 3.5, a dónde podremos llegar con la versión 4. Sin embargo, al igual que otros modelos de negocio/empresa (del sector de los buscadores y las redes sociales), la libertad de acceso y uso, no significa que sea gratis. No olvidemos que todos los datos y comunicaciones de la interacción podrían ser almacenados en servidores remotos y empleados para caracterizar, perfilar y generar en definitiva un gemelo digital de los usuarios. A pesar de cualquier avance, siempre existirá el problema de la privacidad. Aspecto considerado en el último seminario de ConocimIA.
Esperábamos algo más…
Si bien, los avances presentados, casi no tienen calificativos, sí es cierto que se esperaba algo más. En concreto, corrían los rumores del lanzamiento de un buscador general con ChatGPT integrado, que hipotéticamente competería directamente con Google. Esto al final no fue así, y en principio no se alumbró por el momento esa posibilidad. Sin embargo, sí se puede especular en que la versión más evolucionada de ChatGPT, podría llegar antes de final de año con ChatGPT 5, la quizás tan esperada AGI o Inteligencia Artificial General. Sin duda, la integración de sentidos en Omni, va camino de conseguirlo.
Referencias
OpenAI. (2024). ChatGPT-4 Omni. https://openai.com/index/hello-gpt-4o
Gizmodo. OpenAI presenta las capacidades de voz de GPT-4 Omni y son literalmente increíbles. https://es.gizmodo.com/openai-presenta-las-capacidades-de-voz-de-gpt-4-omni-y-1851473546
El Confidencial. Así funciona la nueva versión de ChatGPT que lo ve y oye todo a su alrededor. https://www.elconfidencial.com/tecnologia/2024-05-14/nueva-version-chatgpt-ve-y-oye-todo_3883244
ADSLZone. Llega ChatGPT-4o, la versión ultra mejorada de ChatGPT para imágenes, vídeo, audio y texto. https://www.adslzone.net/noticias/ia/lanzamiento-gpt-4o