Gemini AI de Google insinúa el próximo gran salto de la tecnología: Analizar información en tiempo real
El nuevo sistema Gemini de Google ha demostrado comprender contenido en tiempo real, como video en vivo y habla humana.
CALIFORNIA.-Google ha presentado Gemini, un nuevo sistema de inteligencia artificial (IA) que parece entender y hablar de manera inteligente sobre casi cualquier tipo de estímulo: imágenes, texto, voz, música, código informático y más.
Este tipo de sistema de IA se conoce como un modelo multimodal, un paso más allá de simplemente manejar texto o imágenes como lo hacían los modelos anteriores. Gemini sugiere el próximo gran salto tecnológico al poder analizar y responder a información en tiempo real proveniente del mundo exterior.
Aunque las capacidades de Gemini podrían no ser tan avanzadas como parecían en un video viral, es evidente que los sistemas de IA están progresando rápidamente hacia la capacidad de manejar entradas y salidas cada vez más complejas.
Los sistemas de IA dependen en gran medida del tipo de datos de "entrenamiento" a los que tienen acceso para desarrollar nuevas capacidades. Actualmente, las empresas como Google, OpenAI, Meta y otras entrenan sus modelos principalmente con datos digitalizados de Internet. Sin embargo, hay esfuerzos para ampliar radicalmente el alcance de los datos con los que la IA puede trabajar, incluyendo el uso de cámaras siempre encendidas, micrófonos y otros sensores para proporcionar información en tiempo real.
¿Qué demuestra Gemini de Google?
El nuevo sistema Gemini de Google ha demostrado comprender contenido en tiempo real, como video en vivo y habla humana. Con datos y sensores adicionales, la IA podrá observar, discutir y actuar sobre eventos en el mundo real.
Este avance tiene aplicaciones potenciales en áreas como los vehículos autónomos, que ya recopilan grandes cantidades de datos para mejorar el flujo de tráfico y ayudar a las autoridades a identificar comportamientos sospechosos. En el hogar, los sensores de movimiento, asistentes de voz y cámaras de seguridad ya se utilizan para detectar actividad y comprender hábitos.
Aunque las oportunidades positivas son enormes, también existe el riesgo de intromisión en la privacidad. La recopilación masiva de datos puede ofrecer beneficios significativos, pero los responsables de formular políticas deben equilibrar estos beneficios con los riesgos. A medida que la IA se vuelva más integral en la comprensión del mundo real, será esencial supervisar no solo el poder y la omnipresencia de los nuevos modelos de IA, sino también el contenido que recopilan.
A medida que la IA expande sus capacidades hacia la próxima frontera, el mundo real, solo nuestra imaginación limitará las posibilidades. El desafío radica en garantizar que estos avances tecnológicos beneficien a la sociedad sin comprometer la privacidad y la ética.
Artículo original publicado en The Conversation
Sigue nuestro canal de WhatsApp
Recibe las noticias más importantes del día. Da click aquí