Edición México
Suscríbete
Ed. México

El Imparcial / Tecnología / Google

Google muestra sistema que convierte texto en imágenes

El nuevo sistema AI de Google que genera imágenes a partir de texto todavía está en una etapa experimental y no está disponible para el público.

Google muestra sistema que convierte texto en imágenes

Google anunció su propio generador de imágenes a partir de texto, con una mejora de calidad con respecto a otros del mercado.

Desarrollaron un sistema AI que ofrece un grado de fotorrealismo nunca antes visto y un nivel profundo en cuanto a la comprensión del lenguaje.

Hasta hoy, el líder de este mercado ha sido DALL-E 2, un programa desarrollado por OpenAI en el 2021 y que ha recibido su última actualización en abril de este año.

Ahora Google ha llegado a desbancar a este gigante tecnológico y presenta 'Imagen', su nueva AI capaz de generar imágenes a partir de una pequeña descripción.

Y aunque el funcionamiento de 'Imagen' es muy parecido al de DALL-E 2, hay algunas diferencias importantes que hacen que los resultados sean más precisos.

Te puede interesar: Google presenta nuevos lentes con RA que traducen mientras hablamos

Innovaciones

El nuevo sistema AI de Google para generar imágenes ultrarrealistas a partir de texto ha mejorado bastante la comprensión del lenguaje para ofrecer resultados más exactos, indica Unocero.

'Nuestro descubrimiento clave es que los modelos genéricos de lenguaje grande (p. ej. T5), preentrenados en cuerpos de solo texto, son sorprendentemente efectivos para codificar texto para la síntesis de imágenes: aumentar el tamaño del modelo de lenguaje en Imagen aumenta tanto la fidelidad de la muestra como la alineación imagen-texto mucho más que aumentar el tamaño del modelo de difusión de imágene'

Se usó un punto de referencia llamado 'DrawBench' que prueba la composición y la relación espacial entre las imágenes y las palabras, para comparar 'Imagen' con otros modelos que realizan la tarea similar.

Y resultó que los evaluadores humanos prefieren a 'Imagen' de Google sobre los otros métodos (DALL-E 2, VQ-GAN+CLIP) tanto en la alineación imagen-texto como en la fidelidad de la imagen.

¿Está disponible para el público?

'Imagen' de Google no está disponible para el público en este momento, justo como sucede también con DALL-E 2.

Existen algunos temas que se deben revisar antes de estar disponible para todos los usuarios como el contenido con imágenes pornográficas o lenguaje tóxico.

También el conjunto de datos que se extraen con estos generadores de imágenes muchas veces reflejan estereotipos sociales.

La herramienta se puede probar en su sitio web de forma limitada. Ahí los usuarios podrán generar una imagen a partir de frases preestablecidas.

Sigue nuestro canal de WhatsApp

Recibe las noticias más importantes del día. Da click aquí

Temas relacionados