Blog
Generadores de imágenes con IA que debes conocer

Generadores de imágenes con IA que debes conocer

6min

20/12/2022

Crear imágenes con Inteligencia Artificial (IA) no es realmente nada nuevo, pero en poco tiempo ha avanzado muchísimo. Desde que en 2015, un algoritmo de aprendizaje automático pudo reconocer ciertos objetos en una imagen y describirlos, estas nuevas herramientas se han vuelto tan populares, porque ahora crean imágenes únicas basadas sus base de datos. Este tipo de contenidos únicos y exclusivos pueden resultar una excelente opción para utilizarlos a la hora de crear tu página web, crear tu tienda online…

Índice

¿Qué futuro nos espera con los generadores de imágenes IA?
Herramientas para crear imágenes con IA

¿Qué futuro nos espera con los generadores de imágenes IA?

Generar imágenes con IA puede ser controvertido porque podrían darse casos de un uso ético. La tecnología puede dar lugar a la creación de contenido explícito o utilizarse como herramienta para la desinformación. Muchos investigadores son conscientes de ello y, por eso, estas tecnologías, o parte de ellas, no están al alcance de todos. También está la implicación en el intrusismo profesional. ¿Se verán afectados fotógrafos, modelos, y artistas si estas inteligencias artificiales se vuelven populares?

Está claro que aún tienen sus limitaciones y las imperfecciones en la mayoría de las imágenes son palpables. Solo con el tiempo veremos si los resultados que nos ofrecen son verdaderamente perfectos.

El tiempo dirá si estas herramientas hacen que sea más fácil confiar en imágenes generadas automáticamente, que realizarlas desde cero, pero el potencial está ahí.

Herramientas para crear imágenes con IA

DALL·E 2

DALL·E 2, fue lanzado en enero de 2021 por la compañía OpenAI con el fin de generar imágenes a partir de textos descriptivos. En 2022 sacaron su segunda parte con mejoras importantes en la resolución y calidad de imagen, además de mayor capacidad de compresión y ejecución.

Permite crear imágenes a partir de un texto expresado de forma natural y nos deja libertad a la hora de incluir conceptos, atributos y estilos. Esta inteligencia artificial es capaz de ir más allá del lienzo original y lo expande añadiendo nuevas composiciones, teniendo en cuenta incluso las sombras, los reflejos y las texturas. También puede tomar una imagen y crear diferentes variaciones de ella inspiradas en la original.

DALL·E 2 utiliza un modelo de OpenAI llamado CLIP (Contrastive Language-Image Pre-Training) para obtener información semántica del lenguaje natural. A continuación, diversas imágenes y sus correspondientes textos descriptivos se entrelazan para crear la imagen final. OpenAI utiliza una versión modificada del modelo FLOAT para realizar la generación de imágenes.

El sistema se encuentra en constante aprendizaje y aunque solo puede crear reproducciones fieles con los parámetros conocidos, con el paso del tiempo nos llevará a todo un mundo de posibilidades.

Probar DALL·E 2 requiere de una cuenta de usuario. Una vez creada, nos concederán 50 créditos gratuitos durante el primer mes para generar imágenes. Si los consumimos, mensualmente nos regalarán 15 créditos, pero en el caso de que necesitemos más, tendremos que pasar por caja.

Así es cómo DALL·E 2 ve «Piensa Solutions«:

ejemplo imagen creada por IA piensa solutions

Craiyon

Conocido también como Dall-E mini, Craiyon es un generador de imágenes de código abierto con OpenAI. Es una herramienta gratuita, muy sencilla de utilizar y que nos ofrece hasta 9 resultados. Aunque es un poco lenta a la hora de ejecutarse, llega a entender distintos idiomas. Sin embargo, funciona mejor en inglés, utilizando frases cortas. Actualmente, Craiyon está aumentando el número de servidores para ofrecer un mejor rendimiento.

Podéis probar la herramienta desde aquí y ver qué imagen sale al poner «Piensa Solutions»:

ejemplo imagen IA Craiyon

Stable Diffusion – Dreamstudio

Stable Diffusion es un modelo capaz de generar imágenes fotorrealistas a partir de cualquier texto. Está desarrollado por Stability AI, una startup creada por investigadores de la Universidad de Heidelberg (Alemania). Las imágenes que genera esta IA tienen un nivel de detalle extraordinario, y se parecen más a las de DALL·E 2 que a las que ofrece, por ejemplo, Midjourney, que son menos realistas, pero más artísticas.

Como en otras propuestas, generar imágenes con IA con Stable Diffusion requiere de la recogida de datos a través de Internet. En este caso, se usó LAION-Aesthetics, un conjunto con millones de imágenes filtradas y clasificadas con el que le enseñaron conceptos para el aprendizaje. La técnica utilizada, aunque es efectiva, se expone al contenido no seguro y a los sesgos sociales, por lo que debemos usarla responsablemente.

La herramienta está disponible aquí. Para generar una imagen tan solo debemos introducir en inglés el texto deseado en el cuadro de abajo. Además, también nos permite ajustar el tamaño de la imagen.

Así ve esta IA un “hosting VPS en la luna”:

ejemplo imagen con IA Stable diffusion

Midjourney

Junto con DALL·E 2 y Stable Diffusion, Midjourney se ubica como uno de los generadores de texto a imagen de IA más populares y conocidos que existen. El sistema deja atrás el aspecto realista que otros quieren tener, ya que su filosofía se basa en lo artístico y hermoso, teniendo un estilo y una apariencia únicos.

Para probar Midjourney necesitamos acceder a su sitio web, hacer clic en Unirse a la Beta, crear una cuenta en Discord (si no la tenemos) y aceptar la invitación. Seguidamente, seleccionamos un canal newbies y en la parte de abajo podremos escribir un comando para generar un bot. Escribiremos /imagine seguido de un texto.

A continuación, el bot comenzará a generar cuatro opciones que la IA haya interpretado en la solicitud.

Así ve Midjourney unos “servidores en nubes lluviosas”:

ejemplo imagen con IA Midjourney

Image AI

Image AI de Google es una inteligencia que tiene como objetivo crear imágenes fotorrealistas a partir de un texto. Al igual que otros, utiliza formatos lingüísticos para comprender el texto y se apoya en modelos de difusión para crear imágenes de alta calidad.

La herramienta que Google ha creado para evaluar los modelos de texto a imagen se llama DrawBench. Las imágenes se procesan en baja resolución y tras un análisis, aplica un remuestreo. Bajo el concepto llamado umbralización dinámica, las imágenes parecerán más fotorrealistas.

De momento Image AI no está disponible al público y Google solo lo tiene como documento científico.

Generadores de imágenes con IA que debes conocer

¿Qué futuro nos espera con los generadores de imágenes IA?