• compartir

Parti es la nueva IA de Google que hace imágenes a partir de textos

Parti es la nueva IA de Google que hace imágenes a partir de textos

La tecnología siempre está avanzando y ahora Google está sorprendiendo a todos con Parti, una nueva forma de aplicar la Inteligencia Artificial (IA) que es capaz de generar imágenes con base a textos que recibe.

Como tal, Parti significa Pathways Autoregressive Text-to-Image, que en español es Caminos Autorregresivos de Texto a Imagen. Gracias al uso de modelos avanzados de lenguaje es capaz de crear contenido de tipo visual.

Esta no es la primera vez que alguien crea algo semejante, ya que a finales de mayo pasado salió un modelo similar de IA llamado IMAGEN, también de Google como Parti. La compañía considera que no compiten entre sí sino que son complementarios.

Todo debido a que están basados en diferentes modelos para generar los resultados. En el caso de IMAGEN emplea el de difusión, mientras que Parti es autorregresivo como mencionamos antes.

Parti es la nueva IA de Google que hace imágenes a partir de textos
Fuente: Google.

Para funcionar, Parti recurre a secuencias de tokens de imágenes en lugar de los componentes léxicos tradicionales de una cadena de caracteres que un lenguaje de programación puede comprender.

Algo que también aprovecha es otro modelo, el cual es conocido como ViT-VQGAN, que codifica las imágenes en forma de secuencias de tokens. Esa es la base sobre la cual funciona este nuevo sistema basado en la Inteligencia Artificial.

Parti es la nueva IA de Google que hace imágenes a partir de textos
Fuente: Google.

Parti recurre a texto para generar imágenes empleando IA

Entre mayores sean los parámetros la fidelidad aumenta y en este caso hablamos de miles de millones. Las cuatro escalas manejadas van de 350 millones hasta 20 mil millones.

Con base a lo anterior ViT-VQGAN reconstruye una imagen para Parti de Google, armando los tokens como si fueran las piezas de un colosal rompecabezas. Los creadores de esta tecnología dicen que su uso es más apropiado para crear lo irreal.

Es decir, cosas nunca vistas y en ese sentido este modelo puede manejar indicaciones largas y complicadas, las cuales reflejan lo que sabe del mundo.

Llega al grado de formar imágenes donde varios objetos interactúan, siguiendo las pautas marcadas por formatos determinados y hasta estilos. Tiene implementadas 1 mil 600 indicaciones en inglés que miden sus capacidades y soporta descripciones de 67 palabras. Es en verdad fascinante.

Si desean saber más de Google consulten TierraGamer. Igual tenemos más información de tecnología. Sigan nuestras noticias en Google News.