lunes, diciembre 2, 2024

La herramienta Nifty AI convierte tus bocetos defectuosos en obras de arte en segundos, y NO necesita Internet

¿Leonardo D-AI Vinci? La herramienta Nifty AI convierte tus bocetos defectuosos en obras de arte en segundos, y NO necesita Internet

  • Qualcomm ha presentado un nuevo modelo que convierte texto e imágenes en ilustraciones de IA
  • ControlNet no sube datos a ‘la nube’ y no necesita internet para funcionar
  • Los bocetos malos se pueden transformar en obras maestras en menos de 12 segundos.

Muchos de nosotros soñamos con ser artistas en algún momento de nuestras vidas, pero los bocetos poco fiables a menudo pueden impedir que lleguemos allí.

Ahora, estos sueños pronto pueden ser posibles, ya que una nueva herramienta puede transformar tus malos garabatos en obras maestras gracias al poder de la inteligencia artificial (IA).

El gigante tecnológico Qualcomm presentó su innovador software ControlNet a principios de esta semana, que convierte las indicaciones de imágenes en lo que quieras en 12 segundos.

A diferencia de muchos otros modelos de este tipo, como Adobe AI Firefly, Sorprendentemente, ControlNet no necesita Internet para funcionar y pronto podría convertirse en una importante aplicación para teléfonos móviles.

Si bien aún no se ha lanzado, la firma afirma que producir imágenes aquí será completamente privado, sin datos respaldados en una nube de terceros.

Los bocetos malos se pueden transformar en obras maestras en menos de 12 segundos usando ControlNet. En esta demostración, un usuario ingresó un dibujo de un gatito e instó al modelo a que lo hiciera ‘amarillo’, ‘fotorrealista’ y en calidad ‘4k’ usando un mensaje de texto. La imagen final se muestra en el lado derecho.

¿QUÉ ES LA NUBE?

La nube se refiere a servidores ubicados en centros de datos en todo el mundo pero accesibles a través de Internet.

Si las empresas utilizan la computación en la nube, no tienen que administrar estos servidores por sí mismas ni ejecutar software de uso intensivo de energía en sus máquinas.

La nube también permite a los usuarios acceder a sus archivos desde casi cualquier dispositivo porque sus datos se almacenan en un centro específico en lugar de en su propio dispositivo.

Así es como los datos de cuentas de redes sociales, como los inicios de sesión de Instagram, pueden transferirse de un teléfono roto a uno nuevo muy rápidamente.

Fuente: Cloudfare

“La IA generativa ha conquistado el mundo, alterando las formas tradicionales de crear contenido”, dijo un portavoz de Qualcomm.

‘ControlNet permite a los usuarios ingresar una descripción de texto de una imagen, así como una imagen adicional para controlar el proceso generativo.’

ControlNet se presenta en medio de numerosas herramientas de IA similares de este tipo, que comúnmente se conocen como modelos de visión de lenguaje (LVM).

Estos generalmente fusionan un codificador de imágenes y un codificador de texto para leer las instrucciones proporcionadas por un usuario, antes de producir contenido nuevo.

Si bien ControlNet aún no está disponible para uso público, las demostraciones muestran que puede producir ilustraciones a partir de mensajes de texto, mensajes de imagen y ambos simultáneamente.

Las imágenes elegidas pueden ser cualquier cosa, desde dibujos personales hasta fotografías, mientras que las entradas de texto pueden indicar qué estilo o «material» debe usar la IA para producir una nueva versión.

Se podría usar acuarela o pintura al óleo para generar una imagen, por ejemplo, y luego se representan en calidad 4k.

Como este proceso se ejecuta únicamente en un dispositivo determinado, Qualcomm afirma que tanto su tiempo de ejecución como su consumo de energía también se reducen significativamente.

El portavoz agregó: «Las imágenes se generan en menos de 12 segundos para brindar una experiencia de usuario interactiva que sea confiable y consistente.

‘La IA en el dispositivo brinda beneficios en términos de costo, rendimiento, personalización, privacidad y seguridad a escala global’.

En esta demostración de ControlNet, un usuario ingresó una fotografía de sí mismo y parece que se le pidió al modelo que produjera una obra de arte de estilo antiguo.

En esta demostración de ControlNet, un usuario ingresó una fotografía de sí mismo y parece que se le pidió al modelo que produjera una obra de arte de estilo antiguo.

No está claro cuándo ControlNet estará disponible para uso público, pero se podrá usar en teléfonos como se muestra en esta demostración de Qualcomm.  Aquí, un usuario ha utilizado la indicación de imagen y la indicación de texto, solicitando una foto 4k 'fotorrealista' de ellos

No está claro cuándo ControlNet estará disponible para uso público, pero se podrá usar en teléfonos como se muestra en esta demostración de Qualcomm. Aquí, un usuario ha utilizado la indicación de imagen y la indicación de texto, solicitando una foto 4k ‘fotorrealista’ de ellos

El nuevo producto de Qualcomm sigue a una reacción violenta contra los modelos de imágenes generados por IA, con numerosos artistas expresando sus preocupaciones sobre los derechos de autor.

Esto fue provocado en gran medida por la ilustradora de Disney, Hollie Mengert, después de descubrir que su trabajo se utilizó sin consentimiento para entrenar a una nueva modelo en Canadá.

Desde entonces, muchos han debatido la ética del uso de obras de arte para entrenar a la IA, y la legalidad de hacerlo también es un área gris en todo el mundo.

Aún no está claro de quién son las imágenes que se han utilizado para entrenar a ControlNet, pero MailOnline se ha puesto en contacto con Qualcomm para obtener más información.

AI de texto a imagen ‘DALL-E’ ahora puede imaginar lo que hay fuera del marco de pinturas famosas

OpenAI, una empresa con sede en San Francisco, ha creado una nueva herramienta llamada ‘Outpainting’ para su sistema de IA de texto a imagen, DALL-E.

Outpainting permite que el sistema imagine lo que está fuera del marco de pinturas famosas como Girl with The Pearl Earring, Mona Lisa y Dogs Playing Poker.

Como han demostrado los usuarios, puede hacer esto con cualquier tipo de imagen, como el hombre en el logo de Quaker Oats y la portada del álbum de los Beatles ‘Abbey Road’.

DALL-E se basa en redes neuronales artificiales (ANN), que simular la forma en que funciona el cerebro para aprender y crear una imagen a partir de un texto.

DALL-E ya permite cambios dentro de una imagen generada o cargada, una capacidad conocida como Inpainting.

Es capaz de completar automáticamente los detalles, como las sombras, cuando se agrega un objeto, o incluso ajustar el fondo para que coincida, si se mueve o elimina un objeto.

DALL-E también puede producir una imagen completamente nueva a partir de una descripción de texto, como «un sillón con forma de aguacate» o «una vista transversal de una nuez».

Otro ejemplo clásico del trabajo de DALL-E es «los osos de peluche que trabajan en una nueva investigación de IA bajo el agua con tecnología de la década de 1990».

Leer más

Fuente

Últimas

Últimas

Ártículos Relacionades

CAtegorías polpulares

spot_imgspot_img