UrbanObserver

Una startup china de IA apunta a Sora de OpenAI con el lanzamiento de una herramienta de conversión de imagen a vídeo

Aquí se muestra un clip generado por IA del sitio web de Vidu. La herramienta puede crear videos a partir de mensajes de texto o imágenes.

Evelyn Cheng | CNBC

BEIJING – Shengshu Technology, con sede en Beijing, dijo el miércoles que su herramienta de conversión de texto a video Vidu, impulsada por inteligencia artificial, ahora podrá generar videos combinando imágenes.

Vidu ya permite a los usuarios de todo el mundo crear clips de 8 segundos basados ​​en indicaciones escritas. Mientras que OpenAI el creador de ChatGPT — en febrero reveló que su modelo de IA Sora podría generar videos de un minuto a partir de texto, pero aún no lo ha publicado públicamente.

La nueva función de inteligencia artificial de Vidu puede combinar tres imágenes (como una camiseta, una persona y un ciclomotor) en un vídeo de la persona que lleva la camiseta y conduce el ciclomotor a través de una escena, dijo Shengshu.

Otras plataformas afirman que pueden convertir texto o imágenes en vídeos utilizando IA, pero la calidad del resultado varía. El avance que afirma Shengshu es la capacidad de tomar tres imágenes únicas e integrarlas con coherencia visual en un vídeo generado por IA.

«Muy pronto identificamos [visual consistency] como el problema y quería resolverlo bien», dijo Fan Bao, director de tecnología de Shengshu, en mandarín, traducido por CNBC.

Vidu se lanzó en abril y su capacidad para convertir dos fotos de perfil en videos realistas de personas abrazándose se volvió viral en TikTok.

El generador de vídeo de IA ya está generando dinero gracias a los anunciantes, animadores y otras empresas, dijo en mandarín el cofundador y director ejecutivo de Shengshu, Jiayu Tang, según una traducción de CNBC. Dijo que las tarifas de uso mensual por cliente pueden oscilar entre 100.000 yuanes y 1 millón de yuanes (entre 13.871 y 138.711 dólares).

Para abordar los problemas de derechos de autor, Tang dijo que una empresa podría firmar un acuerdo con un artista que permita a la IA imitar el estilo de pintura del artista para un anuncio. Dijo que no había visto casos legales importantes sobre el uso de imágenes por parte de los consumidores.

Tang añadió que Vidu no permite al público generar contenido utilizando imágenes de celebridades o personas «sensibles». Dijo que la herramienta de inteligencia artificial también prohíbe desnudos e imágenes violentas. En cuanto a las fotografías personales, Tang dijo que Vidu destruye los datos de acuerdo con la regulación general de protección de datos, un punto de referencia mundial.

Shengshu se fundó el año pasado con patrocinadores como Baidu Ventures, Ant Group, filial de Alibaba, la startup china Zhipu AI, Qiming Venture Partners y la ciudad de Beijing, según PitchBook.

Tang dijo que la IA de Vidu se ejecuta en servidores en la nube alquilados en China y en el extranjero.

Fuente

Últimas

Salir de la versión móvil