A principios de este mes, asistí a la Cumbre Global del Ecosistema Digital de Tencent en Shenzhen, donde pude experimentar su exhibición Digital Human en el Centro Mundial de Convenciones y Exposiciones de Shenzhen.
Junto con otros medios internacionales, incluidos periodistas de Malasia e Indonesia, nos presentaron una versión digital del Sr. Dowson Tong, director ejecutivo de Tencent Cloud. Grandes multitudes se reunieron para ver aparecer una versión virtual del Sr. Tong en una pantalla grande y realizar una presentación en tres idiomas: chino, inglés y luego bahasa indonesio.
Luego fue mi turno (tenía muchas ganas de probar la tecnología).
Con mi teléfono, escaneé un código QR que me dirigió al sitio web de Tencent, donde envié una foto reciente, una grabación de voz de 30 segundos y un párrafo de texto de 100 palabras para que mi humano digital las dijera.
También tuve la libertad de elegir entre nueve idiomas diferentes para mi humano digital: chino, inglés, coreano, japonés, árabe, bahasa indonesio, tailandés, francés o alemán. Incluso había una opción para cambiar la voz a un género diferente, lo cual me pareció fascinante.
Lamentablemente hubo dificultades técnicas. A pesar de la ayuda del personal de Tencent, no pude generar mi humano digital en el sitio, por lo que el proceso tuvo que completarse de forma remota una vez que regresé a Singapur.
Recibí ayuda del equipo de Tencent Cloud y Smart Industries Group. Proporcioné una grabación de voz de un minuto, junto con un vídeo de 30 segundos. Me dijeron que mi cara y mi boca tenían que ser claramente visibles en todo momento. Y para divertirme, decidí recitar trabalenguas, asegurándome de que mi cara se moviera en sincronía con mis palabras.
Antes del paso final, se me pidió que diera mi consentimiento, así que recité: «Yo, Melody Chan, soy consciente de que Tencent Cloud utilizará las grabaciones de mi voz para crear y utilizar una versión sintética de mi voz».
Cuando llegó el producto final, era sorprendentemente realista, casi un espejo del vídeo que había enviado. La voz, aunque ligeramente robótica, era impresionante. Escucharme hablar con fluidez en idiomas que no conozco, como tailandés, árabe y francés, fue surrealista.
Sin embargo, hubo algunos pequeños fallos. Las pausas en las oraciones parecían un poco antinaturales y, si prestabas mucha atención, podías ver los gestos de mis manos repitiéndose.
Al final, crear mi propio doble digital hiperrealista fue sin lugar a dudas divertido, pero también un poco distópico. Parecía algo sacado directamente de Black Mirror.
Ver cómo ‘Digital Melody’ cobrar vida me hizo preguntarme… ¿cuánto falta para que la IA llegue a nuestros trabajos?