Documentos confidenciales presentados en una reciente cumbre interna de Google detallan el plan del gigante tecnológico para crear una inteligencia artificial (IA) diseñada para convertirse en el ‘Narrador de historias de vida’ de sus usuarios.
Pero para hacerlo, la IA requerirá un acceso sin precedentes a los datos personales de cada usuario.
No está claro dónde residirá esta IA experimental, actualmente denominada ‘Proyecto Ellmann’, entre las aplicaciones y servicios de Google, pero el equipo detrás de ella trabaja para Google Photos y su presentación sugirió un chatbot de IA personalizado.
«No podemos responder preguntas difíciles ni contar buenas historias sin una visión general de su vida», se lee en una parte de la presentación, realizada por un gerente de producto de Google.
Documentos confidenciales presentados en una reciente cumbre interna de Google detallan el plan del gigante tecnológico para crear una IA diseñada para convertirse en el ‘Narrador de historias de vida’ de sus usuarios. Partiendo del rival de ChatGPT de la compañía, Gemini, su nuevo proyecto eliminará una gran cantidad de datos personales de un usuario.
Partiendo del rival de ChatGPT de la compañía, Gemini, el Proyecto Ellmann utilizará «grandes modelos de lenguaje» (LLM) para sintetizar información personal a partir del contexto que se dice incluye biografías de los usuarios y sus seres queridos, así como «momentos» fotográficos almacenados.
Pero los nuevos desarrollos pueden provocar la alarma de aquellos indignados por la colección secreta de Google de millones de registros médicos confidenciales de personas, cuyo nombre en código es Proyecto Nightingale en 2019, o de cualquiera que recopile con entusiasmo consejos sobre privacidad digital.
«Revisamos sus fotos, observamos sus etiquetas y ubicaciones para identificar un momento significativo», según otra diapositiva de la presentación, obtenida por CNBC.
«Cuando damos un paso atrás y comprendemos su vida en su totalidad», continuaba la diapositiva, «su historia general se vuelve clara».
En resumen, el proyecto espera crear un chatbot personalizado estilo ChatGPT adaptado a sus intereses e historial de vida, según se deduzca de su historial de búsqueda en Internet, el carrete de la cámara del teléfono y otros datos, que seguramente incluirán compras de Google Wallet y más.
Un equipo de Google Fotos, según la presentación de este director de proyecto, dedicó meses a confirmar la aptitud del LLM para detectar patrones, después de ingerir resultados de búsqueda, fotos de usuarios y otros datos para «responder preguntas antes imposibles» sobre la vida de una persona.
La ambición del plan del equipo de crear retratos íntimos y profundos de sus usuarios está incorporada en el nombre del proyecto: una referencia al crítico literario y biógrafo Richard Ellmann, quien ganó un Premio Nacional del Libro por su biografía del novelista James Joyce.
El equipo de Google, según una diapositiva, espera que ‘Ellmann’ eventualmente pueda describir las fotos personales de un usuario con más detalle que ‘solo píxeles con etiquetas y metadatos’.
En un ejemplo, discutieron cómo Ellmann LLM podría escanear las fotos de un usuario y agruparlas en, por ejemplo, «recuerdos» o «momentos» del nacimiento del hijo de ese usuario, o un conjunto de imágenes tomadas en su reunión de clase de la escuela secundaria. .
«Han pasado exactamente 10 años desde que se graduó», como explicaba la diapositiva de la presentación en un análisis fotográfico, «y está lleno de caras que no se han visto en 10 años, por lo que probablemente sea una reunión».
Como ejemplo del tipo de «preguntas que antes eran imposibles» que el Proyecto Ellmann podría ayudar a los usuarios a responder, la presentación ofrecía solicitudes hipotéticas de los usuarios para saber cuándo los visitaron sus hermanos por última vez o a qué ciudad deberían mudarse.
Ellmann, basándose en la presentación, podría responder a ambas cosas.
Ellmann también parecía ser capaz de predecir y recomendar compras e incluso presentar un resumen de los hábitos alimentarios del usuario.
«Parece que te gusta la comida italiana», señaló el LLM del Proyecto Ellmann en una diapositiva. «Hay varias fotos de platos de pasta, así como una foto de una pizza».
Dado que la presentación provino de un gerente de Google Photos, CNBC especuló que la compañía podría planear incluir el nuevo producto de inteligencia artificial en su aplicación Google Photos.
Google Fotos tiene más de mil millones de usuarios y almacena 4 billones de fotos y vídeos, según una publicación de blog de Google Cloud.
En una señal más directa de quién consideraba el equipo de Google su competencia, el equipo resumió ‘Ellmann Chat’ a sus colegas pidiéndoles que ‘imaginen abrir ChatGPT pero ya sabe todo sobre su vida’.
En un ejemplo, Gemini proporciona una guía paso a paso de cómo cocinar una tortilla analizando imágenes del usuario en varios puntos.
Google temía lo peor cuando su competidor OpenAI lanzó su chatbot de inteligencia artificial (IA), ChatGPT, hace un año.
Es la respuesta al chatbot de IA, Gemini, que ha sido creado para impulsar el chatbot Bard de Google, supera al GPT-4 de ChatGPT en la mayoría de las pruebas cognitivas, dijo Google.
Géminis puede indicar a los usuarios cuándo está cocinada una tortilla, sugerir el mejor diseño para un avión de papel o ayudar a un futbolista a mejorar sus habilidades, a juzgar por un reciente y más público trabajo de investigación.
Pero es especialmente hábil en matemáticas y física, lo que alimenta las esperanzas de que pueda conducir a avances científicos que mejoren la vida de los humanos.
Google afirma que Gemini supera a GPT-4 en 30 de 32 medidas de rendimiento, incluida la generación de texto, respuesta a preguntas, razonamiento, comprensión de imágenes y «razonamiento de sentido común».
En su artículo de investigación Gemini, Google describió varias capacidades de la IA en lo que respecta a imágenes, incluido qué tejer con hilos de diferentes colores.
Si bien Gemini solo funcionará en inglés por ahora, la compañía dijo que la tecnología no tendrá problemas para diversificarse a otros idiomas.
Además del Proyecto Ellmann y Bard, Google también planea implementar Gemini dentro de su principal motor de búsqueda.
La compañía pareció quedar sorprendida por la presentación filtrada a CNBC, y emitió aclaraciones sobre cuestiones de privacidad a través de un portavoz.
«Google Photos siempre ha utilizado la IA para ayudar a las personas a buscar sus fotos y vídeos», dijo el portavoz, «y estamos entusiasmados con el potencial de los LLM para desbloquear experiencias aún más útiles».
«Esta fue una exploración interna temprana», enfatizó el portavoz.
«Si decidiéramos implementar nuevas funciones, nos tomaríamos el tiempo necesario para asegurarnos de que fueran útiles para las personas y estuvieran diseñadas para proteger la privacidad y seguridad de los usuarios como nuestra principal prioridad».