Claudia Pacheco.
¿Qué es VLOGGER? La nueva IA de Google que promete hacer que tus fotos cobren vida con voz
Getty Images
- Google ha desarrollado una herramienta de IA que podrá crear avatares realistas a partir de una imagen.
- VLOGGER está en fase de desarrollo pero las primeras pruebas son prometedoras.
Google ha apostado de lleno por la inteligencia artificial en los últimos años y la compañía está decidida a competir con gigantes como OpenAI o Microsoft. La empresa es una de las apuestas más prometedoras en el campo de la IA desde la llegada de su chatbot Bard y el modelo multimodal Gemini.
El próximo lanzamiento de Google será un proyecto de IA conocido como VLOGGER. Esta herramienta permite coger una imagen y transformarla en un vídeo haciendo que las personas gesticulen y hablen de forma realista.
VLOGGER permitirá crear deepfakes con cierta facilidad al estilo de otras aplicaciones con funciones de IA avanzadas como DALL-E o la recién llegada Sora, ambos sistemas desarrollados por OpenAI.
Google quiere redefinir la forma de interaccionar en espacios virtuales
La aplicación está en fase de desarrollo, pero las primeras pruebas son esperanzadoras. VLOGGER tiene una interfaz simple que utiliza modelos de difusión, una técnica de aprendizaje automático que ha resultado ser eficaz en la generación de imágenes realistas a partir de prompts (descripciones de texto), recoge 20bits.
El equipo de desarrollo de Google ha destacado el potencial de VLOGGER para revolucionar plataformas de comunicación como Teams o Slack. Los usuarios pueden diseñar avatares animados en base a imágenes fijas y la app crea una animación. La herramienta se podrá utilizar en la creación de presentaciones, el ámbito educativo o el storytelling.
Google ha asegurado que la herramienta podrá doblar vídeos a otros idiomas y crear avatares con rasgos y movimientos humanos más realistas. Los usuarios también podrán utilizar VLOGGER para editar vídeos existentes o modificar elementos mediante inteligencia artificial.
La herramienta tendrá una interfaz sencilla en la que las personas podrán realizar ajustes hasta obtener el resultado esperado, así que las posibilidades de VLOGGER son casi infinitas.
La aplicación abrirá nuevas formas para interaccionar en espacios virtuales, pero eso no significa que su uso no suponga un peligro si llega a las manos equivocadas. Esta herramienta podría aumentar la creación de deepfakes destinados a desinformar ya que los usuarios no tienen que entrenar el modelo para cada persona.
VLOGGER se encuentra en fase de desarrollo
Google quiere crear un chatbot universal y VLOGGER le podría acercar poco a poco a su objetivo. La empresa sueña con que llegue el momento en el que la IA pueda interactuar con los humanos a través de la voz o los gestos.
La herramienta ha sido entrenada con más de 2.000 horas de vídeo y ha recopilado los rasgos faciales y gestos de más de 800.000 personas. El equipo de investigación de la compañía ha asegurado que puede reproducir los rasgos de las personas humanas de diferentes etnias, edades y un amplio abanico de expresiones.
VLOGGER está en fase de desarrollo y por el momento solo es un proyecto con cierto potencial, aún habrá que esperar para que esta tecnología se materialice y pueda competir con DALL-E o Sora.