Google anunció hoy el lanzamiento de Veo 3, la nueva versión de su generador de video impulsado por inteligencia artificial, que ahora no solo crea imágenes en movimiento, sino que también genera e integra audio, incluyendo diálogos entre personajes y sonidos ambientales como los de animales.
Con esta actualización, Google se posiciona como competidor directo de herramientas como Sora de OpenAI, pero con una diferencia clave: la generación de audio sincronizado en los videos creados desde texto o imágenes.
“Veo 3 destaca en la sincronización labial precisa, física realista y generación a partir de texto e imágenes,” afirmó Eli Collins, vicepresidente de producto de Google DeepMind, en el blog oficial de la compañía.
IA audiovisual al alcance de creadores avanzados y empresas
Veo 3 está disponible a partir de hoy en Estados Unidos para los suscriptores del nuevo plan Ultra de Google, dirigido a entusiastas de la IA, con un costo mensual de $249.99 dólares. También se integra en Vertex AI, la plataforma empresarial de Google para desarrolladores y compañías que utilizan inteligencia artificial a gran escala.
Imagen 4, Flow y Lyria 2: más herramientas creativas con IA
Además del lanzamiento de Veo 3, Google presentó otras innovaciones de su ecosistema de creación con IA:
- Imagen 4, su herramienta más reciente de generación de imágenes, que promete una mayor fidelidad y calidad visual a partir de instrucciones escritas.
- Flow, una nueva solución para cineastas y creadores de contenido que permite diseñar escenas cinematográficas indicando locaciones, planos y estilos preferidos. Flow estará disponible a través de Gemini, Whisk, Vertex AI y Workspace.
- Lyria 2, el modelo de generación de música de Google, se abre a creadores mediante YouTube Shorts y también a empresas vía Vertex AI.
Un mercado cada vez más visual y competitivo
Los nuevos lanzamientos llegan en un momento donde la generación de imágenes y videos mediante IA está en auge. En marzo, el CEO de OpenAI, Sam Altman, reveló que el uso del generador de imágenes de ChatGPT 4o fue tan intenso que «literalmente derritió chips» debido a la alta demanda.
Google, por su parte, busca consolidar su liderazgo tras algunos tropiezos previos, como la controversia del año pasado con Imagen 3, que tuvo que ser relanzada tras producir imágenes históricamente inexactas. En su momento, el cofundador de Google, Sergey Brin, atribuyó el problema a una “falta de pruebas exhaustivas”.
La empresa también actualizó recientemente Veo 2, añadiendo la función de agregar o eliminar objetos en videos mediante instrucciones escritas, una característica que ahora se fortalece con las capacidades sonoras de Veo 3.
Fuente: CNBC