Google ha presentado Veo 3.1, un modelo mejorado de generación de video con IA que mejora la calidad de audio, el realismo y la precisión de los prompts. La actualización amplía la disponibilidad en todo su ecosistema, incluyendo la app Gemini y la herramienta de filmmaking Flow, mientras introduce una variante 'Rápida' que ahorra costos. Esta versión busca apoyar formatos de video verticales populares en plataformas como YouTube Shorts y TikTok.
El Veo 3.1 de Google se basa en las capacidades introducidas con Veo a principios de este año, que representó un avance significativo en la calidad de video con IA tras Veo 2. El nuevo modelo enfatiza una mayor adherencia a los prompts, lo que lleva a salidas de video más precisas y reduce el desperdicio computacional. Las características de audio, un aspecto clave de la versión anterior Veo 3, han sido refinadas aún más para una mejor integración.
Previamente limitado a videos en formato horizontal de 720p, Veo 3.1 ahora genera formatos tanto horizontales como verticales en 16:9, alineándose con el auge del contenido vertical en línea. Este desarrollo respalda el compromiso anterior de Google de integrar herramientas Veo en YouTube Shorts, que favorecen videos verticales similares a TikTok. Como resultado, se espera que los videos generados por IA aparezcan con más frecuencia en tales plataformas.
El modelo se implementa en las herramientas de IA de Google: los usuarios pueden acceder a Veo 3.1 y su variante 'Rápida' a través de la app Gemini, mientras que los desarrolladores obtienen acceso mediante Vertex AI y la API de Gemini. La opción 'Rápida' ayuda a gestionar costos por token, potencialmente ofreciendo más generaciones para los usuarios de la app Gemini.
En la herramienta de filmmaking Flow, Veo impulsa nuevas funciones como Ingredients to Video, Frames to Video y Extend, ahora compatibles con audio generado. Los usuarios pueden subir imágenes como referencias o puntos finales mientras agregan sonido personalizado. Innovaciones adicionales incluyen ediciones de precisión: replicar la apariencia de un video para agregar objetos sin alterar el resto de la escena, disponible de inmediato en Flow y la API. La eliminación de objetos sigue un enfoque similar, pero se lanzará pronto en Flow.
Esta actualización posiciona a Google de manera competitiva frente a rivales como OpenAI, que recientemente lanzó una app para iPhone de su IA de video Sora. El despliegue comienza hoy, instando a la precaución al ver videos en línea en medio del creciente realismo de la IA.