Google a dévoilé Veo 3.1, un modèle amélioré de génération vidéo par IA qui améliore la qualité audio, le réalisme et la précision des prompts. La mise à jour étend la disponibilité à travers son écosystème, y compris l'application Gemini et l'outil de réalisation Flow, tout en introduisant une variante 'Rapide' économique. Cette sortie vise à soutenir les formats vidéo verticaux populaires sur des plateformes comme YouTube Shorts et TikTok.
Le Veo 3.1 de Google s'appuie sur les capacités introduites avec Veo plus tôt cette année, qui a marqué un bond significatif dans la qualité vidéo IA après Veo 2. Le nouveau modèle met l'accent sur une meilleure adhésion aux prompts, menant à des sorties vidéo plus précises et à une réduction du gaspillage computationnel. Les fonctionnalités audio, un aspect clé de la sortie précédente Veo 3, ont été affinées davantage pour une meilleure intégration.
Précédemment limité aux vidéos landscape 720p, Veo 3.1 génère désormais des formats landscape et portrait 16:9, s'alignant sur la montée du contenu vertical en ligne. Ce développement soutient l'engagement antérieur de Google d'intégrer les outils Veo dans YouTube Shorts, qui privilégient les vidéos verticales similaires à TikTok. En conséquence, les vidéos générées par IA devraient apparaître plus fréquemment sur de telles plateformes.
Le modèle est déployé à travers les outils IA de Google : les utilisateurs peuvent accéder à Veo 3.1 et à sa variante 'Rapide' via l'application Gemini, tandis que les développeurs y accèdent via Vertex AI et l'API Gemini. L'option 'Rapide' aide à gérer les coûts par token, offrant potentiellement plus de générations pour les utilisateurs de l'application Gemini.
Dans l'outil de réalisation Flow, Veo alimente de nouvelles fonctionnalités comme Ingredients to Video, Frames to Video et Extend, désormais compatibles avec l'audio généré. Les utilisateurs peuvent télécharger des images comme références ou points finaux tout en ajoutant un son personnalisé. Des innovations supplémentaires incluent des éditions de précision : reproduire l'apparence d'une vidéo pour ajouter des objets sans altérer le reste de la scène, disponible immédiatement dans Flow et l'API. La suppression d'objets suit une approche similaire mais sera lancée dans Flow sous peu.
Cette mise à jour positionne Google de manière compétitive face à des rivaux comme OpenAI, qui a récemment lancé une application iPhone pour son IA vidéo Sora. Le déploiement commence aujourd'hui, incitant à la prudence lors de la visualisation de vidéos en ligne au milieu de l'augmentation du réalisme IA.