Le modèle d’intelligence artificielle de Google, Veo, franchit une nouvelle étape avec sa mise à jour 3.1, avec une meilleure compréhension des requêtes.
La guerre entre OpenAI et Google reprend de plus belle. Les deux géants de l'intelligence artificielle ne cessent de se marquer à la culotte, et annoncent en permanence des nouveautés et fonctions pour bien montrer que leurs modèles sont bien meilleurs que le concurrent. Aujourd'hui c'est Google qui prend la parole pour annoncer le lancement de Veo 3.1, son modèle de création de vidéos par IA. Une présentation qui n'a probablement rien d'un hasard, OpenAI ayant dévoilé Sora 2 il y a quelques jours à peine. La version Veo 3.1, disponible dès aujourd’hui via l’API Gemini et intégrée dans l’éditeur vidéo Flow, vise à rendre la production de contenus visuels plus précise, fluide et cohérente, et voici comment.
Un modèle plus affuté qui peut créer un clip complet à partir d'une simple image
Avec cette mise à jour, Google promet une meilleure “prompt adherence”, autrement dit une capacité accrue à suivre fidèlement les instructions fournies par l’utilisateur. Le modèle s’appuie désormais sur des images “ingrédients” ajoutées au texte pour affiner les résultats et produire des séquences plus proches de l’intention initiale.
Grande nouveauté : Veo 3.1 peut générer de la vidéo et de l’audio simultanément à partir d'images fixes, ce qui n’était pas possible sur la version précédente. L’outil devient ainsi capable de créer des clips complets, avec ambiance sonore et effets intégrés, directement à partir d’une image ou d’un prompt textuel.
Dans Flow, l’application d’édition vidéo de Google, cette évolution se traduit par l’apparition d’une fonction baptisée « Frame to Video ». Elle permet de télécharger une première et une dernière image, puis de laisser l’IA générer automatiquement la séquence intermédiaire. L’éditeur peut en outre ajouter du son, prolonger des scènes ou insérer des objets dans des vidéos déjà existantes.
Google ne vise pas la perfection, mais la simplicité pour viser les entreprises et les créateurs de contenus
Veo 3.1 n’atteint pas encore le réalisme des modèles concurrents comme Sora 2 d’OpenAI. Les démonstrations diffusées par Google montrent ainsi quelques artefacts visuels et des rendus parfois étranges selon les requêtes. Mais la progression est notable : l’IA parvient désormais à mieux gérer la cohérence entre les plans et la fluidité des mouvements.
Google semble vouloir réorienter son usage. Plutôt que de viser la viralité sur les réseaux sociaux, la société californienne entend faire de Veo un outil de production professionnelle, destiné aux réalisateurs, monteurs et créateurs de contenus.
Avec Veo 3.1, Google mise donc moins sur la démonstration technologique que sur l’intégration concrète de l’IA dans la chaîne créative. Une stratégie qui vise notamment les petites entreprises, qui pourraient utiliser ces outils pour concevoir des vidéos à moindre coût.
Source : Engadget