Le géant de Redmond vient d'ajouter une nouvelle corde à l'arc de son moteur de recherche Bing. Désormais, vous pouvez générer de courtes vidéos à partir d'une simple description textuelle, grâce à l'implémentation du modèle Sora d'OpenAI.

 En intégrant Sora gratuitement à Bing, Microsoft souhaite démocratiser l'accès à une technologie d'IA de pointe à un plus large public. © FilipArtLab / Shutterstock
En intégrant Sora gratuitement à Bing, Microsoft souhaite démocratiser l'accès à une technologie d'IA de pointe à un plus large public. © FilipArtLab / Shutterstock

Depuis deux ans, Microsoft fait des pieds et des mains pour injecter toujours plus d’intelligence artificielle dans son moteur de recherche Bing. Après l'intégration de DALL-E lors de l'été 2023, c’est désormais la vidéo qui fait son entrée avec l’intégration de Sora, disponible en France depuis la fin de l'année 2024.

L’outil propulsé par le modèle text-to-video d'OpenAi, de son petit nom Bing Video Creator, est en cours de déploiement sur l’application mobile Bing, avec un déploiement sur bureau et Copilot prévu dans un second temps. En pratique, quelques lignes de texte suffisent pour générer des clips d’une poignée de secondes. Les vidéos restent encore assez limitées dans la durée, le résultat est déjà impressionnant sur le plan visuel : les scènes sont cohérentes sur le plan esthétique, les mouvements de caméra crédibles. La physique est relativement bien respectée (même si c'est encore clairement le gros point faible de Sora).

Sora : un modèle encore très jeune, mais déjà braqué par les projecteurs

Si Sora est disponible sur Bing c'est évidemment en raison du partenariat qui relie OpenAI et Microsoft, qui s'étendra jusqu'en 2030. Les premières démonstrations de Sora furent l'effet d'une bombe tant ce modèle était en avance sur tout ce que faisait la concurrence.

Bien sûr, tout n'est pas tout rose en coulisses et très rapidement, des questions sensibles sont remontées dans le débat public. YouTube, par la voix de son PDG (Neal Mohan), a averti OpenAI : interdiction formelle de venir piocher dans les milliers de vidéos de la plateforme pour entraîner son modèle.

Dans le même temps, une partie des artistes invités à tester Sora en avant-première a fini par jeter l’éponge à la fin de l'année 2024. Une vingtaine d’entre eux ont accusé OpenAI de les instrumentaliser pour servir avant tout sa communication, estimant qu’ils servaient plus de vitrine marketing que de véritables partenaires créatifs.

Les artistes conviés ont pointé des règles de validation jugées trop strictes, avec des contenus soigneusement filtrés en amont pour donner la meilleure image possible du modèle. Suite à cette fronde, OpenAI a rapidement suspendu leur accès : le risque créatif, concept fascinant, mais décidément trop imprévisible, n'avait visiblement pas été prévu dans le plan de communication.

 Avec un prompt bien travaillé, il est possible d'obtenir des résultats très convaincants. © Capture d'écran par Camille Coirault pour Clubic / Sora
Avec un prompt bien travaillé, il est possible d'obtenir des résultats très convaincants. © Capture d'écran par Camille Coirault pour Clubic / Sora

Sora, une pièce de plus sur l’échiquier face à Google

Il ne faut pas voir l'intégration de Sora dans Bing comme une démonstration technique, cela occulterait les vraies raisons de ce choix. En réalité, Microsoft cherche avant tout à poser toutes les briques IA qu'elle a à disposition sur le terrain du grand public. Cela dans le but de l'imposer dans les usages avant que Google ne s'y soit trop confortablement installée. Le prochain front de la bataille de l'intelligence artificielle étant celui de la vidéo, il est hors de question pour Microsoft d'y perdre encore du terrain.

Google avance déjà à grande vitesse sur ce dernier, et son propre modèle de génération de vidéo, Veo 3, est, sur de nombreux aspects techniques, largement supérieur à Sora. Génération audio native, plus haute définition, scènes plus longues, etc.

Sur le plan technologique pur, Google garde donc toujours une longueur d'avance. Toutefois, Microsoft veut certainement presser un autre levier pour ne pas se laisser distancer : saturer Bing et Copilot de fonctionnalités IA pour ancrer ces outils au cœur de son écosystème (quitte à flirter avec l'overdose), et de ce fait, dans les usages. Une tactique agressive de forcing qui, pour certains, est franchement agaçante, car perçue comme trop intrusive et excessive. L'arrivée de Sora dans Bing fait donc partie intégrante de ce « bombardement fonctionnel » : occuper l'espace, multiplier les briques IA (même si elles sont perfectibles) pour rendre son infrastructure incontournable face à la concurrence… qu'on le veuille ou non.

Source : Engadget