Sora 2, le nouveau modèle de génération vidéo et audio d’OpenAI, promet des créations réalistes et interactives. L’application enrichit le modèle avec des fonctions sociales et des caméos, mais les premiers retours montrent des limites techniques et des choix commerciaux centrés sur la viralité.

OpenAI a officiellement lancé Sora 2, son modèle phare capable de produire des vidéos réalistes avec sons et dialogues synchronisés. La plateforme permet aux utilisateurs de générer des séquences, de remixer des créations existantes et d’inclure leur image ou celle d’autres participants dans les vidéos grâce au caméo, une fonction qui insère un visage réel dans une scène créée par l’IA.
Selon l’équipe Sora, le modèle respecte mieux les lois de la physique et conserve l’état des objets dans les scènes complexes. Malgré ces avancées, Sora 2 produit encore des erreurs et ne simule pas entièrement la réalité. Parallèlement, OpenAI concentre ses efforts sur la viralité et la monétisation avec une interface inspirée de TikTok.
Les promesses techniques de Sora 2 sont ambitieuses mais partielles
Sora 2 peut générer des séquences complexes, allant de routines de gymnastique à des scènes avec plusieurs objets en mouvement. L’équipe affirme que le modèle « obéit mieux aux lois de la physique que les systèmes précédents » et qu’il représente « une avancée majeure en termes de maniabilité ». Les utilisateurs peuvent choisir des styles réalistes, cinématographiques ou animés et placer directement des éléments réels dans les vidéos. Le caméo permet de projeter l’apparence et la voix d’une personne dans n’importe quel environnement généré.
L’application fournit également des outils de contrôle pour ajuster le flux de contenu et garantir le bien-être des utilisateurs. Les créateurs peuvent limiter l’exposition des adolescents et révoquer l’accès à leur caméo. OpenAI met l’accent sur l’expérience sociale, avec la possibilité de remixer les vidéos des autres et de découvrir de nouvelles créations dans un fil personnalisé.
Pour l’équipe, Sora 2 signe « le début d’une toute nouvelle ère pour les expériences de co-création ». La plateforme mélange divertissement et immersion, mais elle ne simule pas encore parfaitement la réalité. Certaines erreurs apparaissent lorsque des objets interagissent de façon inattendue ou que les mouvements complexes ne sont pas reproduits fidèlement.
La réalité économique et sociale prend le dessus sur la vision scientifique
Depuis son lancement, Sora attire des utilisateurs avides de contenu viral. Les vidéos générées se propagent rapidement, parfois des millions de vues en quelques jours. Le format rappelle TikTok et maximise l’engagement et la diffusion. Nos confrères de L'ADN notent que « toute une économie est en train d’émerger autour du slop », un contenu IA médiocre mais viral, souvent produit à un rythme élevé par des créateurs dans différents pays.
OpenAI exploite le caméo pour intégrer les visages d’utilisateurs dans les vidéos, et créée un effet de deepfake photoréaliste. Selon un tiktokeur, il est « impossible de distinguer les vraies images du CEO d’OpenAI de celles générées sur la plateforme ». Et ça, c'est très problématique, car cette confusion s’étend à tous les utilisateurs et pose des questions sur la manipulation de l’image et l’authenticité du contenu.
Enfin, même si le coût de la génération vidéo reste élevé, OpenAI semble avoir les moyens. Comme on vous le disait sur Clubic, OpenAI continue d’afficher une croissance impressionnante. En juillet 2025, l'entreprise a atteint un chiffre d'affaires annualisé de 13 milliards de dollars, doublant ainsi ses revenus en seulement sept mois. Une performance que l'on doit, entre autre, aux 700 millions d'utilisateurs hebdomadaires actifs, contre 400 millions en février 2025. Pour soutenir cette dynamique, OpenAI prévoit des dépenses colossales, estimées à plus de 100 milliards de dollars d'ici à 2029.