En deux jours, ByteDance et Alibaba ont lancé chacun un nouveau modèle de génération d'images par IA pour concurrencer Nano Banana Pro de Google — moins cher, plus rapide, et taillé pour les caractères chinois. La riposte de Pékin au monopole de Mountain View ne s'est jamais aussi peu cachée.

« Imaginez Nano Banana Pro, mais beaucoup moins cher ». C'est la petite phrase que ByteDance a posté sur le compte X de CapCut et qui annonce que Seedream 5.0, le nouveau modèle d'images du groupe, est disponible en bêta sur Jimeng en Chine et sur CapCut à l'international.
Quelques heures plus tard, Alibaba Cloud annonçait Qwen-Image-2.0, son propre générateur intégrant création et édition dans un seul système, avec une résolution native de 2 048 × 2 048 pixels et une prise en charge des requêtes allant jusqu'à 1 000 tokens. Deux réponses chinoises au même outil américain, publiées le même jour. Ce n'est pas un hasard.
Nano Banana Pro de Google, construit sur le moteur Gemini 3 Pro, est la référence du marché depuis son lancement. Il propose une édition avancée, un rendu multilingue et une sortie jusqu'en 4K. Pourtant, Seedream 5.0 lui oppose des sorties en 2K et 4K, une édition sélective des zones d'une image sans tout régénérer, et une compréhension des instructions complexes que ByteDance attribue à ses capacités de raisonnement renforcées. Lors d'un test du South China Morning Post, le modèle a généré une maison enneigée de nuit, puis modifié à la demande la lampe extérieure et la lumière intérieure, sans toucher au reste du visuel.
Deux outils, une même ambition : fixer les standards de l'IA créative
Qwen-Image-2.0 met en avant des performances supérieures à Nano Banana Pro sur un point précis : le rendu des caractères chinois et de la calligraphie complexe. Ce n'est pas un détail technique, c'est une déclaration d'intention. Les modèles américains, entraînés en majorité sur des corpus occidentaux, traitent les langues et les écritures non-latines comme des cas secondaires. Alibaba les met au centre.
Avec un tel choix, c'est bel et bien les créateurs, les studios et les graphistes qui produisent pour des marchés non anglophones que ByteDance et Alibaba veulent séduire — là où la demande en images professionnelles générées par IA monte vite. Seedream 5.0 est accessible directement via CapCut, une application déjà utilisée par des centaines de millions de créateurs dans le monde. Ce n'est pas un outil pour développeurs : c'est un produit grand public, distribuable massivement, capable de faire pièce à l'offre de Google sans passer par ses ecosystèmes.
La possibilité de retoucher une zone d'une illustration sans tout régénérer transforme les méthodes de travail en storyboard, en design graphique ou en production publicitaire. Ce qui prenait plusieurs allers-retours entre un graphiste et un brief client peut désormais être ajusté en quelques secondes, par le client lui-même, depuis son téléphone. Seedance 2.0, le modèle vidéo de ByteDance présenté quelques jours plus tôt, pousse la même logique : des vidéos réalistes au point que la frontière avec le tournage réel devient floue, selon les analystes du secteur.

Le vrai terrain de jeu : l'influence sur la création numérique mondiale
Mais ne nous y trompons pas, cette course à qui aura les plus grosses fonctionnalités est aussi un prétexte pour chaque groupe de pousser son modèle comme infrastructure de référence pour les créateurs, car celui qui fixe les habitudes de production visuelle fixe aussi les normes esthétiques et les flux de dépendance technologique.
Google distribue Nano Banana via l'écosystème Gemini et ses outils cloud ; ByteDance le fait via CapCut, déjà omniprésente dans les marchés émergents d'Asie du Sud-Est, d'Afrique et d'Amérique latine. Ce sont deux visions opposées de qui doit contrôler la chaîne de création numérique mondiale.
Il y a aussi la question du coût. Si Seedream 5.0 tient sa promesse d'être significativement moins cher que Nano Banana Pro, les studios indépendants et les freelances des marchés à faibles revenus ne vont pas hésiter longtemps.
Alibaba, de son côté, avait capté un avantage structurel avec Qwen, sa famille de modèles ouverts : des millions de développeurs en Asie ont construit leurs applications dessus. Qwen-Image-2.0 arrive dans cet écosystème existant, ce qui réduit à presque rien le coût d'adoption pour les entreprises chinoises ou les startups régionales. Pendant ce temps, Google continue de construire autour de Gemini — un modèle puissant, mais dont l'accès plein reste concentré sur les marchés occidentaux.
Source : GizmoChina