OpenAI vient de lancer ChatGPT Images 2.0, son nouveau modèle de génération d'images IA disponible depuis mardi pour tous les utilisateurs de ChatGPT et Codex. Avec ses fonctionnalités, il donne l'impression d'avoir un outil professionnel en bout de clic.

OpenAI a officiellement lancé le mardi 21 avril lancé ChatGPT Images 2.0. Il s'agit, comme son nom l'indique, du nouveau modèle de génération d'images par intelligence artificielle, qui succède à ChatGPT Images et promet une précision inédite dans le suivi des instructions, outre un rendu multilingue amélioré et une flexibilité de formats élargie. Le modèle sous-jacent, gpt-image-2, est également accessible aux développeurs via l'API. Qu'on se le dise, le géant californien visait la qualité professionnelle dans la génération d'images, il vient de l'atteindre.
Des images plus précises, plus fines, et enfin à la hauteur des pros, ChatGPT Images 2.0 est bluffant
La grande faiblesse des générateurs d'images jusqu'ici, c'était peut-êtrel leur tendance à interpréter les consignes avec une liberté artistique... non sollicitée. ChatGPT Images 2.0 ne met pas fin à tout ça, mais il colle plus que jamais à vos consignes, vos prompts. Le modèle traite désormais les petits textes, les éléments d'interface et les compositions complexes avec une rigueur nouvelle, et une réflexion qui, après quelques essais, nous laisse bouche bée. OpenAI promet qu'on obtient ce qu'on a demandé, et on s'en rapproche franchement.
Le modèle est ô combien intéressant, en ce qu'il gère aussi des formats bien plus variés, de 3:1 à 1:3, ce qui ouvre directement la voie aux bannières web, aux diaporamas, aux affiches ou aux visuels pour mobile. Une fois votre image générée, vous n'êtes plus obligé de la recadrer vous-même, puisque l'image sort dans les bonnes proportions. Un gain de temps certain pour quiconque produit des visuels régulièrement.

ChatGPT Images 2.0 fait aussi un bond en avant sur le plan stylistique. Que l'on cherche une photo réaliste, une scène façon cinéma, une planche de manga ou du pixel art, le rendu est plus cohérent, plus maîtrisé, et nettement moins reconnaissable comme une production d'IA. Bonus appréciable pour ceux qui ont besoin de travailler à l'international : le modèle gère désormais bien mieux les langues non latines, avec des progrès sensibles sur le japonais, le coréen, le chinois, le hindi et le bengali.
Sur les quelques petits tests rapides que nous avons pu faire, je voulais vous partager celui obtenu à partir d'une toute petite requête. « À partir du site Clubic, je voudrais que tu me crées un visuel qui ferait office de carte de visite du site, qu'on pourrait imprimer en flyer et distribuer dans la rue », ai-je demandé à ChatGPT. Et voici le résultat :
Quand l'IA réfléchit avant de dessiner, le mode Thinking pense aux détails que vous pourriez oublier
La vraie nouveauté de cette version, c'est le mode Thinking (réflexion) réservé aux abonnés Plus, Pro, Business et Enterprise. Concrètement, au lieu de générer une image au débotté, le modèle prend le temps de comprendre la demande, consulte le web si nécessaire, puis peut produire jusqu'à huit visuels en une seule fois, en veillant à ce que les personnages et les objets restent cohérents d'une image à l'autre. Si vous voulez réaliser un storyboard, une série d'affiches, ou une campagne multi-formats, l'outil est imparable.
Ici, nous avons refait notre test, avec la même requête qu'auparavant, mais en passant du mode « Instant » de ChatGPT au mode « Thinking ». Et cette fois, il pense à ajuster les couleurs de fond, à ajouter de petits détails comme le logo dans le QR code, la caution expert du média, et même un pied de page.
Les développeurs n'ont pas été oubliés par OpenAI, qui met à leur disposition le modèle gpt-image-2 via son API, ce qui permet de l'intégrer directement dans une application ou un service existant. Dans Codex, l'environnement de développement d'OpenAI, il devient même possible de générer des interfaces, des prototypes ou des visuels de présentation sans jongler entre plusieurs outils. Canva, Figma et Adobe ont d'ailleurs déjà adopté le modèle dans leurs propres workflows de production.
On note qu'OpenAI joue la transparence et liste lui-même les limites de son modèle. ChatGPT Images 2.0 accroche encore sur certains exercices de précision, comme un guide d'origami, un Rubik's Cube ou des textures très répétitives comme du sable, qui peuvent donner des résultats décevants. Les légendes et les schémas techniques méritent aussi une relecture avant usage. Bref, l'outil est disponible pour tous les utilisateurs de ChatGPT et Codex, et il est puissant, mais un regard humain reste indispensable. Jusqu'à quand ?
- Chat dans différentes langues, dont le français
- Générer, traduire et obtenir un résumé de texte
- Générer, optimiser et corriger du code