🔴 French Days en direct 🔴 French Days en direct

DALL·E 3 vs Midjourney : le duel des intelligences artificielles génératives

15 février 2024 à 17h15
1
Image générée par DALL·E 3 © Pascale Duc pour Clubic
Image générée par DALL·E 3 © Pascale Duc pour Clubic

ChatGPT, DALL·E, MidjourneyBard, Stable Diffusion… On ne sait plus où donner de la tête entre les intelligences artificielles génératives qui inondent nos écrans. Parmi celles qui permettent de créer des visuels, les leaders sont sans conteste Midjourney et DALL·E 3. Les deux ont un fonctionnement similaire : il suffit d’écrire une instruction appelée « prompt » en langage naturel pour que des images soient produites.

Midjourney

  • Droits commerciaux inclus dans tous les forfaits payants
  • Pertinence dans la compréhension des prompts
  • Tarifs accessibles

DALL·E

  • Ergonomique et intuitif
  • Comprend le langage naturel
  • Comprend le français

Tarifs, ergonomie, fonctions avancées, rendu… Nous vous proposons un tour d’horizon des qualités et des défauts de chacune des deux IA, afin de déterminer laquelle gagne nos faveurs. Avec, en prime, un test de 5 prompts en conditions réelles. C’est parti pour notre dossier comparatif DALL·E 3 vs Midjourney !

DALL·E 3, en bref

Lancé le 5 janvier 2021, DALL·E est le pionnier en matière dintelligence artificielle génératrice d’images. Il a été développé par OpenAI, qui est également à l’origine du célèbre ChatGPT, intelligence artificielle conversationnelle. DALL·E 3 est la version actuellement disponible.

Il n’est pas nécessaire d’installer quoi que ce soit pour utiliser DALL·E 3, vous pouvez vous servir de n’importe quel navigateur pour vous connecter à votre compte OpenAI (obligatoire). Celui-ci donne accès à DALL·E 3, mais aussi à ChatGPT 4. Comme ce dernier, DALL·E 3 comprend le langage naturel. Il suffit, dans le champ de saisie, de décrire de façon détaillée l’image que l’on souhaite produire : sujet, environnement, luminosité, format, style… 

Jusqu’à l’automne 2023, DALL·E 3 créait quatre visuels pour un seul prompt. Désormais, il n’en génère que deux à la fois. Et si les serveurs sont saturés, il peut arriver exceptionnellement qu’il n’en propose qu’un. Lorsque la génération est terminée, vous pouvez voir les images en gros plan et les télécharger. Il est possible de les télécharger également (en résolution maximale) sans même les agrandir. Vous souhaitez une nouvelle génération d’images d’après le même prompt ? C’est faisable en un clic.

Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic

Midjourney, en bref

Midjourney est apparu bien après DALL·E 3, puisque sa version bêta est sortie en juillet 2022. Contrairement à DALL·E, Midjourney n’est pas disponible directement depuis un navigateur. Cette IA est en réalité un robot qui fonctionne sur un serveur Discord. Il faut donc, pour l’utiliser, avoir un compte Midjourney et un compte Discord. Il n’existe pas d’interface dédiée.

Midjourney comprend également le langage naturel, mais il est plus à l’aise avec des mots-clés qu’avec des phrases construites. Comme pour son concurrent, c’est dans le prompt que vous pouvez indiquer tout ce qui va composer l’image. Pour que Midjourney sache que vous lui demandez la génération d’une image, le prompt doit impérativement commencer par l’invite /imagine. 

L’IA génère alors 4 images. Si vous souhaitez en télécharger une en format supérieur, vous devez effectuer un « Upscale » en utilisant le bouton prévu à cet effet. Et comme pour DALL·E 3, vous pouvez demander une nouvelle génération de 4 images à partir du même prompt.

Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic

DALL·E 3 et Midjourney, le match

Le tarif : égalité

Comme toutes les intelligences artificielles génératrices d’images, DALL·E 3 et Midjourney ont finalement supprimé l’accès aux offres gratuites sans limitation de fonctionnalités. 

Cependant, il est possible d’utiliser le moteur de DALL·E 3 gratuitement avec Bing Chat et Bing Image Creator, à condition d’avoir un compte Microsoft. Toutes les fonctionnalités, particulièrement celles qui impliquent d’uploader vos propres fichiers, ne sont pas disponibles via cette interface, mais vous pouvez quand même profiter de la puissance de DALL·E 3 sans débourser un centime. Cet accès gratuit compense le fait que le tarif de l’abonnement à ChatGPT Plus, qui inclut DALL·E 3, soit à 20 dollars par mois, hors taxes, avec une limite de 40 images générées toutes les 4 heures. 

Tarifs DALL·E 3 © Pascale Duc pour Clubic
Tarifs DALL·E 3 © Pascale Duc pour Clubic

Midjourney n’a plus aucune offre gratuite, mais le tarif mensuel de l’abonnement de base est de 8 dollars par mois hors taxes (avec paiement annuel) ou 10 dollars par mois hors taxes (avec paiement mensuel). L’abonnement à Midjourney fonctionne sur un système de temps de génération. Avec un abonnement de base, vous avez droit à 3,3 heures mensuelles, soit environ 200 générations d’images. On apprécie la possibilité d’acheter du « temps » supplémentaire, à 4 dollars l’heure, à condition d’avoir une offre payante en cours.

Tarifs Midjourney © Pascale Duc pour Clubic
Tarifs Midjourney © Pascale Duc pour Clubic

L’ergonomie : avantage DALL·E 3

Pour se servir de Midjourney, il est impératif d’avoir un compte Midjourney et un compte Discord. Même si ce système de messagerie instantanée est plutôt intuitif, il impose une prise en main spécifique. Ensuite, l’utilisation du robot lui-même n’est pas complexe non plus, mais ici encore, elle demande un petit apprentissage pour savoir rédiger un prompt et, de façon facultative, recourir aux paramètres de l’IA. Avec DALL·E 3, rien de tout ça. Il est disponible directement depuis un navigateur. Rien à assimiler de particulier, il suffit d’écrire son instruction dans le champ de saisie, en langage naturel.

Autre avantage de DALL·E 3 : il comprend très bien le français. Il est possible d’utiliser le français dans Midjourney également, mais les résultats, surtout sur les prompts complexes, peuvent être décevants en comparaison de ceux obtenus avec l’anglais. Et comme DALL·E 3 « parle » un langage naturel, vous pouvez lui donner des directives pour modifier les images qu’il vient de générer, pas besoin de reprendre le prompt depuis le début. 

Bouquet de fleurs généré avec DALL·E 3 © Pascale Duc pour Clubic
Bouquet de fleurs généré avec DALL·E 3 © Pascale Duc pour Clubic
Bouquet de fleurs généré avec DALL·E 3 © Pascale Duc pour Clubic
Bouquet de fleurs généré avec DALL·E 3 © Pascale Duc pour Clubic

Enfin, lorsqu’une image vous convient parmi celles générées par Midjourney, vous devez passer par le mode « Upscale » pour pouvoir l’enregistrer en bonne résolution. Dans DALL·E 3, l’enregistrement peut se faire sans agrandissement préalable, directement depuis l’aperçu des visuels.

Les fonctions bonus : avantage Midjourney

On peut dire que DALL·E 3 a les défauts de ses qualités. Il est ergonomique et intuitif. Mais il passe de ce fait à côté de fonctionnalités avancées que l’on trouve chez Midjourney. Les paramètres, pour commencer, permettent de peaufiner un prompt (ratio, qualité…) ou d’enregistrer ses réglages favoris/récurrents. Avec les multiprompts, vous pouvez pondérer les éléments du prompt et accorder plus d’importance à l’un ou à l’autre. Les permutations, quant à elles, donnent la possibilité d’interchanger certaines parties du prompt pour générer autant d’images que de combinaisons possibles. Par exemple, pour la photo d’une voiture, vous pouvez générer autant de photos que les couleurs que vous avez préparamétrées pour sa carrosserie.

Midjourney et DALL·E 3 sont en revanche à égalité quant au fait d’uploader ses propres photos, pour en générer de nouvelles ou pour en extraire un prompt réutilisable.

Images avec des paramètres générées par Midjourney © Pascale Duc pour Clubic
Images avec des paramètres générées par Midjourney © Pascale Duc pour Clubic

Le rendu : avantage Midjourney

La résolution : avantage Midjourney

Par défaut, les images générées par Midjourney sont au format 1024 x 1024 pixels. C’est le cas également avec DALL·E 3. Mais avec Midjourney et l’outil « Upscale », vous pouvez atteindre 2048 x 2048 pixels (Upscale 2x), voire 4096 x 4096 pixels (Upscale 4x). DALL·E 3, quant à lui, permet de forcer la taille des images à 1024 x 1792 pixels ou 1792 x 1024 pixels, pas plus.

En revanche, les deux IA sont à égalité quant à la possibilité de jouer avec le ratio de l’image : 2:3, 3:2, 16:9…  

Image 16:9 générée avec DALL·E 3 © Pascale Duc pour Clubic
Image 16:9 générée avec DALL·E 3 © Pascale Duc pour Clubic
Image 16:9 générée avec Midjourney © Pascale Duc pour Clubic
Image 16:9 générée avec Midjourney © Pascale Duc pour Clubic

Le réalisme : avantage Midjourney

Les deux AI permettent, en maniant correctement les prompts adaptés, de produire des photos bluffantes parfois. Mais le point va ici définitivement à Midjourney. D’abord avec l’instruction « photo réaliste » qui, dans DALL·E 3, vous garantit un résultat tout sauf réaliste… C’est le prompt « photo naturelle et amateur » qui permet d’obtenir des photos un tant soit peu vraisemblables, mais souvent encore un peu « cireuses ». Avec un peu d’entraînement et en multipliant les générations, on peut arriver à un résultat potable, mais Midjourney l’atteint plus rapidement et de façon plus intuitive.

  • Une femme avec le crâne rasé qui porte des lunettes noires, un peu dodue, travaille sur son ordinateur portable. La photo est réaliste et extrêmement détaillée, elle pourrait gagner un prix. La lumière est artificielle.
  • a shaved hair lady with black glasses, a little chubby, working on her laptop, realistic photo, award-winning photo, artificial light, highly detailed
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic

Les faits : 5 prompts au banc d’essai

  • Une photo réaliste, à lumière du soleil, d’une chaise en bois marron dans un jardin fleuri
  • a brown wooden chair in a garden full of flowers, realistic photo, sunlight
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
  • Une femme blonde aux yeux bleus, assise près d’une fenêtre
  • a blond woman with blue eyes, sitting next to a window
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
  • a bouquet of red tulips in a transparent vase, oil painting
  • Une peinture à l’huile d’un bouquet de tulipes rouges dans un vase transparent
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
  • a coloring book page of a black and white turtle, cartoon style, bold lines
  • Une page de livre de coloriage représentant une tortue en noir et blanc, en style bande dessinée et avec des traits gras
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
  • a tree next to a huge rock, japanese ink art
  • Un dessin d’art japonais à l’encre, représentant un arbre à côté d’un énorme rocher
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec Midjourney © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic
Images générées avec DALL·E 3 © Pascale Duc pour Clubic

DALL·E 3 vs Midjourney, le verdict

Même si, au comptage des points, Midjourney remporte haut la main ce match, DALL·E 3 n’a pas à rougir de ses performances. Il est bien plus intuitif et ergonomique et, surtout, il est utilisable par les personnes non anglophones sans perte de qualité. Le fait qu’il soit disponible gratuitement, dans ses principales fonctionnalités, est également un atout de taille. Malgré tout, le rendu final, ainsi que les outils avancés de Midjourney en font un concurrent redoutable, capable de générer des images d’une qualité exceptionnelle, malgré le temps de prise en main et d’adaptation.

Midjourney
  • Droits commerciaux inclus dans tous les forfaits payants
  • Pertinence dans la compréhension des prompts
  • Tarifs accessibles

Midjourney s'impose comme un pionnier dans le domaine de la génération d'illustrations via l'intelligence artificielle. Accessible à tous, indépendamment du niveau de sensibilité artistique, l'utilisateur a simplement à saisir un prompt textuel décrivant l'image désirée. Midjourney utilise ensuite ses algorithmes d'intelligence artificielle pour analyser cette entrée textuelle et générer une image qui s'aligne sur les descriptions fournies. Ce mécanisme d'analyse et de génération d'art offre une expérience utilisateur riche, ouvrant les portes de la créativité à une large palette d'utilisateurs.

Midjourney s'impose comme un pionnier dans le domaine de la génération d'illustrations via l'intelligence artificielle. Accessible à tous, indépendamment du niveau de sensibilité artistique, l'utilisateur a simplement à saisir un prompt textuel décrivant l'image désirée. Midjourney utilise ensuite ses algorithmes d'intelligence artificielle pour analyser cette entrée textuelle et générer une image qui s'aligne sur les descriptions fournies. Ce mécanisme d'analyse et de génération d'art offre une expérience utilisateur riche, ouvrant les portes de la créativité à une large palette d'utilisateurs.

DALL·E
  • Ergonomique et intuitif
  • Comprend le langage naturel
  • Comprend le français

DALL·E fait de vous un artiste en quelques clics. L'outil d'OpenAI permet de créer des images facilement grâce à l'intelligence artificielle générative. Et le tout en français !

DALL·E fait de vous un artiste en quelques clics. L'outil d'OpenAI permet de créer des images facilement grâce à l'intelligence artificielle générative. Et le tout en français !

Pascale Duc

Née avant le Web, je n’ai jamais arrêté de monter, démonter, remonter, pour mieux installer, désinstaller et réinstaller…  Les smartphones et objets connectés sont arrivés comme des cerises sur mon gâ...

Lire d'autres articles

Née avant le Web, je n’ai jamais arrêté de monter, démonter, remonter, pour mieux installer, désinstaller et réinstaller…  Les smartphones et objets connectés sont arrivés comme des cerises sur mon gâteau numérique, que je partage de bon cœur !

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news
Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires (1)

Squeak
Ces IA comme DALL-E ou Midjourney ont l’avantage d’avoir une visibilité pour le grand public, ce qui est indéniablement un plus. Par contre, Stable Diffusion permet selon moi d’aller plus loin dans la génération d’images avec une multitude d’outils, de modèles et plugins. Une fois installé localement (certes, il est nécessaire d’avoir une certaine configuration notamment au niveau de la carte graphique), cela devient vraiment un outil très pointu.<br /> Par exemple :<br /> Pouvoir générer des images d’une plus grande résolution, notamment aussi avec de l’upscaling basé lui-même sur l’IA.<br /> Utiliser des photos ou dessins pour guider la génération (ControlNet), cela donne des possibilités créatives immenses.<br /> Possibilité d’ajouter des objets, d’en supprimer, etc (fonction InPaint)<br /> Le tout dans un logiciel open source, gratuit, avec une interface Web locale très bien réalisée.<br /> Il existe pas mal de tutos sympa pour l’installer et l’exploiter au maximum et une grande communauté sur Reddit par exemple.
davidly
Merci pour le tuyau ! Qu’entends-tu par GPU costaud ? J’ai toujours une Vega 56 et apparemment on peut générer une image en 3 minutes. Aucune idée des paramètres, j’ai vu ça vite fait sur YouTube. Ça me semble raisonnable, si le modèle vise juste et qu’on passe pas son temps à peaufiner.<br /> Sinon, le gros souci avec DALL-E c’est la perte de cohérence. On lui demande de retoucher un point mineur, et il fait une interprétation totalement erronée, ou alors c’est moi qui l’utilise mal, mais des fois je passe à côté d’images superbes…
Squeak
J’ai une RTX 3050 (4 Go de VRAM) sur un PC portable avec 16 Go de RAM. Et je peux générer une image en 1920x1080 en 3 à 4 minutes en utilisant la résolution de base de 960x540 et un upscale X2 pour avoir la pleine résolution, avec le plugin Tiled VAE pour économiser un peu de VRAM. Et avec cette configuration, j’ai du adapter les paramètres de configuration de Stable Diffusion avec<br /> set COMMANDLINE_ARGS=--xformers --lowvram<br /> Il faut parfois un peu essayer différents paramètres et expérimenter.<br /> Capture Stable Diffusion1920×1080 320 KB
davidly
Merci beaucoup, je vais tester avec des paramètres similaires !
Voir tous les messages sur le forum
Haut de page

Les derniers tutoriels

Tous les tutoriels