DALL.E 2 : entre Dalí et WALL.E, une IA capable de créer des images à partir d'un texte aléatoire

11 avril 2022 à 16h56
5

L'entreprise de recherche en intelligence artificielle OpenAI a présenté la nouvelle version de son générateur d'images via des mots clés : DALL.E 2. Un générateur plus précis et plus compréhensif qui permet de créer d'infinies combinaisons d'images artistiques en haute résolution grâce à la puissance de son outil d'IA.

DALL.E 2 est cependant pour le moment réservé à des groupes de chercheurs le temps que l'IA soit correctement développée et que les risques de mauvaise utilisation soient écartés.

Un texte, une image unique

Dans le champ dédié, marquez « Un astronaute se prélasse dans un hôtel tropical dans l'espace dans un style pixel art » et hop ! Vous obtenez une image avec précisément tout ce que vous avez écrit. Pas fan du résultat final ? Changez « pixel art » par « Van Gogh » ou « astronaute » par « un chien » et l'image apparaît modifiée avec le nouveau résultat. C'est ce que propose donc DALL.E 2, de l'entreprise OpenAI.

DALL.E 2
© OpenAI

Lancé en janvier 2021, l'outil DALL.E (un mélange de Salvador Dalí pour le côté artistique et de WALL-E le petit robot pour le côté technologique) permettait déjà de faire peu ou prou la même chose mais, un an de développement plus tard, les chercheurs à l'origine du projet sont capables de sortir une version plus poussée et plus aboutie encore.

Grâce à cet outil encore non disponible pour le grand public, trois choses sont possibles :
créer des images à partir de mots clés ; créer des variations d'images déjà existantes (prenez la Joconde et proposez par exemple de l'affubler d'une coupe iroquoise) ou faire fusionner deux images ensemble.

L'intelligence artificielle au cœur

Concrètement comment ça marche ? Le site de l'outil l'explique assez bien. DALL.E 2 utilise un système neuronal entraîné avec des images et leur description. Le deep learning permet à l'outil de comprendre à quel mot appartient quelle image en analysant et en recoupant les modèles de milliers de photos associées à un mot donné. Par exemple, pour le mot « koala », l'outil aura auparavant exploré la base de données de millions de photos pour définir ce qu'est un koala.

Lors de la création de l'image, l'outil utilise un procédé dit de « diffusion ». En partant d'un modèle de points placés aléatoirement, il le modifie graduellement vers une image lorsqu'il reconnaît des aspects spécifiques de cette image. Évidemment, il y a des limites. Si un avion a dans sa description le mot « voiture », lorsqu'on veut créer une voiture cela pourra mettre l'image d'un avion puisque pour l'IA, une voiture est alors un avion.

DALL.E 2 est un projet de recherche et n'est donc pas disponible sur l'API. Un groupe sélectionné d'utilisateurs participe à la recherche et seulement des chercheurs de confiance peuvent s'inscrire pour participer. Des travaux sur la sécurité de l'outil sont menés afin de prévenir la génération d'images violentes, haineuses, politiques ou pornographiques. Interdiction également de créer des images en utilisant des photos de personnes réelles ou de personnalités.

Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
5
5
sandalfo
je pense à un éléphant rose qui fait du vélo avec une moustache. possible ?
DakJim
tu pensais à mon patron ?!<br /> … On a le même patron ?!!
DakJim
surtout dans le domaine artistique l’IA peut sortir n’importe quoi, bien malin celui qui trouveras le sens de la composition artistique… Surtout qu’il y en a pas !<br /> Car ce ne sera jamais plus qu’une suite de données statistiques, bien loin de toute poésie.
mcbenny
C’est toute la différence entre une oeuvre d’art, pensée et réalisée par un artiste comme pièce d’un univers, d’une oeuvre (au sens ensemble de la production de l’artiste), et une illustration, qui peut tout à fait être jolie, de qualité, etc. mais qui n’est qu’une « réalisation ».
_Troll
Une image d’un moderateur sautant sur sa chaise a la lecture d’un enorme troll vicieux sur le forum de Clubic.
Blackalf
Nous ne sautons pas sur nos chaises, nous nous contentons de cliquer sur un bouton.
Voir tous les messages sur le forum

Lectures liées

L'IA de Google peut maintenant créer une image à partir d'un texte
Le chiffrement de bout-en-bout débarque sur Messenger pour les casques VR Quest
Impression 3D : MakerBot et Ultimaker s’unissent
Epic Games fait équipe avec la NASA pour créer des expériences VR sur Mars
Le robot-chien Spot fait plus que danser dans cette nouvelle pub de Boston Dynamics
Reconnaissance faciale : un t-shirt moche pour s'effacer, voilà la solution !
Une vidéo nous montre comment opère Daisy, le robot recycleur d'Apple
Confinement : à Shanghai, les robots autonomes prennent le relais sur les livraisons
Pour la prochaine génération de télescopes spatiaux, pourquoi pas des miroirs... liquides ?
Tesla souhaite démarrer la production de son robot humanoïde Optimus dès 2023
Haut de page