DALL.E 2 : entre Dalí et WALL.E, une IA capable de créer des images à partir d'un texte aléatoire

Publié le 11 avril 2022 à 16h56

L'entreprise de recherche en intelligence artificielle OpenAI a présenté la nouvelle version de son générateur d'images via des mots clés : DALL.E 2. Un générateur plus précis et plus compréhensif qui permet de créer d'infinies combinaisons d'images artistiques en haute résolution grâce à la puissance de son outil d'IA.

DALL.E 2 est cependant pour le moment réservé à des groupes de chercheurs le temps que l'IA soit correctement développée et que les risques de mauvaise utilisation soient écartés.

Un texte, une image unique

Dans le champ dédié, marquez « Un astronaute se prélasse dans un hôtel tropical dans l'espace dans un style pixel art » et hop ! Vous obtenez une image avec précisément tout ce que vous avez écrit. Pas fan du résultat final ? Changez « pixel art » par « Van Gogh » ou « astronaute » par « un chien » et l'image apparaît modifiée avec le nouveau résultat. C'est ce que propose donc DALL.E 2, de l'entreprise OpenAI.

Lancé en janvier 2021, l'outil DALL.E (un mélange de Salvador Dalí pour le côté artistique et de WALL-E le petit robot pour le côté technologique) permettait déjà de faire peu ou prou la même chose mais, un an de développement plus tard, les chercheurs à l'origine du projet sont capables de sortir une version plus poussée et plus aboutie encore.

Grâce à cet outil encore non disponible pour le grand public, trois choses sont possibles : créer des images à partir de mots clés ; créer des variations d'images déjà existantes (prenez la Joconde et proposez par exemple de l'affubler d'une coupe iroquoise) ou faire fusionner deux images ensemble.

L'intelligence artificielle au cœur

Concrètement comment ça marche ? Le site de l'outil l'explique assez bien. DALL.E 2 utilise un système neuronal entraîné avec des images et leur description. Le deep learning permet à l'outil de comprendre à quel mot appartient quelle image en analysant et en recoupant les modèles de milliers de photos associées à un mot donné. Par exemple, pour le mot « koala », l'outil aura auparavant exploré la base de données de millions de photos pour définir ce qu'est un koala.

Lors de la création de l'image, l'outil utilise un procédé dit de « diffusion ». En partant d'un modèle de points placés aléatoirement, il le modifie graduellement vers une image lorsqu'il reconnaît des aspects spécifiques de cette image. Évidemment, il y a des limites. Si un avion a dans sa description le mot « voiture », lorsqu'on veut créer une voiture cela pourra mettre l'image d'un avion puisque pour l'IA, une voiture est alors un avion.

DALL.E 2 est un projet de recherche et n'est donc pas disponible sur l'API. Un groupe sélectionné d'utilisateurs participe à la recherche et seulement des chercheurs de confiance peuvent s'inscrire pour participer. Des travaux sur la sécurité de l'outil sont menés afin de prévenir la génération d'images violentes, haineuses, politiques ou pornographiques. Interdiction également de créer des images en utilisant des photos de personnes réelles ou de personnalités.

Source : Smithsonian Magazine

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (6)

sandalfo

je pense à un éléphant rose qui fait du vélo avec une moustache. possible ?

DakJim

tu pensais à mon patron ?!
… On a le même patron ?!!

DakJim

surtout dans le domaine artistique l’IA peut sortir n’importe quoi, bien malin celui qui trouveras le sens de la composition artistique… Surtout qu’il y en a pas !
Car ce ne sera jamais plus qu’une suite de données statistiques, bien loin de toute poésie.

mcbenny

C’est toute la différence entre une oeuvre d’art, pensée et réalisée par un artiste comme pièce d’un univers, d’une oeuvre (au sens ensemble de la production de l’artiste), et une illustration, qui peut tout à fait être jolie, de qualité, etc. mais qui n’est qu’une « réalisation ».

_Troll

Une image d’un moderateur sautant sur sa chaise a la lecture d’un enorme troll vicieux sur le forum de Clubic.

Blackalf

Nous ne sautons pas sur nos chaises, nous nous contentons de cliquer sur un bouton.