Apple présente une IA pour modifier des images à l'aide de simples phrases

08 février 2024 à 18h42
0
Le constructeur montre les muscles en matière d'intelligence artificielle © Tada Images / Shutterstock
Le constructeur montre les muscles en matière d'intelligence artificielle © Tada Images / Shutterstock

Apple vient de dévoiler ses derniers travaux en matière d'intelligence artificielle avec ce nouveau modèle de langage, qui permet de modifier des images existantes en décrivant les changements par de simples bouts de phrase.

Apple est à la traine sur le sujet de l'intelligence artificielle. Alors que Microsoft n'en finit plus d'intégrer ChatGPT et les technologies d'OpenAI à l'ensemble de ses logiciels, et que Google multiplie les annonces autour de son dernier modèle de langage Gemini, le constructeur californien semble regarder le train passer et n'a fait jusqu'alors aucune annonce fracassante. Pourtant, les équipes d'Apple seraient sur le pied de guerre pour proposer leurs propres outils et services assistés par intelligence artificielle. La preuve encore aujourd'hui avec ce nouveau projet issu des laboratoires de Cupertino.

Un éditeur d'images qui se pilote à l'écrit

MGIE (pour MLLM-Guided Image Editing) est un modèle de langage spécialisé dans le traitement de l'image, et plus précisément des modifications d'image. L'idée derrière ce projet est de pouvoir appliquer des changements à une image fixe sans en passer par un logiciel de retouche, mais tout simplement en expliquant les modifications à l'écrit.

Ainsi, il serait possible de taper « Augmentes la luminosité de l'image » ou « Remplaces la couleur du ciel en rouge » pour que le logiciel comprenne l'indication donnée, et n'opère les modifications directement, sans aucune intervention humaine.

MGIE peut appliquer des modifications générales sur une image, ou entrer plus dans le détail avec une compréhension des éléments qui la composent. Dans l'exemple donné par Apple sur GitHub, où a été posté le projet, on peut par exemple voir que le modèle comprend ce qu'est un sapin de Noël, le repère sur l'image et le supprime après demande dans la boite de dialogue.

Modèle de langage MGIE © Apple
Modèle de langage MGIE © Apple

Apple semble vouloir accélérer sur l'IA en 2024

Le modèle MGIE va plus loin dans les ajouts proposés et peut enrichir des images avec quelques éléments de contexte. Dans un autre exemple illustré par les équipes d'Apple, on peut voir la photo d'une pizza tout ce qu'il y a de plus traditionnelle. En demandant à l'outil de rendre la pizza plus saine, l'intelligence artificielle viendra ajouter des légumes à cette pizza.

MGIE peut enfin opérer des modifications plus simples, comme un redimensionnement, un agrandissement ou un zoom dans l'image, ainsi qu'une rotation.

Si vous êtes intéressés à tester cette nouvelle technologie, Apple propose une version de démonstration sur le web et disponible à cette adresse. Il est possible à l'avenir que quelques-uns de ses outils fassent leur apparition dans les systèmes d'exploitation de la marque, comme macOS ou iOS, via l'application Photos.

On sait aussi que 2024 devrait être l'année de l'intelligence artificielle pour Apple, avec un iOS 18 annoncé comme une mise à jour historique. Siri ou encore l'application Messages pourrait recevoir des améliorations liées à l'IA et permettraient à Apple de rattraper en partie son retard sur ses concurrents.

L'émergence de l'intelligence artificielle comme outil grand public a ouvert de nombreuses possibilités pour tous les producteurs de contenus. Texte, image, son… Cette nouvelle technologie à la mode peut maintenant apporter son assistance dans de très nombreux domaines, et faciliter le travail dans les étapes les plus ingrates de la création. Et avec une offre qui ne cesse de s'accroître, il est important de distinguer quels outils apportent une véritable valeur ajoutée. Histoire de ne pas perdre des heures à essayer tout ce que proposent les pages de résultats de Google !
Lire la suite

Source : Engadget

Mathieu Grumiaux

Grand maître des aspirateurs robots et de la domotique qui vit dans une "maison du futur". J'aime aussi parler films et séries sur les internets. Éternel padawan, curieux de tout ce qui concerne les n...

Lire d'autres articles

Grand maître des aspirateurs robots et de la domotique qui vit dans une "maison du futur". J'aime aussi parler films et séries sur les internets. Éternel padawan, curieux de tout ce qui concerne les nouvelles technologies.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires

Haut de page

Sur le même sujet