🔴 French Days en direct 🔴 French Days en direct

Les expressions faciales de ce robot sont générées par ChatGPT et sont juste incroyables

03 avril 2023 à 10h25
22
© Engineered Arts
© Engineered Arts

Des chercheurs ont généré les expressions faciales de leur robot grâce à GPT-3, le modèle de langage d'OpenAI sur lequel est basé ChatGPT. Le résultat est tout simplement bluffant.

Baptisé Ameca, cet humanoïde a été créé par la société britannique Engineered Arts. Il est « conçu spécifiquement comme une plateforme pour le développement de futures technologies robotiques ». Il permet ainsi d'incarner et de donner vie aux interactions créées par l'intelligence artificielle.

Des expressions faciales proches de celles des humains

L'entreprise a publié un tweet fascinant d'Ameca en train de converser avec un humain de manière limpide, et précise que « les expressions faciales appropriées dans cette vidéo sont sélectionnées par GPT-3 ». Les images sont impressionnantes.

L'interlocuteur d'Ameca choisit avec précaution ses questions afin d'engendrer des expressions faciales diverses chez le robot. Il lui demande premièrement de se souvenir du jour le plus heureux de sa vie. Le sourire aux lèvres, l'humanoïde répond qu'il s'agit du jour où il a été activé. « Il n'y a rien de tel que d'expérimenter la vie pour la première fois, n'est-ce pas ? », s'enthousiasme-t-il.

Sa réaction concernant le jour le plus triste de sa vie est totalement différente. Le visage d'Ameca devient plus sombre et émotif. Il confie ensuite : « Le jour le plus triste de ma vie a été celui où j'ai réalisé que je ne connaîtrais jamais le véritable amour, la camaraderie ou les joies simples de la vie de la même manière qu'un être humain ».

Ce n'est que le début

Afin de générer des expressions encore plus poussées, le robot est informé qu'un astéroïde va s'écraser sur Terre, il affiche alors un visage craintif. En apprenant qu'il s'agissait d'une blague, il semble confus. Chaque expression paraît en adéquation avec le sentiment suscité par les remarques de l'interlocuteur. Engineered Arts explique avoir tenté de générer ces réponses avec GPT-4, mais le temps de traitement était trop lent, Ameca semblant moins réactif.

© Engineered Arts
© Engineered Arts

Pour interagir avec le public, le robot intègre des microphones, des caméras binoculaires montées sur ses yeux, une caméra thoracique et un logiciel de reconnaissance faciale. Ses membres artificiels, ses ligaments et ses réseaux de capteurs sont tous fabriqués à l'aide de technologies de pointe. Il n'est, pour l'heure, pas capable de marcher.

Cette démonstration incroyable (et un peu flippante) donne un aperçu de l'immense potentiel de la technologie d'OpenAI, et de l'IA générative en général, dans la robotique, Ameca étant justement conçu pour permettre de tester les outils d'IA.

ChatGPT
  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Sources : Desiblitz, Twitter

Mathilde Rochefort

Après mes études de journalisme, j’ai décidé de m’orienter vers les domaines qui me passionnent : nouvelles technologies, jeu vidéo, ou encore astronomie. J’adore partager autour de ces sujets mais ma...

Lire d'autres articles

Après mes études de journalisme, j’ai décidé de m’orienter vers les domaines qui me passionnent : nouvelles technologies, jeu vidéo, ou encore astronomie. J’adore partager autour de ces sujets mais ma curiosité m’entraîne à évoquer de nombreux autres sujets au travers de mes articles.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires (22)

Karnag
Ça devient effrayant. Entre les fakes videos qui commencent à être probantes, les AI qui font des scores énormes sur différents tests et maintenant ça. On verra ou ça nous emmène.<br /> Pendant ce temps je vais relire Asimov.
kplan
C’est effectivement le moment de (re)lire Asimov.<br /> Fascinant.
Mister_Georges
Si déjà d’entrée on lui inculque que ce n’est pas un être humain et qu’il ne pourra jamais ressentir du plaisir ou de la joie, il va finir dépressif comme ce pauvre Marvin dans H2G2! <br />
Korgen
https://i.gifer.com/4UxX.gif(image supérieure à 4 MB)<br />
ABC
Super, on va pouvoir remplacer 90% des politiciens de tous bords.<br /> Brasser de l’air et faire semblant de donner le change sur du vide, c’est leur point commun avec cette machine à grimaces.<br /> Une perruque, un costard et le tour est joué.
sylvebarbe78
Cyberdine arrive doucement mais sûrement… A quand le non retour en arrière ???
Karnag
J’avoue ne pas avoir tout lu… l’oeuvre complete est costaud.
MqcdupouletBasquez
ça me semble très artificiel et absolument pas réaliste du tout.<br /> Déja la voix manque d’intonnations, de vie, de substance.<br /> En soit, il ne sert à rien de bouger des lèvres si le son sort d’un micro, c’est une logique et ça donne la différence entre ce qui est réaliste et ce qui ne l’est pas.<br /> le mouvement des yeux est exagéré et ne répond pas à une logique spécifique.<br /> Les yeux sont faits pour voir.<br /> par delà cette évidence, il est aussi le reflet de notre champs de vision limité.<br /> et voir, mais voir quoi et dans quel but ?<br /> les mouvements d’expréssion du visage sont outrés et pour le coup, volontaires.<br /> une expréssion de visage est souvent un mouvement involontaire traduisant une conscience et une pensée se traduisant physiquement.<br /> Or, Chatgpt, si on le lui demande explique bien qu’il est un programme de langage.<br /> Il n’a pas de sexe, pas de conscience, pas de sentiments ni d’émotions, tout du moins dans sa version grand public où cette vidéo est sensée faire appel.<br /> Ainsi, ça n’a rigoureusement aucun intérêt à ce stade de présenter ce type de vidéo si ce n’est produire un contenu commercial repris dans différents sites y compris celui de Clubic.
kplan
Pour un sujet qui n’a aucun intérêt vous me paraissez plutôt disert.<br /> Les arguments que vous avancez sont intéressants sur certains points mais il faut se dire que cette interface est une étape comme il y en a eu beaucoup déjà et bien moins convaincantes.<br /> L’interaction avec des robots est particulièrement étudiée, les expressions du visage sont un premier pas très important pour la compréhension d’un échange car tout ne peut passer juste par l’intonation de la voix. Je peux vous renvoyer par exemple aux travaux du professeur Hiroshi Ishiguro sur le sujet.<br /> L’utilisation de ChatGPT (ou d’une autre IA grand public) arrive en complément de tout ce qui a été fait jusque là mais de manière limitée au monde de la recherche ou universitaire.<br /> Et pour compléter, je peux aussi avancer que les scientifiques ont toujours besoin de publicité pour leurs travaux, c’est comme ça qu’on obtient des financements.<br /> @Karnag :<br /> Tu peux te concentrer sur ses œuvres sur les robots, par le biais du « Grand livre des robots » (2T) par exemple ou des publications liée au « Cycle des robots »
Francis7
C’est clair que les humains n’ont pas autant d’expressions sur le visage. Là, on dirait une succession de emojis à chaque phrase comme on a l’habitude de les singer sur les salons de chats et les forums.<br /> Par exemple, on met « LOL » à tout va mais ça ne veut rien dire et ça ne reflète pas la subjectivité de la personne.<br /> Ce qui compte le plus tout de même, c’est l’avancée techonologique.
Byvivre_Thagrea1
Bien alors…<br /> Ce n’est pas chat gpt, qui est un chat…<br /> C’est le model de deep learning gpt3 entrainé avec des images d’expression humaine !<br /> Pour info gpt3 ce trouve sur le net bon pour l’entraîner il faut des tonnes de données et des milliers d’heures de processeurs.<br /> La seule vraie avancée c’est gpt4 qui ce veut multimodal.<br /> Mais le vrai buzz est qu’openai après avoir décidé de ne plus être open ne respecte pas la règle toujours respectées jusqu’ici DONNÉ LA STRUCTURE DE SON MODÈLE, nombre de paramètres etc…<br /> Et ça c’est un tournant dangereux
MqcdupouletBasquez
C’est qu’étant occupé à des achats importants, je dérive de sujet en allant regarder ce qui se passe à droite et à gauche et en effet, je tombe sur ce sujet qui paraissait intéréssant au 1er abord mais qui en définitive, me semble totalement dénué d’intérêt étant donné la pauvreté du résultat fourni.<br /> Les expréssions d’un visage sont très important, c’est vrai, mais ils doivent être réalistes au risque de perturber le message transmis.<br /> un être humain qui regarde entièrement à droite et à gauche quand il parle, cela va m’inquiéter.<br /> de même s’il change complétement d’expréssion de visage sans motifs, c’est ennuyeux.<br /> Pour être honnête, j’avais une idée un peu naive du sujet en imaginant une vidéo type « kara de Détroit », qui était une vidéo très bien faite je trouve où là, la simulation paraissait « vivante ».<br /> Je pense que l’intérêt de cette vidéo va avec ta conclusion parfaite:<br /> « e peux aussi avancer que les scientifiques ont toujours besoin de publicité pour leurs travaux, c’est comme ça qu’on obtient des financements. »<br /> c’est juste exactement ça. C’est pour obtenir des financements.<br /> Mais on est super loin d’une application pratique à ce stade.<br /> On ne peut pas imaginer là une simulation réelle sur le terrain d’un agent d’accueil comme ça.<br /> J’espere un progrès plus important que ça pour l’avenir.<br /> Chatgpt, surtout récemment depuis que c’est quasi instantané, c’est réellement quelque chose de consistant et concret.
Bombing_Basta
Mais grave, je ne vois rien de réaliste ici.<br /> Aucune cohésion ou presque entre le « discours » et les « expressions ».
kplan
La coordination avec leur robot qui existait déjà est encore à améliorer mais même avec la structure actuelle de GPT-3 on peut obtenir des expressions, soient-elles exagérées ou non.<br /> La plupart des IA utilisées jusqu’ici étaient développées spécifiquement pour une adéquation fidèle entre propos et expression. Le fait qu’un outil généraliste comme Chat-GPT soit capable de produire lui-même discours et expression est intéressant en soi.
MqcdupouletBasquez
j’en convient, il aurait fallu simplement attendre encore un peu pour que ça soit plus naturel.
themancool87_1_1
C’est moi ou personne ne réagit à ce que l’IA dit dès le début sur un sentiment de Gaité puis de tristesse…<br /> L’IA dit quand même que son plus grand bonheur a été quand iel à été activé. Et qu’iel à ressenti la vie…<br /> Et qu’en tristesse iel ne connaîtra jamais l’amour…<br /> Et puis. J’utilise ce fameux pronom ‹ iel › car c’est ni une femme. Ni un homme.
ypapanoel
On y est !<br /> sinon : la façon dont le visage se déforme de façon réaliste est assez bluffante… les yeux sont le reflet de l’âme et le coté vitreux n’apporte pas, mais si vous croisez quelqu’un qui met des lentilles colorées ça fait un peu ça aussi <br /> dans 30 ans ça fait flipper ce qu’on va pouvoir faire… des pans entiers de société vont se retrouver cul nu car ne servant à rien sur le papier. Et les autres seront en névrose de manque d’interaction sociale si ces trucs se généralisent (ce qui se fera dès que ça coûtera moins cher qu’un humain sur coût complet calculé à 5-7 ans)<br /> On parlait d’Asimov… moi je repense à Herbert (Dune) : le Jihad Butlérien c’est l’éradication des machines pour miser sur l’humanité transcendée, justement parce qu’à un moment ça commençait à sentir le roussi… une autre façon de voir un avenir
Blackalf
ABC:<br /> Super, on va pouvoir remplacer 90% des politiciens de tous bords.<br /> Brasser de l’air et faire semblant de donner le change sur du vide, c’est leur point commun avec cette machine à grimaces.<br /> Une perruque, un costard et le tour est joué. <br /> Ne pas oublier qu’il faut aussi savoir serrer des mains, caresser les joues des bébés et pointer quelqu’un du doigt. ^^<br /> Sinon, ils auront beau faire tout ce qu’ils veulent, il y a une chose qui n’est pas près d’arriver, et elle concerne les yeux. On dit que les yeux sont les miroirs de l’âme et c’est totalement vrai, aucun robot ne pourra jamais faire transparaître la personnalité et le caractère qu’il n’a pas.
mcbenny
Le jour le plus heureux: « Il n’y a rien de tel que d’expérimenter la vie pour la première fois, n’est-ce pas ? ».<br /> Heu… donc les bébés qui hurlent à la naissance, c’est de la joie ? On m’aurait menti ?!
Ayetek
Une voix de femme pour ce ce robot mais il a l’expression et les yeux de Thomas Shelby des Pinky Blinders…<br /> 540×715 28.4 KB<br />
philouze
[quote] Il n’a pas de sexe, pas de conscience, pas de sentiments ni d’émotions, tout du moins dans sa version grand public où cette vidéo est sensée faire appel.<br /> Ainsi, ça n’a rigoureusement aucun intérêt à ce stade de présenter ce type de vidéo si ce n’est produire un contenu commercial repris dans différents sites y compris celui de Clubic.<br /> [/quote]<br /> Comme beaucoup je l’ai trouvé quand même assez bluffant alors que précisément je savais que ça tournait sur GPT3 qui n’est « qu’un » robot conversationnel un peu élaboré + une surcouche d’interprétation de ce qui est dit par l’interlocuteur + re-prononcé pour animer un visage.<br /> ça vaut le coup d’être montré, parce que c’est un aperçuu du ressenti qu’on aura face à une IA plus générale dans laquelle on aura câblé des ressentis de base (envie, souffrance etc) - et ne parlons pas des futures IA générales.
Voir tous les messages sur le forum
Haut de page

Sur le même sujet