🔴 French Days en direct 🔴 French Days en direct

Pour faire la promo de sa nouvelle IA Gemini, Google s’est un peu arrangé avec la réalité

08 décembre 2023 à 08h33
10

Google vient tout juste de dévoiler Gemini, sa réponse à ChatGPT, et le moins qu’on puisse dire, c’est que les démos faites par Google sont bluffantes… Un peu trop bluffantes même.

La guerre des IA est déclarée et dans ce conflit Google est venue armée avec Gemini, son grand modèle de langage « nettement en avance » sur la concurrence. Le géant de la recherche a notamment mis en avant la compréhension poussée de Gemini par rapport aux contenus audio et vidéo. Et si le cerveau numérique de Google n’est pas encore disponible en langue française pour le moment, il faut avouer que la démonstration faite en anglais par Google avait de quoi couper le souffle.

Une démo trop belle pour être vrai

Pendant 6 petites minutes, on voit l’IA analyser et réagir quasiment en temps réel à ce que la caméra montre. La machine semble comprendre immédiatement quand une main se met à jouer à pierre-feuille-ciseau, reconnaître des imitations ratées de Matrix et même jouer des morceaux de musique adaptés aux instruments gribouillés sur un post-it. Malheureusement, tout n’est pas aussi fluide et efficace que Google a pu nous faire croire.

Comme le détaille un billet de blog de Google, les réponses données par Gemini dans la vidéo sont en fait beaucoup plus fractionnées que ça et les « prompts » donnés à la machine beaucoup plus précis que ce que peut faire croire la voix off. Ainsi la vidéo donne l’impression d’une discussion presque à bâton rompu avec l’IA alors que la réalité est beaucoup plus fastidieuse que ça.

Une IA douée, mais pas autonome

Aucune des réponses données par Gemini n’a été inventée, mais certaines ont été fusionnées ou raccourcies pour donner l’impression que l’IA sait tenir une discussion et enchaîner des éléments de réponses connexes sans avoir à être relancée. Ce qui n’est pas le cas. Par exemple sur la reconnaissance des dessins d’instruments, la vidéo fait croire que Gemini est capables, sans intervention aucune, de reconnaître le dessin et d’automatiquement jouer un morceau adapté, alors que le prompt a en fait été séparé en deux étapes et détaille précisément toutes les actions que doit effectuer Gemini.

Pour sa défense, Google a bien précisé dans la description de la vidéo que « pour les besoins de cette démo, la latence a été réduite et les messages de Gemini ont été raccourcis ». Oriol Vinyals, responsable de la recherche en IA chez Google, a même expliqué que « la vidéo illustre ce à quoi pourraient ressembler les expériences multimodales […] avec Gemini ».

Mais entre une vidéo nommée « Prise en main de Gemini » et une illustration, partiellement vraies, de ce que serait potentiellement capable de faire l’IA de Google, il y a tout de même un monde.

ChatGPT
  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Corentin Béchade

Journaliste depuis quasiment 10 ans, j’ai écumé le secteur de la tech et du numérique depuis mes tout premiers chapôs. Bidouilleur (beaucoup), libriste (un peu), j’ai développé une spécialisation sur...

Lire d'autres articles

Journaliste depuis quasiment 10 ans, j’ai écumé le secteur de la tech et du numérique depuis mes tout premiers chapôs. Bidouilleur (beaucoup), libriste (un peu), j’ai développé une spécialisation sur les thèmes de l’écologie et du numérique ainsi que sur la protection de la vie privée. Le week-end je torture des Raspberry Pi à grands coups de commandes 'sudo' pour me détendre.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires (10)

SlashDot2k19
Ils vont encore décevoir tout le monde avec cette vidéo truquée…
Mimi9
C’est pas truqué si c’est précisé en tout petit que ce sont des scènes raccourcies…c’est une pratique courante dans la pub ( c’est du même niveau que la « dramatisation » du blanc dans les pubs pour lessive)
Shooot
Le but étant de bluffer le spectateur,<br /> c’est malhonnête<br /> même si c’est écrit en tout petit en bas.<br /> Ils auraient pu incruster dans la vidéo le message.
ar-s
Evidement c’est déformé, optimisé etc… Mais Gemini et l’avènement du multimodal vont bouleverser notre façon d’appréhender la communication, la création etc…<br /> Quand je vois qu’en local je peux maintenant mettre mon visage à la place de celui d’un acteur dans une bande annonce (par exemple) et cela à partir d’une simple photo et que le rendu est relativement très propre. On m’aurait dit ça y’a 5 ans j’aurai rigolé en disant : Pfff on verra ça dans 10 ou 20 ans gros mytho… Et pourtant c’est là. Et je parle bien de faire ça avec mon PC et des modèles beaucoup moins violent que ce qu’ils utilisent online. (modeles local de quelques gigas)<br /> Je vous laisse regarder le resultat : https://youtu.be/SvtG7ZelE5Y
Proutie66
Je trouve ça très malhonnête du coup. C’est pas du direct.
Mimi9
C’est malhonnête si c’est pas précisé
Mimi9
C’est même malin vu que tout le web en parle (tout buzz est bon à prendre, surtout si c’est fait sans dépenser plus) ça n’empêchera pas de se ruer dessus pour le tester
Proutie66
Sauf que ça s’adresse avant tout au milieu professionnel, je pense à la version optimale. Et là, clairement, ils passent pour des loosers.<br /> On est en 2023, si tu veux faire parler pour de la merde, c’est que tu veux être influenceur. Google ne cherche pas le buzz. Il cherche de la crédibilité sur l’IA.
Ipoire
Google a encore raté son annonce, c’est vraiment des loosers. Quand ils ont annoncé Bard a l’arrache il était pas prêt et il te disais même que la terre était plate!<br /> Et maintenant voila Gemini, dabord annoncé pour cette année, puis reporté et puis re-annoncé a la dernière minute, +5% en bourse a l’annonce, -2% le lendemain quand tout le monde s’est aperçu de la supercherie. J’ai un pote chercheur pour deepmind, il était même pas au courant de l’annonce, c’est pour dire la communication désastreuse de google.
sussu40
Google nous montre un film d’anticipation, parce que un jour ils y arriveront, mais ne nous pas explicitement que c’est du cinéma ou de la publicité…Ou alors à demi mots…
Voir tous les messages sur le forum
Haut de page

Sur le même sujet