Google DeepMind a dévoilé une nouvelle génération de modèles d’intelligence artificielle capables d'aider les robots à accomplir des tâches complexes. Ces avancées ouvrent la voie à des machines plus autonomes et polyvalentes.

© Stock-Asso / Shutterstock
© Stock-Asso / Shutterstock

On les attendait, et ils arrivent enfin ! Google DeepMind franchit en effet une nouvelle étape dans l'IA, en annonçant la mise au point de nouveaux modèles d'IA dédiés à la robotique : Gemini Robotics 1.5 et Gemini Robotics-ER 1.5. Des outils qui permettent aux robots de non seulement planifier des actions en plusieurs étapes, mais aussi, nouveauté intrigante, de s'appuyer sur le web pour résoudre des problèmes pratiques.

Des robots capables de planifier et de résoudre des problèmes

Plus rien ne sera comme avant semble-t-il. Car avec Gemini Robotics 1.5, les robots franchissent une nouvelle étape en matière d’autonomie. Alors que les modèles précédents se limitaient à exécuter des instructions simples, la mise à jour leur permet désormais de « penser plusieurs étapes à l'avance », selon Carolina Parada, responsable de la robotique chez Google DeepMind, comme le rapporte The Verge.

Concrètement, un robot peut non seulement plier un vêtement, mais aussi organiser une lessive par couleurs ou trier des déchets en fonction de règles locales identifiées grâce à une recherche en ligne. Le modèle Gemini Robotics-ER 1.5 joue ici un rôle essentiel : il interprète l’environnement, fait ses recherches en ligne et transforme l'information obtenue en instructions exploitables à des fins d'exécution physique des tâches.

© Anton Gvozdikov / Shutterstock
© Anton Gvozdikov / Shutterstock

Des robots qui vont « apprendre » les uns des autres

Au-delà de l'autonomie individuelle, Google DeepMind met en avant la capacité de ses modèles à partager des compétences entre différents robots. Une tâche apprise sur le robot ALOHA2, doté de bras mécaniques, peut désormais être réalisée sans ajustements par un autre robot comme Franka, ou même par l'humanoïde Apollo développé par Apptronik. « Cela permet à un seul modèle de contrôler des robots très différents », résumé l'ingénieur Kanishka Rao.

Pour le moment, Gemini Robotics-ER 1.5 est déployé par DeepMind pour les développeurs à travers l'API Gemini, au sein de Google AI Studio. Gemini Robotics 1.5 sera par contre beaucoup moins accessible, Google choisissant quels partenaires pourront l'utiliser.

Source : The Verge

À découvrir
Quelles sont les meilleures IA pour générer vos contenus ? Comparatifs 2025
15 septembre 2025 à 11h58
Comparatifs services