C-LEARN : quand des robots enseignent à d’autres robots

Une nouvelle méthode d'apprentissage pour les robots vient d'être mise au point par une équipe du MIT : elle combine des techniques de démonstration et des techniques de planification des mouvements.

C-LEARN : une nouvelle méthode d'apprentissage pour les robots


La plupart des robots sont programmés pour apprendre selon deux méthodes distinctes. La première repose sur la démonstration : les robots observent comment une tâche est réalisée puis reproduisent les mêmes gestes. La seconde utilise des techniques de planification des mouvements, via l'optimisation ou l'échantillonnage, qui nécessitent que des programmeurs indiquent précisément les objectifs et contraintes d'une tâche. Chacune de ces deux méthodes présente des inconvénients. D'un côté, les robots qui apprennent grâce à la méthode démonstrative ne peuvent pas transposer à d'autres situations les compétences acquises. De l'autre, les systèmes de planification des mouvements qui utilisent l'échantillonnage ou l'optimisation, permettent une adaptation des robots au changement, mais ils sont chronophages, dans la mesure où ils doivent être codés à la main par des programmeurs experts.

Récemment, des chercheurs du MIT ont mis au point une technique d'apprentissage qui combine les avantages des deux méthodes précédemment citées : appelée C-LEARN, cette technique permet à des non-codeurs d'apprendre aux robots une série de tâches à effectuer, simplement en leur fournissant des informations sur la façon de manipuler les objets et en leur montrant une fois comment effectuer la tâche. Mais surtout, cette méthode permet aux utilisateurs d'enseigner des compétences aux robots qui peuvent être automatiquement transférées à d'autres robots qui ne se déplacent pas de la même façon : cela représente une économie de temps et d'argent non négligeable, pour les entreprises qui souhaitent qu'une série de robots différents réalisent les mêmes actions.



C-LEARN : comment ça marche


Le "C" de C-LEARN, renvoie au terme "constraint" (contrainte en français) : avec cette méthode, l'utilisateur fournit d'abord des connaissances de base au robot sur la façon d'atteindre et d'attraper des objets variés qui présentent des contraintes différentes. Par exemple, un pneu et une roue directrice ont une forme similaire, mais pour les déplacer et les attacher à une voiture, le robot ne configurera pas ses bras de la même façon. Les connaissances de base enseignées au robot contiennent les informations nécessaires à la prise en compte des contraintes différentes des objets et situations. L'opérateur a ensuite recours à une interface 3D pour montrer au repos une démonstration unique de la réalisation d'une tâche spécifique, qui est représentée par une séquence de moments pertinents appelée « image clé ». En faisant correspondre ces images clés aux différentes situations de la base de connaissance, le robot peut automatiquement suggérer des plans de mouvements que l'opérateur approuve ou modifie selon les besoins.

« Cette nouvelle approche est en réalité très proche de la façon dont les humains apprennent dans la mesure où ils observent comme une chose se fait, puis ils relient l'information à ce qu'ils savent déjà sur le monde. Il est impossible d'apprendre à partir d'une démonstration unique, donc nous prenons une nouvelle information et la faisons correspondre à nos connaissances antérieures sur notre environnement » résume Claudia Pérez-D'Arpino, une doctorante qui s'est intéressée au programme C-LEARN.


Modifié le 11/05/2017 à 16h05
Commentaires