Des IA apprennent le travail d'équipe en jouant à cache-cache

22 septembre 2019 à 20h20
2
OpenAI entrainement IA
© OpenAI

L'intelligence artificielle se développe à une vitesse impressionnante. Il y a deux mois, Pluribus a marqué l'Histoire en battant cinq joueurs de poker à la fois. Au début de l'année, l'IA de Google, Deepmind a battu des joueurs professionnels à Starcraft II.

Cette fois-ci, c'est l'initiative d'OpenAI qui attire l'attention. L'IA américaine a prouvé sa capacité à apprendre en jouant en équipe à des parties de cache-cache.

De plus en plus fortes au cache-cache

On ne présentera pas le jeu du cache-cache. En revanche, lorsque ce jeu mondialement connu est présenté à une intelligence artificielle, celui-ci peut révéler comment cette dernière gère l'importance des décisions auxquelles elle est confrontée.

OpenAI, qui est basée à San Francisco, a rendu open-source un environnement d'entraînement destiné aux IA. Cet environnement a déjà été utilisé, mettant en scène différents acteurs contrôlés par des IA. Ceux-ci ont eu pour objectif de se cacher et de se trouver, déployant des techniques de plus en plus sophistiquées pour y parvenir. On retrouve sur les images ci-dessous l'évolution de ces techniques : si, dans un premier temps, les IA ont pu se contenter de se cacher, elles ont par la suite improvisé des constructions et détourné l'utilisation d'objets. Et surtout, ces IA ont travaillé ensemble pour atteindre un but commun.


Bien sûr, l'intelligence artificielle aura dû jouer un (très) grand nombre de parties pour parfaire son apprentissage. Ce n'est qu'après 25 millions de « matches » que les IA impliquées ont commencé à bâtir des abris improvisés. Avec 75 millions de matches supplémentaires, les « chercheurs » ont eu l'idée d'utiliser boîtes et rampes pour sauter dans ces abris.

OpenAI IA entrainement
© OpenAI

L'intérêt pour les travaux futurs

À terme, les IA impliquées ont réussi à élaborer des stratégies complexes dans un environnement qu'elles ne connaissaient pas a priori. Les chercheurs d'OpenAI expliquent ainsi : « Les succès rencontrés laissent penser que ces environnements pourraient permettre à des IA d'acquérir un nombre conséquent de... compétences. Ceci amène à un comportement centré sur des compétences beaucoup plus pertinentes pour l'être humain que d'autres méthodes d'apprentissage par renforcement ».

En d'autres termes, et au-delà des environnements de jeu, ces tests montrent que l'IA peut apprendre à élaborer elle-même de nouvelles techniques utiles, par exemple, dans le diagnostic médical ou la découverte de structures de protéines complexes.


Dans une précédente interview, Demis Hassabis, le co-fondateur de l'IA Alphabet Deepmind, a déclaré auprès du site VentureBeat : « À terme, nous développerons des algorithmes qui peuvent être transposés dans le monde réel, pour travailler à des défis réellement difficiles... et aider les experts de ces secteurs ».

Source : Venture Beat
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
2
3
Voir tous les messages sur le forum

Actualités du moment

Le stade de Miami pourrait être rebaptisé BangBros Center... du nom du site pornographique
Rayman Mini : une exclusivité Apple Arcade (et un jeu made in Montpellier !)
Pour Bob Iger, Disney et Apple auraient fusionné si Steve Jobs était toujours vivant
L'Union Européenne appelle à une gestion durable de l'espace
IBM mettra en service son plus gros ordinateur quantique de 53-qubits en octobre
Le Ryzen 5 3500X d'AMD entrevu chez un e-commerçant chinois
Chrome 77 pour Android va profiter d'améliorations dans sa gestion des onglets
La fin des dinosaures : une étude raconte les minutes qui ont suivi l'impact de l’astéroïde
Apple investit 250 millions dans Corning qui fabrique ses verres innovants
Le Xiaomi MIX Alpha se montre et nous laisse perplexe
Haut de page