Des IA apprennent le travail d'équipe en jouant à cache-cache

22 septembre 2019 à 20h20
0
OpenAI entrainement IA
© OpenAI

L'intelligence artificielle se développe à une vitesse impressionnante. Il y a deux mois, Pluribus a marqué l'Histoire en battant cinq joueurs de poker à la fois. Au début de l'année, l'IA de Google, Deepmind a battu des joueurs professionnels à Starcraft II.

Cette fois-ci, c'est l'initiative d'OpenAI qui attire l'attention. L'IA américaine a prouvé sa capacité à apprendre en jouant en équipe à des parties de cache-cache.

De plus en plus fortes au cache-cache

On ne présentera pas le jeu du cache-cache. En revanche, lorsque ce jeu mondialement connu est présenté à une intelligence artificielle, celui-ci peut révéler comment cette dernière gère l'importance des décisions auxquelles elle est confrontée.

OpenAI, qui est basée à San Francisco, a rendu open-source un environnement d'entraînement destiné aux IA. Cet environnement a déjà été utilisé, mettant en scène différents acteurs contrôlés par des IA. Ceux-ci ont eu pour objectif de se cacher et de se trouver, déployant des techniques de plus en plus sophistiquées pour y parvenir. On retrouve sur les images ci-dessous l'évolution de ces techniques : si, dans un premier temps, les IA ont pu se contenter de se cacher, elles ont par la suite improvisé des constructions et détourné l'utilisation d'objets. Et surtout, ces IA ont travaillé ensemble pour atteindre un but commun.


Bien sûr, l'intelligence artificielle aura dû jouer un (très) grand nombre de parties pour parfaire son apprentissage. Ce n'est qu'après 25 millions de « matches » que les IA impliquées ont commencé à bâtir des abris improvisés. Avec 75 millions de matches supplémentaires, les « chercheurs » ont eu l'idée d'utiliser boîtes et rampes pour sauter dans ces abris.

OpenAI IA entrainement
© OpenAI

L'intérêt pour les travaux futurs

À terme, les IA impliquées ont réussi à élaborer des stratégies complexes dans un environnement qu'elles ne connaissaient pas a priori. Les chercheurs d'OpenAI expliquent ainsi : « Les succès rencontrés laissent penser que ces environnements pourraient permettre à des IA d'acquérir un nombre conséquent de... compétences. Ceci amène à un comportement centré sur des compétences beaucoup plus pertinentes pour l'être humain que d'autres méthodes d'apprentissage par renforcement ».

En d'autres termes, et au-delà des environnements de jeu, ces tests montrent que l'IA peut apprendre à élaborer elle-même de nouvelles techniques utiles, par exemple, dans le diagnostic médical ou la découverte de structures de protéines complexes.


Dans une précédente interview, Demis Hassabis, le co-fondateur de l'IA Alphabet Deepmind, a déclaré auprès du site VentureBeat : « À terme, nous développerons des algorithmes qui peuvent être transposés dans le monde réel, pour travailler à des défis réellement difficiles... et aider les experts de ces secteurs ».

Source : Venture Beat
2
3
Partager l'article :
Voir tous les messages sur le forum

Les actualités récentes les plus commentées

Covid-19 : Twitter connaît une hausse de 900% des discours racistes contre la Chine
L'empreinte carbone issue de la consommation des Français a chuté de deux-tiers avec le confinement
Coup dur chez HPE : des SSD destinés aux entreprises pourraient se briquer après 40 000 heures
Le stockage d’énergie sous forme d’hydrogène fait un bond en avant
Xiaomi lancera la très attendue Mi TV 4S 65
Des Macbook propulsés par des processeurs ARM prévus pour l'an prochain
Office 365 devient Microsoft 365 et fait le plein de nouveautés
Renault prête 1 300 véhicules au personnel soignant, dont 300 ZOE électriques
Folding@home dépasse l'ExaFLOP pour lutter contre le Coronavirus
Square-Enix avance (officieusement) la date de sortie de Final Fantasy VII Remake !
scroll top