le samedi 05 mai 2018

Comment Facebook entraîne l'IA avec les milliards de photos Instagram

Le secret pour posséder une IA puissante ? Disposer d'une base de données la plus grosse possible pour nourrir la machine. Voilà qui n'est pas un problème pour Facebook. Le premier réseau social du monde met à la disposition de ses programmes d'intelligence artificielle les milliards de photos d'Instagram pour les entraîner.

Lors de sa conférence annuelle aux développeurs F8, Facebook a détaillé la manière dont il exploitait les photos publiques des membres d'Instagram et les hashtags qui leurs sont rattachés.

Les hashtags font la richesse d'Instagram


Si vous vous demandiez la valeur que pouvait receler les photos de repas ou de coucher de soleil que vous postez en abondance sur Instagram, voilà un début de réponse. Lors de sa grande conférence annuelle aux développeurs, Facebook a détaillé la manière dont il entraînait ses programmes d'intelligence artificielle avec cette colossale banque d'images.

La richesse d'Instagram ne réside en effet pas seulement dans sa taille : les usagers y déposent chaque jour des millions de nouvelles photos. Mais cette matière est en soi sans intérêt (mais si, vos photos sont réussies !). Sauf que, sur Instagram, tout le monde annote ses photos, les commente, les accompagne de nombreux hashtags et de mots-clés. Cette labellisation prendrait des milliers d'heures à une équipe spécifiquement dédiée à cette tâche. Grâce aux Instagrameurs et Instagrameuses, le travail est déjà fait.

9 facebook instagram


Améliorer la modération


Cette association de mots à des images fournit une matière documentaire immédiatement exploitable aux IA de Facebook, qui en extraient un sens et une interprétation, et peuvent ensuite reconnaître des images non annotées. Toutes les photos et hashtags ne sont évidemment pas pertinents, mais la quantité compense ce travers. L'une des IA de Facebook, rapporte The Verge, a ainsi englouti 3 milliards et demi de photos rattachées à 17.000 hashtags.

Facebook assure que ses programmes sont meilleurs que la concurrence, avec des résultats de reconnaissance d'image 1 à 2 % supérieurs aux plus puissants d'entre eux, dont ImageNet et son taux de réussite de 85,4 %. Facebook explique se servir ensuite de ses IA pour améliorer le repérage de contenus non autorisés, et plus largement sa modération, souvent critiquée pour son manque de réactivité ou de jugeote. Reste à voir si tous les Instagrameurs apprécieront de savoir que leurs photos servent à entraîner une machine qui pourra, peut-être un jour, prédire leur type de femme ou d'homme, ou leur menu du soir...

Modifié le 03/05/2018 à 17h14
Commentaires