Microsoft Research repousse ses efforts en vision artificielle

Guillaume Belfiore
Lead Software Chronicler
26 novembre 2015 à 15h00
0
Les chercheurs de Microsoft multiplient leurs travaux dans le domaine de l'intelligence artificielle et présentent un nouvel algorithme capable de décrire précisément le contenu d'une image.

Comment comprendre précisément le contenu d'une image ? Voilà une question à laquelle Microsoft Research souhaite répondre grâce à plusieurs algorithmes. Sur How-Old.net, Microsoft tente de détecter l'âge d'une personne grâce à une simple photo. Sur TwinsOrNot.net, l'idée est de calculer le pourcentage de ressemblance entre deux individus. Avec le Project Oxford, les chercheurs souhaitent enfin identifier les émotions d'un sujet directement à partir d'un cliché.

Cette fois, Microsoft annonce avoir travaillé avec les chercheurs de l'université de Carnegie Mellon pour concevoir un système de vision artificielle capable d'analyser les images et de répondre naturellement à des questions. Selon Microsoft cette technologie pourrait permettre « d'effectuer des recommandations et des actions en temps réel pour anticiper les besoins humains ».

Concrètement, pour les chercheurs de Microsoft, l'idée est de comprendre instantanément les différents éléments d'une situation en analysant une image en temps réel tout en étant capable de comprendre le langage naturel. Ainsi, un cycliste muni d'un casque embarquant une caméra serait en mesure de formuler une question du type : « Qu'y a-t-il derrière moi à gauche ? » ou « y a-t-il des coureurs proches de moi que je n'aurais pas vu ? ». De son côté, l'algorithme est capable de répondre par une recommandation.

035C000008259172-photo-microsoft-research.jpg


Pour ce faire, l'algorithme a été conçu afin d'éliminer rapidement les éléments jugés les moins pertinents pour traiter une question afin de se concentrer sur la zone principale. « Avec ce système, l'image passe au travers d'un système de neurones artificiels pour décider quelles zones sont pertinentes  », affirme ainsi, le chercheur Xiaodong He. Le processus est donc semblable au fonctionnement du cerveau humain.

D'autres sociétés s'intéressent à la vision artificielle. C'est le cas de Yahoo! qui a apposé un dispositif sur sa plate-forme Flickr mais également de Google sur son service de photos dévoilé au printemps dernier.

  • Consultez l'étude dans son intégralité sur cette page (PDF)

A lire également :

Guillaume Belfiore

Lead Software Chronicler

Lead Software Chronicler

Responsable du développement éditorial sur la partie Logiciel et Services Web sur Clubic. Précédemment journaliste, je traitais l'actualité web et mobile au sens large. Je m'intéressais aux entrailles...

Lire d'autres articles

Responsable du développement éditorial sur la partie Logiciel et Services Web sur Clubic. Précédemment journaliste, je traitais l'actualité web et mobile au sens large. Je m'intéressais aux entrailles des navigateurs web, aux nouveaux smartphones mais aussi aux systèmes d'exploitation, aux questions de sécurité ou à l'actualité e-business en général. Sinon je dois avouer que j'ai un faible pour tout ce qui touche au web design et c'est généralement le code source d'une page web que je lis en premier.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires

Haut de page