Microsoft Research repousse ses efforts en vision artificielle

01 juin 2018 à 15h36
0
Les chercheurs de Microsoft multiplient leurs travaux dans le domaine de l'intelligence artificielle et présentent un nouvel algorithme capable de décrire précisément le contenu d'une image.

Comment comprendre précisément le contenu d'une image ? Voilà une question à laquelle Microsoft Research souhaite répondre grâce à plusieurs algorithmes. Sur How-Old.net, Microsoft tente de détecter l'âge d'une personne grâce à une simple photo. Sur TwinsOrNot.net, l'idée est de calculer le pourcentage de ressemblance entre deux individus. Avec le Project Oxford, les chercheurs souhaitent enfin identifier les émotions d'un sujet directement à partir d'un cliché.

Cette fois, Microsoft annonce avoir travaillé avec les chercheurs de l'université de Carnegie Mellon pour concevoir un système de vision artificielle capable d'analyser les images et de répondre naturellement à des questions. Selon Microsoft cette technologie pourrait permettre « d'effectuer des recommandations et des actions en temps réel pour anticiper les besoins humains ».

Concrètement, pour les chercheurs de Microsoft, l'idée est de comprendre instantanément les différents éléments d'une situation en analysant une image en temps réel tout en étant capable de comprendre le langage naturel. Ainsi, un cycliste muni d'un casque embarquant une caméra serait en mesure de formuler une question du type : « Qu'y a-t-il derrière moi à gauche ? » ou « y a-t-il des coureurs proches de moi que je n'aurais pas vu ? ». De son côté, l'algorithme est capable de répondre par une recommandation.

035C000008259172-photo-microsoft-research.jpg


Pour ce faire, l'algorithme a été conçu afin d'éliminer rapidement les éléments jugés les moins pertinents pour traiter une question afin de se concentrer sur la zone principale. « Avec ce système, l'image passe au travers d'un système de neurones artificiels pour décider quelles zones sont pertinentes  », affirme ainsi, le chercheur Xiaodong He. Le processus est donc semblable au fonctionnement du cerveau humain.

D'autres sociétés s'intéressent à la vision artificielle. C'est le cas de Yahoo! qui a apposé un dispositif sur sa plate-forme Flickr mais également de Google sur son service de photos dévoilé au printemps dernier.

  • Consultez l'étude dans son intégralité sur cette page (PDF)

A lire également :
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0

Actualités du moment

iPhone 6 : un prototype (?) en vente sur eBay pour 7 000 dollars
Le créateur du Bitcoin n’est finalement pas celui que l’on croyait
Black Friday : elle achète un iPhone 6 et se retrouve avec des patates
L'Ukraine dans le noir à cause d'un virus informatique ?
Tesla Model S 75 kWh : plus autonome, mais plus chère
Comment régler les couleurs de son écran PC ?
4 techniques simples pour nettoyer son PC
Alimentation de 850 W pour le multi-GPU chez Corsair
USB Type-C : tout savoir sur la nouvelle norme USB
De Facebook... à Sexebook, réseau social coquin ?
Haut de page