Face à Amazon, Google, Apple ou IBM, Microsoft explique avoir conçu le dispositif de reconnaissance vocale produisant le taux d'erreur le plus faible. IBM est longtemps resté précurseur sur ce domaine. Il y a une vingtaine d'années, la société était déjà à l'étude et 57% des commandes vocales étaient correctement interprétées. En 2004, ce chiffre était passé à près de 75%.
Watson, le supercalculateur d'IBM était toujours en tête du palmarès avec un taux d'erreur de 6,9% ; ils ont d'ailleurs battu leur propre record de l'année dernière à 8%. Le PDG de Google Sundar Pichai avait également communiqué sur un taux d'erreur à 8% l'année dernière pour son assistant vocal sur Android.
De son côté, Apple multiplie les acquisitions pour renforcer la technologie de Siri et le directeur de l'ingénierie Alex Acero révèlait récemment que le taux d'erreur avait été divisé par deux depuis la migration de la plateforme sur un réseau de neurones artificiels.
Les sociétés investissent de plus en plus au seinu deep learning dont les algorithmes sont capables d'apprendre de leurs erreurs et disposent de modèles prédictifs. Les chercheurs de Microsoft Research affirment avoir réussi à passer ce cap pour obtenir 6,3% tout en suivant les standards d'évaluation.
Les travaux de Microsoft seront très certainement portés sur l'assistant Cortana par la suite. Reste à savoir qui mettra au point un dispositif se rapprochant le plus de la compréhension humaine.