Google : un système de reconnaissance vocale en mode déconnecté

01 juin 2018 à 15h36
0
Google a conçu un nouveau dispositif de reconnaissance vocale, lequel fonctionne en mode déconnecté et serait plus performant que ceux actuellement disponibles sur le marché.

En lançant Google Now en mai 2013, Google avançait que cet assistant pouvait également fonctionner sans connexion Internet. Toutefois, les options sont assez limitées. Il est par exemple possible de lire de la musique, d'ouvrir Gmail, d'activer ou de désactiver le mode avions ou les connexions Wi-Fi et Bluetooth ou encore de gérer le volume.

Une équipe d'ingénieurs de Google a récemment publié leurs travaux de recherche pour la mise en place d'un nouveau dispositif (PDF). Google fait usage de diverse techniques de machine learning et il en résulterait un traitement des requêtes 7 fois plus rapide que sur un assistant nécessitant une infrastructure de cloud computing.

Pour une dictée classique, ce nouveau système aurait pour l'heure un taux d'erreur de 13,5%. Ces travaux ont été testés sur un Nexus 5 disposant d'un SoC quad core cadencé à 2,26 GHz avec 2 Go de mémoire vive. L'application pèse un peu plus de 20 Mo. Pour en réduire au maximum sa taille, les chercheurs ont rassemblé en un seul module la dictée et les commandes vocales. En outre Google fait usage de plusieurs techniques de compression.

035C000008379678-photo-google-now-ban.jpg


Pour entraîner cet algorithme, les chercheurs ont fait usage de quelque 3 millions de voix anonymes (soit environ 2000 heures). Chacun des échantillons a en outre subi une vingtaine de distorsions.

Notons qu'en début de mois Google a signé un partenariat avec Movidius afin de concevoir un système de reconnaissance d'images et de visages fonctionnant également en mode déconnecté. Dans ce cas de figure les calculs des algorithmes seront aussi effectués en local.
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0

Actualités du moment

Yahoo continue de faire le ménage avant une potentielle revente
Jailbreak : PanGu débride iOS 9.1 et débridera l'Apple TV
La PlayStation de 1994 remise en vente par Lekki
IA : 1/3 des développeurs se sentent menacés
A son tour, WhatsApp est dans le collimateur de la justice américaine
Exomars 2016 : regardez le lancement en direct
Virgin Mobile : le retour de l'offre 20 Go à 3,99€
Toute l'exploration spatiale en un poster
Parcours de développeurs :
Sécurité : la menace est déjà dans les murs
Haut de page