Dragon Drive : comment Nuance fait parler les voitures connectées

Jérôme Cartegini
Spécialiste sécurité informatique
29 février 2016 à 17h27
0

Nuance donne de la voix

De l'acoustique aux boutons de commandes vocales placés dans l'habitacle, en passant par l'affichage graphique des fonctions vocales sur l'ordinateur de bord, ou encore, la gestion des smartphones, les ingénieurs peaufinent chaque détail pour offrir l'expérience la plus pertinente possible. L'une des étapes les plus fastidieuses réside dans le développement du catalogue de synthèses vocales qui comprend actuellement 50 langues et plus de 100 voix.

Christophe Couvreur, le vice-président de Nuance Communications met l'accent sur la qualité et la personnalisation de la synthèse vocale de Dragon Drive pour ses clients : « Les voix ne sont pas toutes développées à Aix-la-Chapelle, mais aussi dans d'autres centres de R&D dans le monde, notamment à Sunnyvale aux États-Unis, à Shanghai en Chine, à Merelbeke en Belgique ou encore, Turin en Italie. Quelques constructeurs de voitures choisissent des voix qui existent déjà dans notre catalogue, mais pour d'autres comme BMW ou Audi, nous avons créé des voix customisées en différentes langues. Exemple concret : Audi utilise des voix customisées en allemand, anglais et français, ainsi que des voix standards extraites de notre catalogue pour les autres langues ».

03E8000008292172-photo-nuance-localization-lab.jpg

Dans le centre d'Aix-la-Chapelle, des linguistes des quatre coins du monde transcrivent les textes énoncés par l'assistant virtuel dans une vingtaine de langues.


Le centre de recherche d'Aix-la-Chapelle dispose d'un véritable studio d'enregistrement pour enregistrer des voix féminines et masculines dans de nombreuses langues, dont l'allemand, l'espagnol, le japonais, l'italien, et le russe. L'éditeur profite notamment de l'important vivier d'étudiants étrangers présents dans la ville universitaire d'Aix-la-Chapelle pour dénicher ses « acteurs voix ». Un peu comme pour le doublage d'un film de cinéma, ils doivent lire à haute voix des extraits de livres ou d'articles de journaux. Un travail titanesque qu'il faut réitérer dans chaque langue. L'éditeur va même jusqu'à faire enregistrer des variations, avec des voix présentant les différents accents qu'il peut y avoir d'une région et d'un pays à l'autre, dans une même langue. Son catalogue comprend, pour le français, des acquisitions de voix avec l'accent belge, suisse, ou québécois. La synthèse vocale de Nuance n'est toutefois pas 100 % humaine, un logiciel se charge de combler informatiquement les mots qui peuvent éventuellement manquer en imitant la voix sélectionnée.

03E8000008292174-photo-nuance-soundstudio.jpg

Nuance enregistre des voix pour son catalogue de synthèse vocale dans le monde entier depuis plus de 20 ans.


Quid de la reconnaissance vocale de demain ?

Pour conclure cette visite, nous avons demandé au directeur de la recherche Nils Lenk quelles seront les prochaines évolutions des technologies vocales de la firme : « Notre système de reconnaissance et de synthèse vocale va être de plus en plus précis et performant grâce aux nouveaux progrès des technologies et des systèmes d'apprentissage automatique (deep learning, NDLR). Il permettra de parler librement à sa voiture de manière encore plus naturelle qu'aujourd'hui. Dans le fond, les systèmes deviendront plus "intelligents", en utilisant la connaissance du monde, l'accès aux ressources de l'Internet, les capteurs de la voiture, et le raisonnement pour trouver des réponses vraiment utiles aux demandes des conducteurs ».

Nuance Communications entend aller beaucoup plus loin que les assistants personnels pour smartphone comme Siri d'Apple. Mais l'éditeur n'est pas le seul à exploiter les dernières avancées en matière d'intelligence artificielle (IA) pour révolutionner la reconnaissance vocale. Le laboratoire de recherche de Facebook à Paris dirigé par l'éminent chercheur en IA Yann LeCun a été créé en partie pour développer l'assistant virtuel de demain. Pour concurrencer Siri, Cortana ou encore Now, Mark Zuckerberg ambitionne de pouvoir proposer un jour sur son réseau social un assistant virtuel « plus humain » qui serait capable d'aider ses membres dans toutes sortes de tâches quotidiennes... Sans oublier l'assistant virtuel VIV créé par deux des trois fondateurs de Siri, qui s'annonce comme l'un des plus évolués jamais conçu. Encore en cours de développement, il devrait à terme être vendu sous forme de licences aux fabricants d'équipements high-tech et les constructeurs automobiles. Une chose est sure, les technologies de reconnaissance et de synthèse vocale sont promises à un bel avenir...
Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Les actualités récentes les plus commentées

Automobile : le gouvernement envisagerait un malus lié au poids des véhicules
Le Royaume-Uni devrait interdire les ventes de voitures thermiques en 2030
Après Bethesda, Microsoft tease, déjà, un autre rachat à venir ?
Airbus dévoile ses trois concepts d'avion à hydrogène, opérationnel d'ici 2035
Voiture électrique : allez-vous sauter le pas et à quel prix ?
Microsoft rachète Bethesda Softworks et l'ensemble de ses studios
Batteries de voitures : et si on allait plutôt chercher les matériaux au fond des océans ?
Battery Day : des batteries révolutionnaires et une Tesla à 25 000 dollars sous trois ans
Données personnelles : Facebook menace de retirer ses réseaux sociaux d'Europe !
PS5 VS Series S et X : laquelle allez-vous précommander et pourquoi ?
scroll top