Chez Google l'intelligence artificielle prend la parole

Guillaume Belfiore
Lead Software Chronicler
13 septembre 2016 à 11h17
0
Google a récemment présenté un nouveau projet visant à optimiser les transcriptions textuelles afin de les rendre plus naturelles.

Après la vision artificielle, Google s'intéresse désormais à un autre aspect de l'intelligence artificielle : la conversion des textes en paroles. Les dispositifs d'aujourd'hui, notamment ceux embarqués au sein des outils d'accessibilité, sonnent encore très synthétiques.

Ces derniers reposent sur l'enregistrement de personnes avec une combinaison de mots calqués sur la reconnaissance textuelle. Il y a eu les travaux visant à enchainer les mots les uns après les autres (Concatenative TTS) et puis ceux visant à synthétiser la diction (Parametric TTS).

Mais Google a mis au point son projet WaveNet, lequel repose sur un réseau de neurones artificiels. WaveNet est capable d'apprendre plus de 16 000 sons par seconde pour peaufiner la diction et générer des modèles prédictifs de sons à venir en fonction des précédents.

035C000008210664-photo-intelligence-artificielle-artificial-ai-ia-ban.jpg


Il en résulte alors une intonation plus naturelle proche de celle qu'un humain pourrait avoir en lisant les mêmes textes. Voici ci-dessous en anglais les différences observées :

Guillaume Belfiore

Lead Software Chronicler

Lead Software Chronicler

Responsable du développement éditorial sur la partie Logiciel et Services Web sur Clubic. Précédemment journaliste, je traitais l'actualité web et mobile au sens large. Je m'intéressais aux entrailles...

Lire d'autres articles

Responsable du développement éditorial sur la partie Logiciel et Services Web sur Clubic. Précédemment journaliste, je traitais l'actualité web et mobile au sens large. Je m'intéressais aux entrailles des navigateurs web, aux nouveaux smartphones mais aussi aux systèmes d'exploitation, aux questions de sécurité ou à l'actualité e-business en général. Sinon je dois avouer que j'ai un faible pour tout ce qui touche au web design et c'est généralement le code source d'une page web que je lis en premier.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires

Haut de page