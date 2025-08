L’une des principales forces de DragonV2.1 réside dans sa capacité à synthétiser un discours dans plus de 100 langues en n’utilisant que quelques secondes d’un échantillon vocal. Le modèle DragonV1 souffrait en effet de difficultés de prononciation, notamment avec les noms propres. Le nouveau modèle apporte des améliorations considérables à la sonorité des voix, « offrant une prosodie plus réaliste et stable tout en maintenant une meilleure précision de prononciation », selon Microsoft. Il démontre également une réduction du taux d’erreur de mot de 12,8% en moyenne par rapport à DragonV1.

Grâce à DragonV2.1, Microsoft ouvre la porte à une multitude d’applications. La technologie permet, par exemple, de personnaliser les voix des chatbots ou de doubler le contenu de vidéos dans différentes langues tout en conservant la voix originale de l’acteur.

Pour aller encore plus loin, l'outil offre un contrôle précis sur la prononciation et l’accent grâce à des balises SSML de phonèmes et des lexiques personnalisés. Pour faciliter la prise en main de cette fonctionnalité, le géant de Redmond a intégré plusieurs profils de voix pré-conçus baptisés Andrew, Ava et Brian, ces derniers étant disponibles pour tester la technologie.