Speller100 : le correcteur orthographique de Microsoft pour 100 langues basé sur l'IA

11 février 2021 à 12h15
0

Microsoft souhaite optimiser la saisie des requêtes au sein de son moteur de recherche Bing. Pour ce faire, l'entreprise a développé un correcteur orthographique multilingue.

Baptisé Speller100, l'outil est capable de prendre en charge pas moins d'une centaine de langues et a été optimisé avec des algorithmes d'intelligence artificielle.

L'orthographe au cœur de Bing

Bien que la part de marché de Bing soit moindre comparée à celle de Google, l'entreprise entend retourner des résultats plus pertinents. Toutefois, au-delà de la qualité de son index, la société explique qu'assez régulièrement les requêtes des internautes seraient mal orthographiées.

Plus précisément, Microsoft explique que 15% des mots-clés présenteraient une faute. De fait, l'expérience utilisateur sur la page des résultats s'en trouve affectée et l'internaute n'obtient pas d'emblée la réponse à sa question. Jingwen Lu, Jidong Long et Rangan Majumder, respectivement Responsable du département des sciences appliquées, Ingénieur logiciel et Vice-président, expliquent ainsi :

« La correction orthographique est le tout premier composant dans le développement d'une requête sur Bing parce que déterminer la bonne orthographe pour la requête de l'utilisateur entraîne une amélioration de tous les composants de la chaîne de recherche ».

Plus de langues pour plus d'interactions

Auparavant, la correction orthographique ne portait que sur une douzaine de langues. Désormais, celle-ci s'applique à plus d'une centaine. Les algorithmes ont été entraînés par des contenus publiés sur le Web et grâce aux retours des utilisateurs. Cependant, ce modèle ne se révèle performant que pour langues les plus utilisées sur la Toile.

Pour mettre au point Speller100, Microsoft s'est intéressée aux origines d'une langue et a dressé des familles afin de corréler certaines similarités. Par ailleurs, la société communique sur le concept Zero shot learning : ce dispositif permet à l'algorithme d'apprendre immédiatement l'orthographe d'un mot sans devoir être entraîné par une source de données au préalable.

« Imaginez que quelqu'un vous apprenne à épeler en anglais, et automatiquement, vous apprenez également à épeler en allemand, en néerlandais, en afrikaans, en écossais ou en luxembourgeois ».

Ces efforts ont permis de réduire de 30% le nombre de pages retournées sans aucun résultat. La société a également observé davantage d'interactions sur les suggestions de corrections orthographiques ou encore sur le nombre de clics enregistrés sur les pages des résultats.

Source : Microsoft

Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0

Actualités récentes

Bon plan : un écran PC Acer gaming 23,6
Qualcomm tente de se créer une communauté d'Insiders
Le Google Pixel 5a sortirait en juin, de nouveaux Pixel Buds en avril
Apple : le casque AR à 1000 dollars d'ici 2022, les smart glasses en 2025 selon Kuo
Vous ne pourrez pas espionner quelqu'un en plaçant un AirTag dans sa poche
Spielberg et les créateurs de Stranger Things vont adapter The Talisman de Stephen King en série sur Netflix
Apple abandonne la production de l'iMac Pro
Bouygues Telecom augmente encore le prix de certains forfaits B&You
Le rachat de Bethesda par Microsoft approuvé par les autorités de la concurrence européenne et américaine
Le fondateur d'OVHcloud veut racheter Shadow
Haut de page