Speller100 : le correcteur orthographique de Microsoft pour 100 langues basé sur l'IA

Guillaume Belfiore
Lead Software Chronicler
11 février 2021 à 12h15
0
Bing © QZ.com

Microsoft souhaite optimiser la saisie des requêtes au sein de son moteur de recherche Bing. Pour ce faire, l'entreprise a développé un correcteur orthographique multilingue.

Baptisé Speller100, l'outil est capable de prendre en charge pas moins d'une centaine de langues et a été optimisé avec des algorithmes d'intelligence artificielle.

L'orthographe au cœur de Bing

Bien que la part de marché de Bing soit moindre comparée à celle de Google, l'entreprise entend retourner des résultats plus pertinents. Toutefois, au-delà de la qualité de son index, la société explique qu'assez régulièrement les requêtes des internautes seraient mal orthographiées.

Plus précisément, Microsoft explique que 15% des mots-clés présenteraient une faute. De fait, l'expérience utilisateur sur la page des résultats s'en trouve affectée et l'internaute n'obtient pas d'emblée la réponse à sa question. Jingwen Lu, Jidong Long et Rangan Majumder, respectivement Responsable du département des sciences appliquées, Ingénieur logiciel et Vice-président, expliquent ainsi :

« La correction orthographique est le tout premier composant dans le développement d'une requête sur Bing parce que déterminer la bonne orthographe pour la requête de l'utilisateur entraîne une amélioration de tous les composants de la chaîne de recherche ».

bing

Plus de langues pour plus d'interactions

Auparavant, la correction orthographique ne portait que sur une douzaine de langues. Désormais, celle-ci s'applique à plus d'une centaine. Les algorithmes ont été entraînés par des contenus publiés sur le Web et grâce aux retours des utilisateurs. Cependant, ce modèle ne se révèle performant que pour langues les plus utilisées sur la Toile.

Pour mettre au point Speller100, Microsoft s'est intéressée aux origines d'une langue et a dressé des familles afin de corréler certaines similarités. Par ailleurs, la société communique sur le concept Zero shot learning : ce dispositif permet à l'algorithme d'apprendre immédiatement l'orthographe d'un mot sans devoir être entraîné par une source de données au préalable.

« Imaginez que quelqu'un vous apprenne à épeler en anglais, et automatiquement, vous apprenez également à épeler en allemand, en néerlandais, en afrikaans, en écossais ou en luxembourgeois ».

Ces efforts ont permis de réduire de 30% le nombre de pages retournées sans aucun résultat. La société a également observé davantage d'interactions sur les suggestions de corrections orthographiques ou encore sur le nombre de clics enregistrés sur les pages des résultats.

Source : Microsoft

Guillaume Belfiore

Lead Software Chronicler

Lead Software Chronicler

Je suis rédacteur en chef adjoint de Clubic, et plus précisément, je suis responsable du développement éditorial sur la partie Logiciels et Services Web.

Lire d'autres articles

Je suis rédacteur en chef adjoint de Clubic, et plus précisément, je suis responsable du développement éditorial sur la partie Logiciels et Services Web.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires

Haut de page

Sur le même sujet