Un nouvel algorithme baptisé BERT devrait aider Google à mieux répondre aux requêtes des internautes

28 octobre 2019 à 15h18
0
Google Search

D'après Google, l'algorithme BERT (pour « Bidirectional Encoder Representations from Transformers ») serait « la plus grande amélioration du Search depuis cinq ans, et l'un des plus grands bons en avant de l'histoire du moteur de recherche ».

Si cette amélioration ne doit finalement concerner qu'une requête sur dix, elle met en place une meilleure compréhension de la linguistique.

Requêtes et contextes

Ce nouvel algorithme, mis au point par le géant américain au cours de la dernière décennie, doit permettre de mieux comprendre ce que recherche l'utilisateur grâce à des techniques de traitement automatique du langage naturel (TALN, aussi appelé ingénierie linguistique).

Sur le blog de Google, Pandu Nayak, vice-président du secteur de recherche du groupe, donne des exemples explicitant ce gain de sens. Il prend l'exemple de la recherche : « Peut-on aller chercher les médicaments de quelqu'un d'autre à la pharmacie ? ». Jusque-là, Google repérait les termes-clés de la requête. Ici, il s'agit essentiellement de « médicaments » et de « pharmacie ». Ensuite, il renvoyait avant tout des sites génériques liés à ces mots-clés : le fonctionnement d'une ordonnance, par exemple.

Selon Pandu Nayak, le moteur de recherche doit désormais considérer la phrase comme un ensemble, et comprendre son contexte. Dans l'exemple, la mention « de quelqu'un d'autre » est importante. Avec ce nouvel algorithme, Google renverra des résultats indiquant si un ami ou un membre de la famille peut retirer les médicaments d'un proche en pharmacie. Le moteur de recherche sera donc en mesure de dégager le sens global d'une phrase.

« Le problème de la recherche n'est pas résolu »

Dans un premier temps, cette amélioration devrait concerner environ 10 % des requêtes faites sur Google, et ne sera accessible qu'aux recherches anglophones. Mais Pandu Nayak envisage déjà les autres langues : « Nous essayons de mettre en place l'algorithme BERT pour améliorer le moteur dans le reste du monde. Une caractéristique intéressante sur ces systèmes réside dans leur apprentissage continu d'une langue, ce qui permet d'appliquer leurs enseignements à d'autres. Nous pouvons réaliser des modèles tirés d'améliorations de l'anglais (une langue concernant une grande majorité du contenu Web) et les appliquer à d'autres langues ».

Le vice-président désigne comme un « défi permanent » cette question de la linguistique, chaque langue conservant ses spécificités. Il admet que BERT doit encore évoluer et apprendre : « Vous poserez encore des énigmes à Google de temps en temps », dit-il.

D'après Google, le nouvel algorithme aurait été mis en place récemment. Les responsables du moteur de recherche ont déclaré que cette amélioration ne redirigerait pas fondamentalement le trafic Web. Néanmoins, chaque modification du moteur, même légère, est systématiquement scrutée par les professionnels. Pour citer The Verge, « des compagnies ont vécu et sont mortes suite à des changements dans le référencement de Google ».

Source : Blog Google
Modifié le 28/10/2019 à 15h39
1
2
Partager l'article :
Voir tous les messages sur le forum

Les actualités récentes les plus commentées

Coronavirus : Bill Gates va faire construire des usines pour fabriquer les 7 vaccins les plus prometteurs
Comment fonctionne la nouvelle attestation de déplacement sur smartphone ?
PS5 : Sony dévoile la manette DualSense
Coronavirus : comment l'Iran et l'Espagne gèrent la crise d'un point de vue technologique
En pleine pandémie de COVID-19, Trump menace de ne plus financer l'OMS
Disney+ : pas de 4K ni d'Ultra-HD au lancement pour le concurrent de Netflix
Quatre ans après leur sortie, les Samsung Galaxy S7 ne seront plus mis à jour
Blue Origin pousse ses employés à développer une fusée touristique malgré le coronavirus
COVID-19 : Lamborghini aussi se met à produire du matériel médical
Yamaha présente trois amplificateurs rétro et des enceintes pour les audiophiles
scroll top