Le nouvel algorithme Google BERT capable de mieux vous comprendre est disponible en français

09 décembre 2019 à 15h46
0
Google Search
© PK Studio / Shutterstock.com

Il y a quelques semaines, Google lançait un algorithme nommé BERT dans le but de permettre une meilleure compréhension des requêtes sur son moteur de recherche. À partir du 9 décembre, ce nouvel algorithme sera disponible dans 70 nouvelles langues, dont le français.

BERT (pour « Bidirectional Encoder Representations from Transformers ») est présenté par Google comme « la plus grande amélioration du Search depuis cinq ans ».

Plus proche du contexte

Le premier déploiement de BERT, qui a eu lieu fin octobre, n'a concerné que les requêtes exprimées en langue anglaise. Pandu Nayak, le vice-président de Google, avait alors expliqué le défi présenté par l'algorithme, qui doit comprendre un langage plus proche du parlé naturel. Dans un communiqué, il a ainsi déclaré : « Notre travail, consiste à comprendre ce que vous cherchez et à faire remonter l'information utile du Web, peu importe la façon dont vous avez écrit ou combiné les mots de votre requête. Mais parfois ça ne marche pas très bien, particulièrement pour des requêtes complexes ou conversationnelles. D'ailleurs, c'est l'une des raisons pour lesquelles les gens utilisent souvent des suites de "mots-clés", qu'ils pensent que l'on comprendra mieux. Mais ce n'est pas de cette manière qu'ils poseraient une question naturellement ».

La solution revient alors à considérer « des modèles qui traitent les mots en relation avec tous les autres mots d'une phrase, plutôt que l'un après l'autre ». En d'autres termes, de tenir compte d'un contexte. Par exemple, dans le cas de la requête « Faut-il un visa pour voyager du Brésil vers les Etats-Unis », le mot « vers » sera désormais pris en compte. L'algorithme comprendra ainsi que la question porte sur un voyage à destination des Etats-Unis, et non l'inverse.

Répondre aux besoins des enceintes naturelles

L'algorithme doit ainsi entendre un langage plus naturel, bien que Pandu Nayak admette lui-même que « ça ne marche pas toujours ». Il rappelle aussi que « la compréhension du langage reste un défi ». En outre, malgré l'extension de BERT à 70 nouvelles langues, l'amélioration ne devrait finalement concerner qu'une requête sur dix, la majorité de celles-ci étant souvent constituées uniquement de mots-clés.

Néanmoins, comme pointe le Monde, l'algorithme doit aussi répondre aux besoins des enceintes connectées, désormais achetées par un français sur dix. De fait, celles-ci reçoivent, le plus souvent, des requêtes formulées en langage naturel.

Le déploiement de BERT sera scruté par des professionnels, notamment du référencement sur Internet, celui-ci pouvant avoir un impact sur le chiffre d'affaires d'une entreprise. Google assure à ce propos que BERT n'aura pas d'impact considérable concernant les sites vers lesquels il renvoie.

Source : Le Monde
Modifié le 09/12/2019 à 20h20
6
7
Partager l'article :
Voir tous les messages sur le forum

Les actualités récentes les plus commentées

Windows 7 est mort ? Canonical vous invite à essayer Ubuntu
La vignette Crit'Air devient obligatoire pour les véhicules en vente ou en location
Reconnaissance faciale : l'Union européenne pourrait interdire la technologie pendant 5 ans
L'Europe veut uniformiser les chargeurs des smartphones, Apple prend les devants
L'UE dévoile son projet de
La 5G, une aberration écologique… et économique ?
OneWeb produit à présent deux satellites par jour !
Cyberpunk 2077 repoussé au mois de septembre
Une ONG accuse YouTube de favoriser la propagation de fake news sur le changement climatique
Un député LREM veut inscrire une référence aux Lois de la robotique dans la Constitution

Notre charte communautaire

1. Participez aux discussions

Nous encourageons chacun à exprimer ses idées sur les sujets qui l'intéressent, et à faire profiter l'ensemble de la communauté de son expertise sur un sujet particulier.

2. Partagez vos connaissances

Que vous soyez expert ou amateur passionné, partagez vos connaissances aux autres membres de la communauté pour enrichir le niveau d'expertise des articles.

3. Échangez vos idées

Donnez votre opinion en étayant votre propos et soyez ouverts aux idées des autres membres de la communauté, même si elles sont radicalement différentes des vôtres.

4. Faites preuve de tolérance

Qu'il s'agisse de rédacteurs professionnels ou amateurs, de lecteurs experts ou passionnés, vous devez faire preuve de tolérance et vous placer dans une démarche d'entraide.

5. Restez courtois

Particulièrement lorsque vous exprimez votre désaccord, critiquez les idées, pas les personnes. Évitez à tout prix les insultes, les attaques et autres jugements sur la forme des messages.

6. Publiez des messages utiles

Chaque participation a vocation à enrichir la discussion, aussi les partages d'humeurs personnelles ne doivent pas venir gêner le fil des échanges.

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

8. Respectez le cadre légal

Ne publiez pas de contenus irrespectueux, racistes, homophobes, obscènes ou faisant l'apologie de courants radicaux, qu'ils soient politiques ou religieux. N'utilisez pas plusieurs comptes utilisateurs.

9. Ne faites pas de promotion

Ne profitez pas d'une discussion pour faire la publicité d'un produit, d'un service ou même de votre site web personnel.

10. Ne plagiez pas

Exprimez uniquement vos opinions ou partagez des idées en citant vos sources.

scroll top