Les astuces pour la recherche avancée sur Google

Frédéric Cuvelier
20 novembre 2007 à 16h51
0

Google, les robots, les index, le PageRank

En informatique (et pas seulement d'ailleurs), savoir se servir efficacement de quelque chose nécessite souvent de l'avoir préalablement compris ! Le moteur de recherche illustre bien cette idée, car si l'expérience peut apporter de bons réflexes, elle ne remplace pas la connaissance du fonctionnement de l'outil. Commençons donc par expliquer le principe du moteur de recherche en général, et celui de Google en particulier.

La valeur d'un moteur de recherche se juge sur deux critères principaux :
  • sa capacité à rassembler une base de données la plus importante possible, c'est-à-dire à référencer un maximum de pages. Plus ce nombre est important, plus le moteur aura de choix pour vous apporter la réponse la plus adéquate à votre recherche.
  • la pertinence des résultats de la recherche, c'est-à-dire l'adéquation entre les pages proposées par le moteur et la recherche formulée. Cette pertinence va dépendre de deux facteurs : la façon dont le moteur gère la syntaxe des requêtes (c'est-à-dire la façon dont on pose la question au moteur : un ou plusieurs mots, une expression...) et l'ordre d'affichage des résultats, puisque les liens les plus pertinents doivent être accessibles rapidement (dans les 20 premiers résultats par exemple).
Trois étapes caractérisent le fonctionnement d'un moteur de recherche : l'exploration, l'indexation et la recherche forment l'arsenal technique créé pour répondre aux problématiques posées juste avant.
  • L'exploration (ou crawl) :
    0096000000662428-photo-google-bot.jpg
Des robots d'indexation parcourent le Web et suivent les liens trouvés récursivement. Les GoogleBots (les robots de Google), implantés dans les milliers de serveurs de la compagnie, visitent ainsi un maximum de pages Web, en analysent la structure et suivent les liens vers les autres pages Web pour construire une carte la plus complète possible du réseau mondial.
  • L'indexation :
0078000000662446-photo-indexation.jpg
Au cours de cette exploration, le moteur va extraire les mots considérés comme significatifs (pratiquement tous) correspondant à chaque ressource. Ceux-ci sont alors enregistrés dans une base de données. Les termes non significatifs s'appellent des mots vides. Ce premier critère de jugement distingue déjà les moteurs de recherche entre eux, même si ce n'est pas ici que la différence est la plus marquée.
  • La réponse aux requêtes :
Ce sont les deux étapes précédentes qui permettent à Google de vous apporter une réponse. Mais celle-ci doit être la plus pertinente possible. C'est ici qu'intervient un algorithme, qui va donner un poids (et même une valeur) aux différentes pages. Le but est de pouvoir présenter les résultats par ordre de pertinence vis-à-vis de votre recherche. C'est cet algorithme qui constitue la plus grande différence entre les divers moteurs de recherche.

Pour établir ce degré de pertinence, on peut se baser sur plusieurs critères différents :
  • le pourcentage, dans une page, de mots correspondants à votre recherche,
  • le nombre de fois qu'un de vos mots-clés apparaît dans la page,
  • la présence du mot demandé dans le titre du document,
  • sa présence dans l'adresse de la page,
  • sa présence dans le texte de la page, en considérant sa place dans la page, ses attributs (taille des caractères, gras, souligné),
  • sa présence dans certains champs ajoutés par le concepteur dans la partie invisible de la page (balises « Meta »). Ce critère, utilisé de façon abusive par certains webmasters, a vu son importance nettement amoindrie.
00C8000000662430-photo-algorithme-pagerank.jpg
L'algorithme de Google comporte une particularité supplémentaire, celle de faire appel au PageRank, sorte de formule de pertinence qui a fait le succès de ce moteur de recherche. Sans entrer dans les détails que pourrait comporter un article sur le référencement, nous pouvons résumer le principe du PageRank ainsi : Google évalue le degré de pertinence d'une page en fonction du nombre d'autres pages qui redirigent vers elle. La qualité d'une page est alors mise en avant, et Google donne une note de 0 à 10 pour la page évaluée. Plus la page aura une note élevée, plus elle aura de chance de figurer en haut de liste lors de l'une de vos recherches. C'est ce principe qui a permis à Larry Page et Sergei Brin (les deux concepteurs de Google) de proposer un moteur qui se démarquait de ceux qui existaient à la fin des années 90.

Pour ceux qui veulent en savoir plus sur cet algorithme et qui sont doués en algèbre linéaire, vous pouvez visiter cette page.
Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Actualités récentes

Abus de position dominante : la justice américaine ouvre une procédure contre Google
Control Ultimate Edition nécessite une connexion internet pour son installation sur Xbox
PAC-MAN est de retour pour ses 40 ans, avec 64 joueurs en simultané et en exclu Stadia
Salto : interface, contenus, fonctionnalités... promesses tenues ? Nos premières impressions en vidéo !
Coinbase publie son premier rapport sur la transparence
Forfait mobile : tout savoir des offres sur les forfaits 4G sans engagement
Halo The Master Chief Collection : un patch Xbox Series X | S dès novembre
Porsche fait évoluer la gamme Panamera, la Turbo S E-Hybrid frôle les 700 chevaux
Un forfait 4G avec 100 Go à moins de 10€, c'est possible !
Le lancement d’Ethereum 2.0 pourrait avoir lieu dans les 6 à 8 prochaines semaines
scroll top