Avec 20 milliards de requêtes de recherche par an, comment Brave Search prévoit-il d'atteindre le seuil symbolique des 50 milliards pour rivaliser avec les volumes de Bing? Quelles sont vos projections pour les trois prochaines années ?

Josep M. Pujol : En novembre 2025, on est à 20 milliards, en novembre 2024, c'était 13 milliards, et en novembre 2023, c'était 9 milliards. Nous avons connu une croissance d'environ 40 à 50 % par an en termes de requêtes traitées, sans compter l'utilisation des API de recherche. Dans un peu plus de deux ans, nous devrions atteindre le volume de Bing. Donc pour nous, il s'agit de continuer à faire ce que nous faisons. Bien sûr, le paysage de la recherche est en pleine mutation, avec les réponses générées par l'IA, la recherche agentique, les nouveaux acteurs qui ajoutent une couche d'IA aux résultats de recherche sur le Web et les litiges en cours en matière de droits d'auteur. Je n'oserais pas prédire où nous en serons dans trois ans, mais une chose est sûre : nous continuerons à offrir la meilleure recherche possible à tout le monde, c'est-à-dire à la fois aux utilisateurs et aux autres entreprises qui en ont besoin.

Contrairement à DuckDuckGo, qui s'appuie en partie sur Bing - ce que vous ne manquez pas de nous rappeler régulièrement :) - vous disposez d'un index indépendant de 30 milliards de pages. Comment votre projet Web Discovery vous permet-il de capturer du contenu que Google et Bing ne trouvent pas ? Pouvez-vous donner des exemples concrets ?

J.M.P : Notre index compte désormais plus de 35 milliards de pages. Cependant, la taille de l'index est un indicateur de qualité assez médiocre, car la plupart du Web est remplie de spam et de contenus dupliqués ou obsolètes, ce dont nous ne voulons pas et que nous n'indexons généralement pas. Dans l'apprentissage automatique (ainsi que dans les grands modèles linguistiques d'IA), il existe un problème de "garbage in, garbage out" (si l'on entre des données erronées, on obtient des résultats erronés). Alimenter les modèles avec de "mauvaises données" réduit leur précision. Le projet Web Discovery de Brave est notre approche pour séparer le bon grain de l'ivraie sur le Web, afin que notre index de recherche contienne le moins de bruit possible. Cela contribue à améliorer la qualité et à réduire les coûts d'infrastructure et de calcul.