Proposer un moteur de recherche alternatif quand le leader détient 90% de part de marché à l'international, c'est un pari risqué. Mais quand en plus on choisit de développer son propre index de manière indépendante, cela devient un tour de force. C'est pourtant la décision prise par l'éditeur du navigateur Brave avec Brave Search.
Il y a quelques semaines, DuckDuckgo nous expliquait pouvoir franchir la barre des 50 milliards de requêtes par an d'ici à 2028. Brave semble être sur la même voie. Mais, contrairement aux autres moteurs tentant de rivaliser avec Google avec diverses API tierces, Brave développe son propre index en misant davantage sur la qualité. Josep M. Pujol, Chief of Search chez Brave Software, a accepté de répondre à quelques-unes de nos questions en revenant sur les défis de ce pari.
Avec 20 milliards de requêtes de recherche par an, comment Brave Search prévoit-il d'atteindre le seuil symbolique des 50 milliards pour rivaliser avec les volumes de Bing? Quelles sont vos projections pour les trois prochaines années ?
Josep M. Pujol : En novembre 2025, on est à 20 milliards, en novembre 2024, c'était 13 milliards, et en novembre 2023, c'était 9 milliards. Nous avons connu une croissance d'environ 40 à 50 % par an en termes de requêtes traitées, sans compter l'utilisation des API de recherche. Dans un peu plus de deux ans, nous devrions atteindre le volume de Bing. Donc pour nous, il s'agit de continuer à faire ce que nous faisons. Bien sûr, le paysage de la recherche est en pleine mutation, avec les réponses générées par l'IA, la recherche agentique, les nouveaux acteurs qui ajoutent une couche d'IA aux résultats de recherche sur le Web et les litiges en cours en matière de droits d'auteur. Je n'oserais pas prédire où nous en serons dans trois ans, mais une chose est sûre : nous continuerons à offrir la meilleure recherche possible à tout le monde, c'est-à-dire à la fois aux utilisateurs et aux autres entreprises qui en ont besoin.
Contrairement à DuckDuckGo, qui s'appuie en partie sur Bing - ce que vous ne manquez pas de nous rappeler régulièrement :) - vous disposez d'un index indépendant de 30 milliards de pages. Comment votre projet Web Discovery vous permet-il de capturer du contenu que Google et Bing ne trouvent pas ? Pouvez-vous donner des exemples concrets ?
J.M.P : Notre index compte désormais plus de 35 milliards de pages. Cependant, la taille de l'index est un indicateur de qualité assez médiocre, car la plupart du Web est remplie de spam et de contenus dupliqués ou obsolètes, ce dont nous ne voulons pas et que nous n'indexons généralement pas. Dans l'apprentissage automatique (ainsi que dans les grands modèles linguistiques d'IA), il existe un problème de "garbage in, garbage out" (si l'on entre des données erronées, on obtient des résultats erronés). Alimenter les modèles avec de "mauvaises données" réduit leur précision. Le projet Web Discovery de Brave est notre approche pour séparer le bon grain de l'ivraie sur le Web, afin que notre index de recherche contienne le moins de bruit possible. Cela contribue à améliorer la qualité et à réduire les coûts d'infrastructure et de calcul.
Face à Qwant, qui peine à s'imposer en Europe, et à Ecosia, qui mise sur l'écologie, quelle est votre stratégie pour vous positionner comme l'alternative européenne de référence au-delà de la simple promesse de confidentialité ?
J.M.P : Il existe une différence de qualité entre Qwant/Ecosia et Brave : nous disposons de notre propre index de recherche, que nous exploitons nous-mêmes et qui peut fonctionner sans tiers pour toutes les requêtes. Il semble que nous ayons bien fait de souligner la dépendance de DDG à Bing, comme vous l'avez dit, mais c'est aussi vrai pour ses homologues européens. Dans ces cas-là, ils s'appuient sur Google, car Bing semble se livrer à des manœuvres étranges avec ses partenaires de longue date.
Outre notre propre index, la proposition de valeur de Brave en matière de confidentialité Search est également très importante. Sur des services équivalents, nous pensons que les gens préfèrent une option plus privée. La mission de Brave est de créer une pile technologique qui réponde à la condition préalable "service équivalent" afin que les gens puissent opter pour la confidentialité sans avoir à sacrifier la commodité ou la qualité. Nous pensons être en bonne voie pour atteindre cet objectif, tant pour la recherche que pour notre navigateur, d'où la croissance soutenue que nous connaissons. Mais le monde ne cesse d'évoluer et c'est vraiment une cible mouvante. Reste que nous sommes là et nous continuons à nous développer, en faisant ce que nous pensons être le mieux pour les utilisateurs.
NDLR :
- Microsoft a fermé les API de Bing cet été, laissant certains partenaires sur le carreau.
- Qwant et Ecosia développent eux-aussi leur propre index depuis peu
- DuckDuckGo dispose aussi de son propre index en parallèle.
L'effet DMA en Europe s'est traduit par une augmentation de 50% des installations d'applications sur iOS. Comment comptez-vous tirer parti de cette dynamique ? Disposez-vous de données sur les taux de rétention de ces nouveaux utilisateurs européens ?
J.M.P : Au cours du premier semestre 2024, lors des premières vagues d'écrans de choix dans l'UE, Brave a mené des promotions ciblant les utilisateurs mobiles afin de préparer les consommateurs à choisir leur navigateur par défaut. Étant donné que Brave se développe principalement de manière organique grâce au bouche-à-oreille, l'écran de choix de la DMA a permis à un plus grand nombre de consommateurs de découvrir Brave, et cela a stimulé l'acquisition globale. Cette augmentation du nombre de nouveaux utilisateurs, soutenue par une forte croissance organique, a entraîné une accélération du taux de croissance des utilisateurs actifs quotidiens dans l'UE.
Vous affichez un ratio de 0,42 entre le nombre d'utilisateurs uniques actifs par jour et le nombre d'utilisateurs uniques actifs mensuels. Vous avez donc un engagement élevé. Mais comment ce ratio évolue-t-il selon les régions ? L'Europe présente-t-elle des tendances différentes de celles des États-Unis ?
J.M.P : En 2025, le ratio DAU/MAU est de 0,42 à l'échelle mondiale, ce qui signifie que 42% des utilisateurs actifs mensuels (MAU) de Brave sont actifs chaque jour. et cela souligne l'adéquation de notre produit/marché. En ce qui concerne les États-Unis et l'Europe, ces deux marchés sont assez similaires et affichent tous deux un engagement supérieur à la moyenne par rapport à notre ratio mondial.
Brave Search prend actuellement en charge l'anglais, le français, l'allemand et l'Espagnol. Quels sont vos critères pour ajouter de nouvelles langues ? Le chinois ou le japonais sont-ils prioritaires ?
J.M.P : Le japonais n'est pas pris en charge , ce qui signifie que les utilisateurs locaux peuvent utiliser Brave Search, mais le moteur de recherche n'est pas configuré par défaut sur ce marché. À ce jour, les pays dans lesquels nous pensons être suffisamment performants pour être le moteur de recherche par défaut sont les États-Unis, le Canada, le Royaume-Uni, la France, l'Allemagne, l'Espagne, l'Italie, l'Autriche, l'Inde, le Mexique, le Brésil, l'Argentine et l'Australie.
Cela dit, Brave Search peut être utilisé dans n'importe quel pays et dans n'importe quelle langue, mais la qualité peut varier en fonction de la taille de la population (qui influe sur le projet Web Discovery) ainsi que du marché potentiel. Par exemple, le navigateur Brave n'est pas disponible en Chine continentale, donc même si la population y est très importante, nous avons très peu d'utilisateurs dans ce pays. Il existe également des problèmes techniques : nous sommes moins performants pour les alphabets non latins en raison du biais de nos modèles entraînés. Parmi les autres facteurs, il y a aussi la difficulté de l'exploration. Quand certains domaines sont très axés sur un pays cela rend très difficile l'exploration des pages en dehors de ce dernier. Au final, la prise en charge des pays est entièrement basée sur la qualité mesurée. Mais l'objectif est de tous les prendre en charge.
Comment optimisez-vous la pertinence des résultats pour les requêtes locales ? Par exemple, pour une recherche sur "restaurant italien" depuis Lyon ou depuis New York ?
J.M.P : Nous prenons en compte la localisation de l'utilisateur, explicite ou implicite (avec son autorisation). Par ailleurs, de nombreuses pages peuvent être géolocalisées. On peut donc obtenir des résultats de recherche localisés comme dans votre exemple.
Votre index de 30 milliards de pages inclut-il un équilibre géographique intentionnel ou reflète-t-il naturellement la distribution du contenu web ? Comment évitez-vous les biais en faveur de la langue anglaise ?
J.M.P : Nous n'avons pas mis en place de correction des biais, nous sommes presque entièrement guidés par la "popularité des pages", laquelle est dérivée du Web Discovery Project. Une partie de l'index est tirée d'une liste de quelques centaines de flux sélectionnés, couvrant principalement l'actualité et les événements sensibles au facteur temps comme le sport, etc.
Votre API Brave Search alimente "certains des plus grands LLM au monde". Pouvez-vous révéler lesquels ? Comment conciliez-vous cette monétisation B2B avec votre mission de protection de la vie privée ?
J.M.P : Je ne vais pas être en mesure d'énumérer les LLM :-) mais je peux vous dire que l'API Brave Search fournit déjà à la plupart des 10 meilleurs LLM IA des données de recherche Web en temps réel. Pour certains d'entre eux, Brave est en fait le seul moteur de recherche qui prend en charge leurs réponses IA.
La monétisation des API B2B est totalement indépendante des utilisateurs de Brave (recherche et navigateur). À cet égard, c'est un modèle parfait, car la monétisation ne dépend pas de l'attention des utilisateurs, contrairement aux publicités Brave Search, où ces derniers font partie intégrante du système. Je tiens à souligner que les publicités Brave Search préservent totalement la confidentialité et qu'aucun suivi ou profilage n'est possible.
Avec Answer with Al générant 15 millions de réponses par jour, utilisez- vous exclusivement Llama et Qwen, ou explorez-vous d'autres modèles ? Envisagez-vous un partenariat avec l'entreprise européenne Mistral AI ?
J.M.P : Nous sommes ouverts à l'utilisation de n'importe quel modèle tant qu'il dispose de poids ouverts. C'est une condition indispensable, car nous ne voulons pas envoyer les requêtes des utilisateurs à des tiers. Les modèles sont donc toujours exécutés dans nos locaux. En fait, nous utilisons un ensemble de modèles pour différentes tâches/types de requêtes.
Par conséquent, un partenariat de verrouillage de modèle n'a pas de sens, car nous sommes limités à ce qui est disponible publiquement. Nous utilisons donc les LLM de manière assez opportuniste, en choisissant ceux qui obtiennent les meilleurs résultats lors de nos tests, tant en termes de qualité que de coûts d'inférence.
Votre service Al Grounding affiche un score F1 de 94,1 % sur SimpleQA contre 85.5% pour Sonar Pro chez Perplexity. Qu'en pensez-vous ?
J.M.P : Je ne m'attarderais pas trop sur ce chiffre, car l'évaluation de la qualité est en réalité très nuancée et compliquée. De telles évaluations valent mieux que rien, mais ne constituent pas une réponse définitive.
Selon nous, la principale conclusion de cette évaluation est que même les petits modèles à poids ouvert comme la famille Qwen3 (30B et 235B) peuvent obtenir des résultats de pointe lorsqu'ils sont alimentés par les données appropriées pour l'inférence.
Vos annonces de recherche ont explosé de 1500 % en 2024. Comment comptez-vous convaincre les annonceurs français et européens, traditionnellement plus prudents que leurs homologues américains ?
J.M.P : Notre trafic dans Brave Search est purement incrémental (c'est-à-dire que vous ne pouvez pas obtenir ce trafic auprès de Google, Bing, Qwant ou d'autres). Nous proposons également un test gratuit aux annonceurs qui mettent actuellement leur argent chez Google afin qu'ils puissent tester par eux-mêmes avant de payer.
Avec plus de la moitié des 20 plus grands annonceurs mondiaux comme clients, comment maintenez-vous votre promesse de confidentialité tout en offrant un ciblage efficace ?
J.M.P : La publicité sur les moteurs de recherche ne pose pas les problèmes de confidentialité liés à la publicité programmatique. Nous ne savons pas qui clique sur quoi et les annonceurs ne vous connaissent que si vous finissez par acheter quelque chose et que vous leur communiquez votre adresse pour la livraison. Nous n'avons pas besoin de profils ou d'éléments similaires pour cibler les publicités sur les moteurs de recherche : tout repose sur la requête.
Si Brave Search atteignait 5% de part de marché mondiale, cela changerait-il fondamentalement votre approche éditoriale ? Comment préserveriez-vous votre indépendance face aux pressions commerciales et politiques ?
J.M.P : Personnellement, je suis convaincu qu'aucune institution humaine ne peut résister à la corruption si elle est soumise à une pression suffisante. Nous ne pouvons donc pas garantir que les mêmes valeurs seront maintenues à perpétuité. En fait, personne ne peut le garantir, quel que soit le nombre de contrôles et de restrictions mis en place. Ce que nous pouvons offrir, cependant, c'est notre histoire et nos antécédents : depuis notre création, nous n'avons jamais fait de compromis en matière de confidentialité au profit de la commodité ou de la monétisation. Nous avons consciemment choisi de suivre la voie difficile et longue de la construction, et de créer un système qui tient compte de la confidentialité. Par conséquent, si nous avions voulu "vendre", l'action rationnelle aurait été de le faire plus tôt, car il y a eu des moments où des pressions ou des besoins financiers se sont fait sentir dans le passé.
Nous proposons également Goggles, nos filtres de classement communautaires basés sur notre index. Goggles permet aux communautés d'intérêt de créer leurs propres moteurs de recherche personnalisés pour répondre à des cas d'utilisation que nous ne pouvons pas prévoir ou prendre en charge. Nous pensons que la recherche est trop importante pour être gardée sous clé et que Goggles est la meilleure approche pour la rendre ouverte et accessible, afin de lutter contre les préjugés et la censure, et de favoriser l'innovation.
💬 À la rencontre de la tech
Au-delà des actualités et des tests, nous avons discuté avec les leaders de la Silicon Valley et les startups en pleine croissance à travers le monde pour mieux comprendre leurs enjeux, leurs visions et leurs valeurs. Découvrez comment ces acteurs clés façonnent l'avenir des technologies.