Cloudflare, le géant de l'infrastructure web, accuse ouvertement Perplexity AI d'employer des méthodes pour contourner les blocages de collecte de données.

- Cloudflare accuse Perplexity AI de contourner les blocages de collecte de données, menaçant la confiance sur le web.
- Perplexity AI se défend, affirmant que ses agents collectent des données uniquement sur demande, rejetant les accusations.
- La controverse soulève des questions sur la capacité du web à distinguer entre IA légitime et robots malveillants.
Le torchon brûle entre Cloudflare, géant de l'infrastructure et de la sécurité web, et Perplexity AI, le moteur de recherche conversationnel en pleine ascension. Dans une note de blog détaillée, Cloudflare affirme que Perplexity utilise des techniques de crawling (ou moissonnage de données) furtives pour contourner les interdictions mises en place par les administrateurs de sites web. Cette affaire éclate alors que la start-up, valorisée à plusieurs milliards, suscite un intérêt marqué dans la tech, au point que des rumeurs persistantes évoquent un possible rachat par Apple pour renforcer ses propres ambitions en matière d'IA.

- Sources mises en avant
- Fraicheur des résultats
- Envoi de fichiers pour traitement
L'accusation de Cloudflare : des méthodes de contournement systématiques
L'acte d'accusation de Cloudflare est sans détour : Perplexity bafouerait délibérément un pacte de non-agression tacite du web. Le service ignorerait les instructions du fichier robots.txt, ce code de bonne conduite qui indique aux robots les zones d'un site à ne pas visiter. Pour contourner ces barrières, Perplexity adopterait une véritable panoplie de dissimulation numérique, un comportement jugé indigne d'un acteur majeur.
La tactique principale serait celle du déguisement. Lorsqu'un site lui claque la porte au nez, le service abandonnerait son identité officielle de « PerplexityBot » pour se faire passer pour un visiteur humain lambda, utilisant un user-agent de navigateur Chrome. Cette mascarade est couplée à une stratégie d'évasion, où ses robots, tels des caméléons, changent constamment d'adresse IP pour échapper au blocage, rendant la parade quasi impossible pour les administrateurs. Face à ce manège, Cloudflare a sifflé la fin de la partie en retirant Perplexity de sa liste de « gentils robots ».
La riposte de Perplexity : la défense de l'agent (pas si) secret
Face au tollé, la startup contre-attaque et plaide le malentendu technique, balayant l'affaire d'un revers de main comme un simple « coup de publicité » de la part de Cloudflare. Perplexity se défend d'être un crawler boulimique aspirant le web sans discernement. Elle met en avant ses « agents pilotés par l'utilisateur », des entités conçues pour ne collecter de l'information qu'à la demande expresse d'un internaute, agissant comme un coursier ponctuel plutôt qu'un pilleur systématique.
La firme va même jusqu'à retourner l'accusation, suggérant que Cloudflare a pointé le mauvais coupable, attribuant à Perplexity un trafic qui ne lui appartiendrait pas. Selon elle, cette affaire expose surtout l'incapacité de l'infrastructure web actuelle à faire la part des choses entre un assistant IA légitime et un robot malveillant. Cette défense se heurte toutefois à un passif déjà chargé, Perplexity ayant été épinglée par le passé pour des pratiques de scraping jugées trop proches du plagiat par plusieurs médias. Le doute s'installe, et la startup se retrouve à devoir défendre bien plus que ses méthodes : sa crédibilité.
Source : Cloudfare