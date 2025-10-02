L'API de Perplexity repose sur une architecture multicouche. Le système combine un stockage de plus de 400 pétaoctets de données "chaudes" avec des modèles d'apprentissage automatique. Ces derniers prédisent l'importance des URL en fonction de critères comme la fréquence de mise à jour. Cette infrastructure indexe des centaines de milliards de pages web en traitant les mises à jour à un rythme de dizaines de milliers par seconde.

Le processus de récupération s'effectue en plusieurs étapes : une récupération hybride initiale génère des candidats, un préfiltrage élimine les contenus non pertinents, puis un classement progressif applique des modèles lexicaux, sémantiques et des cross-encodeurs. Ces derniers sont capables de comparer la requête et un extrait de texte pour vérifier précisément s’ils correspondent, et si la réponse est adaptée. Cette approche permet d'obtenir une latence médiane de 358 millisecondes, nettement inférieure aux 1375 millisecondes d'alternatives comme Exa.

Le module de compréhension est capable de découper chaque page web en fragments. De cette manière, l'IA peut s’adapter à la structure de chaque site et, même si elle ne peut pas analyser un très long texte d’un seul coup, cela lui permet de ne pas perdre d’informations importantes.