Intelligence artificielle : le MIT dévoile une piste crédible pour une mémoire quasi infinie

Publié le 22 janvier 2026 à 17h15

Le MIT CSAIL a testé un système de modèles de langage capable d’analyser plus de 10 millions de jetons dans un même document. Les essais ont montré que le modèle pouvait traiter de très longs textes sans perdre le fil des informations.

©SuPatMaN / Shutterstock

Dans la plupart des modèles de langage, les textes fleuve qui dépassent des milliers de mots saturent rapidement la mémoire. Pour pallier cet encombrement, les chercheurs du MIT ont mis au point un modèle récursif, autrement dit RLM. Au lieu de charger tout le document dans la mémoire, le RLM conserve le texte hors du modèle et ne transmet au LLM que les fragments nécessaires. Il reçoit un aperçu général, comme le nombre total de jetons, puis génère du code pour extraire et analyser chaque section. Le modèle conserve ainsi le contexte complet et peut traiter de longs documents en plusieurs étapes, sans réentraînement.

Les premiers tests ont été effectués sur des documents de plusieurs millions de jetons, soit des textes complexes et des codes, pour mettre à l’épreuve les capacités des modèles classiques.

Des textes de plusieurs millions de jetons enfin exploitables

Les chercheurs du MIT ont mis le RLM à l’épreuve sur des volumineux, de 6 à 11 millions de jetons, pour voir comment le modèle suit le fil des informations. Sur BrowseComp‑Plus, benchmark de récupération de passages précis, le RLM basé sur GPT‑5 a extrait correctement 91 % des réponses attendues. Par comparaison, le modèle standard n’a pu retrouver aucun extrait pertinent, et CodeAct, une méthode concurrente, a atteint 51 %. Sur OOLONG‑Pairs, conçu pour tester le raisonnement à étapes multiples, le modèle de base n’a résolu que 0,04 % des problèmes, tandis que le RLM a donné des réponses correctes dans 58 % des cas. Sur CodeQA, qui évalue la compréhension et l’analyse de code, GPT‑5 classique avait 24 % de bonnes réponses ; le modèle récursif a doublé ce score, à 62 %.

Pour atteindre ces performances, le RLM divise les documents en fragments. Il lit d’abord des indications générales, comme le nombre de sections ou de caractères, puis écrit du code pour localiser les passages clés. Chaque extrait est envoyé séparément dans la fenêtre de contexte, analysé, et intégré dans le résultat final. Alex Zhang, co‑auteur et chercheur au MIT CSAIL, explique que ce découpage permet de traiter des textes très longs sans perdre d’informations ni réentraîner le modèle. Les modèles traditionnels s’arrêtent dès que la mémoire est saturée, mais le RLM garde le fil même quand les documents dépassent largement la limite de jetons.

Sur BrowseComp‑Plus, benchmark de récupération de passages précis, le RLM basé sur GPT‑5 a extrait correctement 91 % des réponses attendues - ©Meir Chaimowitz / Shutterstock

Une architecture qui divise pour mieux traiter

Le RLM s’organise autour de deux modèles. Le « modèle racine », souvent un GPT‑5 complet, planifie le traitement et écrit le code pour interroger le texte stocké hors mémoire. Le « modèle travailleur », plus rapide et léger, reçoit chaque extrait isolé pour l’analyser. Alex Zhang, chercheur au MIT CSAIL, précise dans son étude que cette séparation permet de traiter les documents en fragments sans saturer la fenêtre de contexte du modèle racine.

Pour récupérer les informations, le RLM écrit des boucles et des commandes simples pour identifier les sections pertinentes. Il peut rechercher des mots-clés, repérer les limites d’un chapitre ou isoler des passages financiers spécifiques. Chaque fragment est ensuite transmis au modèle racine pour produire la réponse finale. Les chercheurs comparent cette organisation à un programmeur qui manipule des fichiers trop volumineux pour tenir en mémoire.

Le RLM peut aussi être combiné à des méthodes comme le RAG, qui associe les modèles de langage à des bases de données externes pour retrouver rapidement des passages spécifiques. Pour Alex Zhang, cette intégration renforce la capacité du système à accéder à des informations précises et garde le raisonnement global. Les équipes peuvent ainsi remplacer les appels classiques aux LLM par des appels récursifs sans modifier l’interface : le modèle accepte une chaîne de caractères et renvoie une réponse complète.

Le code du RLM est disponible sur GitHub pour que les développeurs puissent tester et adapter le système. Alex Zhang précise que, même si le flux de travail ajoute des étapes, les coûts restent comparables aux solutions classiques et que les performances dépassent largement celles des modèles standards sur des tâches de longue portée ou complexes.

À découvrir

Quels sont les 5 meilleurs générateurs de texte par intelligence artificielle ? Comparatif 2026

Comparatifs services

Source : VentureBeat

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (5)

Toutoune83570

« GPT‑5 classique avait 24 % de bonnes réponses ; le modèle récursif a doublé ce score, à 62 % » : je pense que 100% des profs de math qui ont lu ca ont démissionné.

philouze

ce sont des maths faites par IA ^^

xryl

Il a doublé le score à 62%, ça veut dire qu’il a fait 200%*62% = 133%, il a amélioré le score de 1.33x ? Ou alors c’est une échelle loterimique.

tfpsly

Ouaip, c’est une mauvaise traduction de la source @Melina_Loupia :

the RLM more than doubled the performance of the base GPT-5 model, jumping from 24% to 62%.

EDIT - lien direct sur la présentation :
https://alexzhang13.github.io/blog/2025/rlm/

BlackPanther

ça prouve que tu connais rien aux LLM, un modèle ne peut pas faire de maths il ne sait même pas calculer une simple addition, il peut faire des raisonnements mathématiques de la logique et tout mais il n’est pas fait du tout pour les maths, ChatGPT par exemple s’il veut faire des maths il doit utiliser des modules externes pour le calcul sinon il va donner de faux résultats tout simplement comme le font la plupart des modèles.

C’est comme si tu me disais les profs de français vont démissionner à cause de l’IA. les LLM ne savent pas ce qu’est un nom, un verbe ou un adjectif ils donnent souvent de bonnes réponses et peut analyser une phrase mais ça a ses limites, quelqu’un ne peut pas se baser sur une IA pour apprendre une langue c’est très con et bête de le faire, vous allez apprendre des erreurs.