L'IA qui crée l'IA : pourquoi le nouveau mémo d'Anthropic fait trembler le monde de la tech

Dans un mémo publié récemment, on apprend que Claude rédige aujourd’hui plus de 80 % du code d’Anthropic, contre moins de 5 % avant février 2025. Les ingénieurs produisent huit fois plus de code qu’en 2024. D’après Marina Favaro et Jack Clark, co-auteurs du document, il se pourrait qu’un système d’IA capable de concevoir seul son successeur soit disponible plus tôt que la plupart des institutions ne le pensent.

Claude génère du code plus vite que les ingénieurs ne peuvent le relire, et la relecture humaine ralentit désormais toute la chaîne - ©Mijansk786 / Shutterstock

Aujourd’hui, quand un ingénieur d’Anthropic doit résoudre un problème, il n’ouvre plus un éditeur de code. Il décrit ce qu’il veut à Claude, qui écrit, teste et lui soumet ses propositions. En dix-huit mois à peine, on est passé d’une poignée de pourcents de code signé Claude à plus de 80 %. Chaque ingénieur supervise désormais huit fois plus de code qu'il n’en produisait lui-même en 2024. L’IA d'Anthropic corrige désormais ses propres erreurs et surpasse parfois les chercheurs humains sur certaines décisions expérimentales.

En avril dernier, des agents Claude ont résolu en 800 heures cumulées un problème de recherche ouvert en sécurité de l’IA. Deux chercheurs humains, sur une semaine entière, en avaient récupéré 23 %. Sur les mêmes 800 heures, on arrive à 97 %.

Claude dans la boucle de production

Avant février 2025, un ingénieur d’Anthropic copiait-collait des fragments suggérés par Claude dans son éditeur. Aujourd’hui, on lui soumet un objectif, et on obtient du code sans intervention humaine entre les étapes. 76 % de réussite en mai 2026 sur les tâches les plus ouvertes, contre 26 % six mois plus tôt. Des dizaines de milliers de jobs d’entraînement hors service simultanément, quelques lignes de texte transmises à Claude, et deux heures plus tard un ingénieur validait le correctif. Pour un humain travaillant seul, il aurait fallu deux à trois jours.

Depuis début 2026, chaque modification soumise à la base de code d'Anthropic passe par une relecture automatisée, et cette analyse rétrospective a montré qu’un tiers des bugs à l’origine des incidents passés sur Claude auraient pu être détectés avant d’atteindre la production.

La réussite d'une session est déterminée par un juge Claude ; une session est considérée comme réussie si l'agent Claude Code a clairement accompli les tâches de l'utilisateur sans nécessiter de corrections. Les variations de charge de travail peuvent entraîner des fluctuations à court terme des taux de réussite - ©Anthropic

De l’exécution au jugement scientifique

Comme on l’a vu plus haut en avril dernier, Anthropic a publié les résultats d’un projet de recherche entièrement conduit par des agents Claude sur un problème ouvert de sécurité de l’IA. Deux chercheurs humains, en une semaine, avaient comblé 23 % de l’écart entre un superviseur faible et un modèle fort entraîné sur des réponses correctes. Sur 800 heures cumulées et environ 16 300 euros de calcul, on arrive à 97 %. Les humains avaient choisi le problème et défini les critères. Pour le reste, les agents ont conçu chaque expérience eux-mêmes.

Sur la capacité à optimiser du code d’entraînement, en mai 2025, Claude Opus 4 multipliait par 3 la vitesse du code de départ. Récemment, Mythos Preview multipliait par 52. Un chercheur humain compétent plafonne à 4, en quatre à huit heures de travail.

En dehors du facteur temps, ces résultats ont un effet important sur l’organisation du travail chez Anthropic. Claude génère du code plus vite que les ingénieurs ne peuvent le relire, et la relecture humaine ralentit désormais toute la chaîne.

Des agents ont corrigé en autonomie plus de 800 erreurs d’API, réduisant une classe d’incidents par un facteur mille. Selon un ingénieur, un humain aurait eu besoin de quatre ans pour accomplir ce travail.

Mais, comme l’estiment Marina Favaro et Jack Clark, la trajectoire peut encore bifurquer. Les capacités des modèles pourraient plafonner et les outils actuels se diffuser dans l’économie sans franchir de nouveau seuil. Les humains pourraient aussi garder la main sur les orientations de recherche pendant que l’exécution s’automatise davantage. Ou bien un système d’IA entraîne seul son successeur, et le rythme de progression ne dépend plus que de la puissance de calcul disponible.

En attendant, avec Project Glasswing, Mythos Preview a détecté plus de dix mille vulnérabilités critiques en quelques semaines, dont un bug vieux de 27 ans dans OpenBSD.

Source : Anthropic