Des chercheurs utilisent une IA d’OpenAI pour résoudre un célèbre problème de mathématiques

Un modèle de raisonnement d'OpenAI a produit une preuve qui réfute une conjecture posée par le mathématicien hongrois Paul Erdős en 1946. Neuf mathématiciens extérieurs ont relu et validé le résultat. Le médaillé Fields Tim Gowers le juge digne d'une grande revue.

Le modèle est sorti du domaine de la géométrie et s'est tourné vers la théorie des nombres algébriques, une branche très éloignée du problème de départ - ©Billion Photos / Shutterstock

Parfois, confier ses problèmes à ChatGPT a du bon.

Paul Erdős voulait savoir combien de paires de points peuvent rester exactement à la même distance les unes des autres quand on en place un certain nombre sur une feuille plane. Posez n points, comptez les paires séparées d'une unité, cherchez le maximum. Erdős avait fixé une borne supérieure conjecturale, à peine plus que linéaire en fonction de n. Pendant près de quatre-vingts ans, les meilleures configurations connues sortaient toutes du quadrillage carré, et ce quadrillage frôlait le plafond. Avec son modèle, OpenAI a obtenu une famille infinie d'arrangements qui le dépasse. Will Sawin, mathématicien à Princeton, a chiffré le gain par un exposant d'environ 0,014.

Un modèle généraliste pas spécialement matheux a trouvé la preuve par la théorie des nombres

Le système n'a jamais reçu d'entraînement dédié aux mathématiques. Il fait tourner la même architecture qui rédige des courriels et produit du code Python. Sebastian Bubeck et Noam Brown, chercheurs chez OpenAI, écartent toute parenté avec AlphaProof, l'outil de Google DeepMind conçu pour la démonstration formelle. Personne n'a ajouté de corpus formel ni réglé le modèle sur ce problème.

Le modèle est sorti du domaine de la géométrie et s'est tourné vers la théorie des nombres algébriques, une branche très éloignée du problème de départ.

Dans son raisonnement publié, on le voit écarter une à une les pistes classiques, des racines de l'unité aux puissances d'un point rationnel du cercle. Le basculement vient d'une remarque inattendue. Tout arrangement optimal admet une écriture avec des nombres algébriques, au prix d'un degré gigantesque. Le modèle voit dans ce degré démesuré la matière première d'un contre-exemple, là où il aurait pu n'y lire qu'une gêne, et il décide d'explorer les corps de nombres.

Selon Sebastian Bubeck, la première sortie semblait trop belle pour être vraie. Le résumé du raisonnement s'étale sur 125 pages.

Trois mathématiciens d'OpenAI pour guider et vérifier le modèle

D'après OpenAI, jamais une IA n'avait réglé seule un problème ouvert de cette importance. Mais attention, avec les modèles de langage, l'autonomie a ses limites. Trois chercheurs sont tout de même venus en garde-fous. Lijie Chen a piloté le modèle interne, tandis que Mark Sellke et Mehtaab Sawhney en ont vérifié la correction. Tous trois travaillent chez OpenAI. Mehtaab Sawhney a décroché le prix Morgan. Mark Sellke avait déjà remporté une médaille d'or aux Olympiades internationales de mathématiques, puis étudiant, il a décroché une place parmi les six meilleurs du Putnam, le grand concours universitaire nord-américain. Mehtaab Sawhney, lui, a reçu le prix Morgan, qui distingue la recherche d'un étudiant en mathématiques.

Plusieurs relecteurs émettent la même réserve. Aucun examinateur extérieur n'a consulté la sortie brute du modèle. La version diffusée correspond à une chaîne de raisonnement déjà éditée, puis retravaillée par interaction avec Codex pour l'exposition. OpenAI affirme malgré tout que le fichier de preuve a été généré en une seule fois, sans intervention humaine sur le contenu mathématique. Dans le papier compagnon, les neuf mathématiciens rattachent les idées à Ellenberg-Venkatesh, Golod-Shafarevich et Hajir-Maire-Ramakrishna, des références que le modèle ne cite pas. Will Sawin, lui, a même simplifié l'argument après lecture, en ramenant la construction à un seul nombre premier rationnel.

OpenAI a déjà trébuché sur ce terrain en octobre 2025. À l'époque, l'ancien vice-président de l'entreprise Kevin Weil annonçait dix problèmes d'Erdős résolus par GPT-5. Le modèle avait en réalité retrouvé des solutions déjà publiées. Thomas Bloom, qui tient le site recensant les problèmes d'Erdős, avait dénoncé une grave déformation des faits, et Weil avait retiré son message. Cette fois, Bloom cosigne le papier de vérification. À ses yeux, aucune IA n'avait jamais accompli pareille performance en mathématiques.

Erdős attachait un prix à ses questions favorites. Il offrait 500 dollars à qui trancherait cette borne supérieure, soit environ 430 euros. Le modèle réfute la conjecture sans que l'on connaisse pour autant la valeur exacte du maximum, et la meilleure borne supérieure connue reste celle de Szemerédi.

Des équipes extérieures au panel initial de relecteurs liront la preuve dans les prochaines semaines, tandis que le processus complet de relecture par les pairs prendra des mois. Tim Gowers a écrit qu'un rapporteur des Annals of Mathematics accepterait le texte sans hésiter, mais la preuve n'a pas encore été soumise à cette revue.

Source : The Guardian (accès limité)

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2026

Comparatifs services