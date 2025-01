Créé par le Français François Chollet, le test ARC-AGI évalue l'efficacité d'échantillonnage d'un système d'IA, c'est-à-dire sa capacité à comprendre et à résoudre de nouveaux problèmes à partir d'un nombre limité d'exemples. On considère cette aptitude comme un élément fondamental de l'intelligence.

Le test utilise des problèmes de grille carrée où l'IA doit déterminer le modèle qui transforme une grille initiale en une grille finale. Chaque question fournit trois exemples à partir desquels le système doit apprendre et généraliser les règles pour résoudre un quatrième cas.

La performance d'o3 sur ce test montre qu'il est parfaitement capable d'identifier les règles les plus « faibles » ou les plus simples qui expliquent les transformations observées. Cette aptitude à trouver des explications concises et généralisables est essentielle pour s'adapter efficacement à de nouvelles situations, une caractéristique primordiale de l'intelligence générale.

Bien que la méthode exacte utilisée par OpenAI reste inconnue, certains experts, dont François Chollet, pensent qu'o3 pourrait rechercher différentes « chaînes de pensée » en décrivant les étapes pour résoudre la tâche, puis sélectionner la meilleure. Cette méthode rappelle celle utilisée par AlphaGo de Google pour vaincre le champion du monde de Go.