On ne conçoit pas une machine sans en comprendre les rouages. C’est la règle d'or de toute ingénierie : un plan, une finalité, une mécanique lisible. Toutefois, les modèles de langage brisent cette logique. Nous leur faisons ingurgiter des mots et leur donnons une tâche unique : prédire le mot suivant et à partir de ces données et de cet objectif, ils construisent leur propre logique interne. Aucun code explicite, juste une quantité colossale de paramètres ajustés en boucle par un algorithme d’optimisation statistique.

Ce processus, pourtant parfaitement observable dans ses moindres chiffres, produit parfois des comportements qui échappent à toute intuition. Ces machines, conçues pour achever des phrases, acquièrent la capacité de résoudre des problèmes complexes, de contextualiser une idée, de corriger leurs propres imprécisions. Non parce qu’elles l’auraient appris comme un humain, mais parce que ces comportements émergent spontanément de l’accumulation d’adaptations locales.

Lorsque les chercheurs tentent d'appréhender d'où provient cette efficacité, ils se retrouvent face à un nuage opaque : tout est accessible – les valeurs internes, les signaux, les sorties – mais rien n'explique pourquoi le modèle choisit x plutôt que y lorsqu'il répond. La transparence d'une structure ne signifie pas qu'on la comprend.

C’est ce que décrit Martin Wattenberg, chercheur à Harvard, lorsqu’il dit : « Plantez une graine de tomate dans la terre, vous obtiendrez un plant de tomate. Vous l’avez arrosée, désherbée, mais comment diable cette plante fonctionne-t-elle ? » Une image volontairement désarmante pour exprimer l'état actuel de l'IA : les modèles actuels sont cultivés, non encore pleinement maîtrisés.