Les systèmes de notation actuels encouragent les modèles à fournir une réponse même lorsqu’ils sont incertains et donc, in fine, à générer des hallucinations, qui peuvent parfois être dangereuses. OpenAI compare cette situation à un test à choix multiples. Si un étudiant devine, il peut obtenir un point. S’il ne répond pas, il marque zéro. Le modèle agit de la même façon. Fournir une réponse incertaine augmente sa note globale, tandis qu’admettre qu’il ignore la réponse ne rapporte rien.

Les modèles mieux classés sur les tableaux de bord répondent plus souvent lorsqu’ils ne sont pas sûrs, ce qui entraîne davantage d’erreurs. OpenAI précise que « la plupart des tableaux de bord hiérarchisent et classent les modèles en fonction de leur exactitude, mais les erreurs sont pires que les abstentions ». Un modèle qui reconnaît qu’il ne sait pas est pénalisé par rapport à un modèle qui devine, même si la réponse est incorrecte.

Lorsque l’on demande le titre de thèse d’Adam Tauman Kalai, une des chercheurs de l'analyse chez OpenAI, le modèle fournit trois réponses différentes, toutes fausses. La date de naissance de la même personne reçoit également trois propositions erronées. Ces exemples montrent l’importance de permettre aux modèles d’exprimer leur incertitude. OpenAI pense qu'il vaut mieux qu'un modèle de langage signale qu’il ne connaît pas la réponse plutôt que de générer une information incorrecte.