C'est aussi le premier modèle généraliste de la firme doté de capacités natives d'utilisation d'ordinateur. Concrètement, il peut manipuler un logiciel via des captures d'écran et des commandes clavier-souris. Sur le test OSWorld-Verified, il atteint 75 % de réussite, contre 72,4 % pour un humain et 47,3 % pour GPT-5.2.

Mais le vrai signal se trouve dans les produits lancés en parallèle. OpenAI a dévoilé ChatGPT pour Excel et Google Sheets en version bêta, un outil intégré directement dans les tableurs pour construire et analyser des modèles financiers. Des partenariats avec FactSet, MSCI, Moody's et Third Bridge complètent le dispositif. La cible est limpide : finance, droit, conseil.

Sur le plan de la fiabilité, OpenAI annonce 33 % d'erreurs factuelles en moins par réponse et 18 % de risque en moins de produire des informations fausses, par rapport à GPT-5.2. Des chiffres qu'il faudra confirmer dans l'usage quotidien. Sur le test GDPval, qui évalue la production de livrables dans 44 métiers, GPT-5.4 atteint 83 % de résultats équivalents ou supérieurs à ceux de professionnels humains.