Le nouveau modèle d’intelligence artificielle Grok 4, développé par la start-up xAI fondée par Elon Musk, vient d’être dévoilé ce jeudi 10 juillet. Selon les résultats publiés par l’organisme indépendant Artificial Analysis, Grok 4 surpasse pour la première fois ses principaux concurrents, dont les modèles les plus performants d’OpenAI, de Google, d’Anthropic (Claude) et de DeepSeek.

Grok 4 surpasse-t-il vraiment la concurrence ? ©xAI
Grok 4 surpasse-t-il vraiment la concurrence ? ©xAI

Avec ChatGPT o3 Pro bon second, et Google Gemini 2.5 Pro juste après, l'IA d'Elon Musk prend le tête de ce classement indépendant, bien qu'il subsiste toujours la question de l'impartialité de cet outil.

Grok 4 fait un bond en avant

Classé en tête du classement des modèles d’Artificial Analysis, Grok 4 obtient un indice d’intelligence de 73, dépassant les 71 points du modèle o3-pro d’OpenAI, ainsi que les 70 points attribués aux Google Gemini 2.5 Pro, OpenAI o3 et o4-mini. Le modèle DeepSeek R1 0528 se situe quant à lui à 68 points.

Le comparatif des IA place Grok 4 en premier - ©   Artificial Analysis
Le comparatif des IA place Grok 4 en premier - © Artificial Analysis

Ce score marque une étape importante pour xAI, qui voit pour la première fois l’un de ses modèles dominer les tests standardisés de performance. Grok 4 se présente comme un modèle de raisonnement avancé, capable de traiter des contextes de 256 000 tokens, tout en combinant traitement du texte et analyse d’images.

Des performances solides dans bien des domaines

Au-delà de sa performance globale, Grok 4 s’impose également dans des tests spécialisés : il excelle dans les benchmarks LiveCodeBench et SciCode (programmation), ainsi que AIME24 et MATH-500 (mathématiques). Il établit également un nouveau record avec 88% de réussite dans le test GPQA Diamond, axé sur les connaissances scientifiques avancées.

Combien coûte Grok 4

Grok 4 est proposé à 3 dollars par million de tokens en entrée, et 15 dollars par million de tokens en sortie, soit un tarif comparable à celui de Claude 4 Sonnet, mais plus élevé que ceux de Gemini 2.5 Pro et OpenAI o3. En plus de l’abonnement existant à 30 dollars par mois (SuperGrok), xAI a lancé une nouvelle formule baptisée SuperGrok Heavy, facturée 300 dollars par mois, permettant un accès anticipé aux fonctionnalités avancées.

Les abonnements à Grok 4 disponibles. ©xAI

Les développeurs intéressés peuvent également estimer le coût d’utilisation via une plateforme de comparaison des modèles LLM créée par l'ingénieur britannique Simon Willison.

Une IA performante, avec quelques réserves

Malgré ses performances impressionnantes, certains experts expriment des réserves. L’ingénieur Simon Willison, partisan de l’open source, a mené ses propres tests, demandant à Grok 4 de générer un fichier SVG représentant un pélican faisant du vélo, puis de le décrire. Le modèle a répondu qu’il s’agissait d’un "animal mignon, semblable à un oiseau, faisant du vélo". Une réponse jugée correcte, mais pas assez précise.

Willison critique également l’absence de transparence de la part de xAI. Aucune fiche technique du modèle (model card) n’a été publiée : pas d’indication sur les données d’entraînement, les biais éventuels, les usages prévus, ou encore les limitations du système.

Source : iThome

À découvrir
Quelles sont les meilleures IA pour générer vos contenus ? Comparatifs 2025

11 juillet 2025 à 13h53

Comparatifs services