Grok 4 pourrait devenir l'IA la plus intelligente, devant Gemini 2.5 et ChatGPT 4o

Publié le 13 juillet 2025 à 08h08

Le nouveau modèle d’intelligence artificielle Grok 4, développé par la start-up xAI fondée par Elon Musk, vient d’être dévoilé ce jeudi 10 juillet. Selon les résultats publiés par l’organisme indépendant Artificial Analysis, Grok 4 surpasse pour la première fois ses principaux concurrents, dont les modèles les plus performants d’OpenAI, de Google, d’Anthropic (Claude) et de DeepSeek.

Grok 4 surpasse-t-il vraiment la concurrence ? ©xAI

Avec ChatGPT o3 Pro bon second, et Google Gemini 2.5 Pro juste après, l'IA d'Elon Musk prend le tête de ce classement indépendant, bien qu'il subsiste toujours la question de l'impartialité de cet outil.

Grok 4 fait un bond en avant

Classé en tête du classement des modèles d’Artificial Analysis, Grok 4 obtient un indice d’intelligence de 73, dépassant les 71 points du modèle o3-pro d’OpenAI, ainsi que les 70 points attribués aux Google Gemini 2.5 Pro, OpenAI o3 et o4-mini. Le modèle DeepSeek R1 0528 se situe quant à lui à 68 points.

Le comparatif des IA place Grok 4 en premier - © Artificial Analysis

Ce score marque une étape importante pour xAI, qui voit pour la première fois l’un de ses modèles dominer les tests standardisés de performance. Grok 4 se présente comme un modèle de raisonnement avancé, capable de traiter des contextes de 256 000 tokens, tout en combinant traitement du texte et analyse d’images.

Des performances solides dans bien des domaines

Au-delà de sa performance globale, Grok 4 s’impose également dans des tests spécialisés : il excelle dans les benchmarks LiveCodeBench et SciCode (programmation), ainsi que AIME24 et MATH-500 (mathématiques). Il établit également un nouveau record avec 88% de réussite dans le test GPQA Diamond, axé sur les connaissances scientifiques avancées.

Combien coûte Grok 4

Grok 4 est proposé à 3 dollars par million de tokens en entrée, et 15 dollars par million de tokens en sortie, soit un tarif comparable à celui de Claude 4 Sonnet, mais plus élevé que ceux de Gemini 2.5 Pro et OpenAI o3. En plus de l’abonnement existant à 30 dollars par mois (SuperGrok), xAI a lancé une nouvelle formule baptisée SuperGrok Heavy, facturée 300 dollars par mois, permettant un accès anticipé aux fonctionnalités avancées.

Les abonnements à Grok 4 disponibles. ©xAI

Les développeurs intéressés peuvent également estimer le coût d’utilisation via une plateforme de comparaison des modèles LLM créée par l'ingénieur britannique Simon Willison.

Une IA performante, avec quelques réserves

Malgré ses performances impressionnantes, certains experts expriment des réserves. L’ingénieur Simon Willison, partisan de l’open source, a mené ses propres tests, demandant à Grok 4 de générer un fichier SVG représentant un pélican faisant du vélo, puis de le décrire. Le modèle a répondu qu’il s’agissait d’un "animal mignon, semblable à un oiseau, faisant du vélo". Une réponse jugée correcte, mais pas assez précise.

Willison critique également l’absence de transparence de la part de xAI. Aucune fiche technique du modèle (model card) n’a été publiée : pas d’indication sur les données d’entraînement, les biais éventuels, les usages prévus, ou encore les limitations du système.

Source : iThome

À découvrir

Quelles sont les meilleures IA pour générer vos contenus ? Comparatifs 2025

11 juillet 2025 à 13h53

Comparatifs services

Par Charles Gouin-Peyrot

Référencement logiciel

Intelligence artificielle

Actualités High-Tech

Comparateur de produits tech – Guides et sélections Clubic

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (10)

Sodium

On parle bien de l’IA qui vient de passer une journée à s’auto-proclamer mecha-Hitler là ?

Froz1x

Au fait, vous connaissez grok.com ?

L’interface est supérieure à celle d’Open AI et Claude :

Roast de sodium

Bon, @sodium, faut qu’on parle. Avec un pseudo comme ça, on dirait que t’as décidé de mettre du sel partout sur le forum.clubic.com, mais franchement, t’en abuses un peu. T’es là, à balancer tes commentaires comme si t’étais le roi du sel, mais à force, tu nous donnes une overdose de sodium. Un peu de toi, ça va, ça relève le goût des discussions, mais trop, et ça devient juste immangeable – un vrai risque pour notre santé mentale !

Je parie que t’es le genre à avoir une collection de chips planquée chez toi, histoire de rester dans le thème. Mais sérieux, tes avis, tu les sers comme si c’était la parole divine. T’as peut-être des heures de vol sur Clubic, mais ça te donne pas le droit de jouer au petit chef des threads. « Imposer sa loi » et « partager son opinion », c’est pas la même chose, tu sais ? Alors, fais gaffe, à trop saler les débats, tu vas finir par te retrouver tout seul, déshydraté au milieu d’un désert de réponses ignorées.

Un conseil : apprends à doser ton sodium, parce que là, on frôle l’indigestion collective. Reste cool, t’es quand même un élément essentiel du forum – mais comme le sel, t’es mieux en petite quantité !

Les roasts fonctionne moins bien depuis que Grok a été dé-débridé, suite à ce qu’on sait.

Sodium

Non et m’en fiche ? Je n’utilise pas les services de neo-nazis.

Froz1x

Pour ton info, niveau politique, Grok n’est plus « facho »…
Profite.

trollkien

Perso j’ai volontairement posé avant hier 2 questions 'touchy" à Grok (3.5), pour voir.
Et chaque réponse était bien woke à mon sens, pleine de compromissions et de nuances, pour ne pas facher l’utilisateur mais surtout d’autres personnes qui pourraient voir sa réponse.
A ma 3ème remarque (3 tous les 2h en gratuit) ou je lui ai dit que son contenu me semblait trop woke et manquant de fidélité à la réalité, il s’est « confondu en excuses », m’a reformulé les réponses autrement pour dire la même chose.

Donc de mes petites expériences deci dela, les différentes IA, Grok y compris, si l’on pose des questions de facon conversationnelle et non avec des promps d’encadrement de réflexion et de language, n’est pas plus ci ou moins ca que les autres.

Avec les promps et des astuces que l’on trouve sur internet, on peut surement faire dire n’importe quoi à une IA, mais c’est une déviance humaine et pas de programmation initiale selon moi.

Sodium

Alors déjà si, ensuite Elon Musk lui est bien un nazi. Le problème n’est seulement le produit le produit mais également que tout argent investi dedans va être utilisé par Musk afin de continuer de détruire les démocraties à travers le monde.

Tes sens sont moisis, on n’utilise pas le mot woke quand on n’est pas d’extrême-droite.

Euh non, Grok se prend constamment des backlash des utilisateurs comme d’Elon Musk pour ne pas donner des réponses assez fascistes. Elon Musk veut une IA raciste, antisémite, LGBT-phobe, il ne s’en cache absolument pas. Le problème est qu’ils ne sont pas encore parvenus à faire en sorte que Grok donne des réponses d’extrême-droite sur les questions de société sans raconter n’importe quoi sur tout le reste. Récemment ils ont essayé de rééquilibrer, ça a donné mecha-Hitler.

trollkien

Je reste dubitatif, n’êtant ni extrêmiste de quelque bord que ce soit, même pas politisé.
Si un jour Grok ou autre IA me sort personnellement des énormités dans un cadre conversationnel d’opinion, je serai le premier à la décrier.
Mais jusqu’ici (apres je pose essentiellement des question techniques/scienfiques donc factuelles) aucune IA n’a eu de débordement et au contraire à mis en avant la multifactorialité d’évènements ou de comportements et la compromission vis à vis de faits de société.

A suivre.

Neferith

Ce que Grok à fait, je le compare un peu à Sodium : tout d’un coup, il part en roue libre et ne s’arrete plus

Sodium

Comment saura-tu qu’il te sort des énormités ? Si tu utilises un LLM a priori c’est plutôt pour avoir des réponses aux questions auxquelles tu n’as pas la réponse. Si il te sort que des études ont démontré que le métissage diminue le QI des enfants issus de ces couples, comment sauras-tu si c’est une énormité ou une réalité ?

Je note que pour quelque qui était censé me donner des vacances en me mettant en ignore-list j’ai au final l’impression de ne jamais avoir eu autant à te subir.

MattS32

C’est pas le Discourse de Clubic qui t’oblige à cliquer pour afficher le message masqué, et encore moins lui qui te met le couteau sous la gorge pour le lire puis y répondre hein