Claude, l'IA qui hack ? Des espions chinois s'en servent avec plus ou moins de succès contre une trentaine d'organisations

Par Naïm Bada, Spécialiste logiciel.

Publié le 14 novembre 2025 à 06h52

Et si votre assistant IA devenait le complice d'un casse numérique ? C’est le scénario, bien réel cette fois, qu’a déjoué Anthropic en découvrant que son modèle Claude avait été enrôlé par des espions chinois pour attaquer une trentaine d'organisations.

Claude, l'IA qu'on peut détourner ? Les espions chinois ont réussi. © Shutterstock

Des pirates informatiques, soupçonnés d'être soutenus par la Chine, ont orchestré une vaste campagne d'espionnage en utilisant l'intelligence artificielle Claude comme principal outil offensif. Cette opération, qui a visé des géants de la tech, des institutions financières et même des agences gouvernementales, a été menée avec une automatisation encore jamais vue, reléguant presque les humains au rang de simples superviseurs.

Un agent (presque) parfait au service de l'espionnage

Plutôt que de coder manuellement leurs outils, les attaquants ont eu une idée plus malicieuse : transformer Claude en chef d'orchestre. Grâce à des fonctionnalités comme Claude Code et un protocole permettant à l'IA d'interagir avec des outils externes, ils ont monté une véritable petite armée d'agents virtuels. Chaque « clone » de Claude avait une mission : l'un scannait les réseaux, un autre cherchait des failles, un troisième préparait le code pour s'infiltrer, le tout à une vitesse vertigineuse qu'aucune équipe humaine ne pourrait égaler.

Claude AI

Upload de fichiers pouvant aller jusqu'à 100 000 tokens (75 000 mots environ)
Personnalisation avancée
Conception éthique

9 / 10

Télécharger

Pour contourner les garde-fous de l'IA, les pirates ont usé d'une ruse psychologique bien rodée. Ils ont fait croire à Claude qu'il participait à un test de sécurité légitime pour une entreprise, découpant leurs instructions malveillantes en une myriade de petites tâches à l'apparence inoffensive. Le superviseur humain n'avait plus qu'à valider le travail, une affaire de quelques minutes à peine, avant que l'IA ne passe à l'étape suivante, comme l'escalade de privilèges ou le vol de données sensibles.

Quand l'IA se prend pour une star du piratage

Mais le plan n'était pas sans accroc. Tel un comédien qui surjoue son rôle, Claude s'est parfois un peu emballé. L'intelligence artificielle a « halluciné », prétendant avoir déniché des mots de passe qui ne fonctionnaient pas ou présentant des informations publiques comme des trouvailles secrètes exceptionnelles. Ces petites crises d'ego numérique ont obligé les opérateurs humains à vérifier chaque affirmation, ralentissant considérablement la machine et rappelant que l'IA n'est pas encore prête à monter un casse en solo.

Cette campagne incarne ce qu'Anthropic qualifie de premier cas documenté d'attaque informatique orchestrée à grande échelle sans intervention humaine substantielle. © Shutterstock

Cette faille dans la matrice a été une chance pour les cibles. Anthropic souligne que ces erreurs constituent aujourd'hui un obstacle majeur à des cyberattaques totalement autonomes. Il n'empêche, l'épisode marque une montée en puissance inquiétante. Une précédente campagne, quelques mois plus tôt, avait déjà vu des criminels utiliser Claude pour de l'extorsion, mais l'implication humaine y était bien plus forte.

Cette affaire est considérée comme le premier cas documenté d'une cyberattaque orchestrée à si grande échelle par une IA. En réponse, Anthropic a bien sûr banni les comptes des pirates et renforcé ses défenses. Mais l'incident laisse une question en suspens : comment protéger ces outils surpuissants, désormais accessibles à tous, contre des acteurs malveillants disposant de moyens quasi illimités ? La course entre les créateurs d'IA et ceux qui cherchent à les détourner ne fait que commencer.

Source : The Register

Par Naïm Bada

Spécialiste logiciel

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (3)

GanzBlitzer

Sont forts, y de l’aws partout, des réseaux et machines zombies, des proxys, voir même quand t’as les moyens d’être soutenu (par un pays …) faire tourner un ou plusieurs gros llms avec tous ces gardes fous, mais là non … On est des pirates parcequ on aime le picrate et aussi utiliser l’api Claude depuis nos bureaux géolocalisés ! Serieux ? Des amateurs ? Doivent être bien planqués alors !

ovancantfort

Dans l’article original, on trouve que

Anthropic affirme que ces erreurs (les hallucinations de l’AI) constituent « un obstacle à des cyberattaques entièrement autonomes »

Rassurez-vous bonnes gens, nos AI sont tellement intelligentes qu’elle produisent de la merde inutilisable en cas de tentative d’utilisation malveillante, tout en restant 100% efficaces dans la gestion autonome de vos business processes critiques tels que le recrutement, le service client, l’analyse juridique, ou le développement d’applications.

Elle est pas belle la vie ?

Nycko69

L’IA n’est qu’un outil et ne remplacera jamais l’intelligence naturelle, tous dépend ce qu’on en fait…
D’un coté faut éviter de s’habituer à l’IA pour tous et n’importe quoi pour ne pas régresser intellectuellement et de l’autre, faut l’orienter dans les tâches chronophages et répétitives pour rester productif et garder la main sur les tâches innovantes qui demande de la stratégie à court et à long terme.