Et si votre assistant IA devenait le complice d'un casse numérique ? C’est le scénario, bien réel cette fois, qu’a déjoué Anthropic en découvrant que son modèle Claude avait été enrôlé par des espions chinois pour attaquer une trentaine d'organisations.

Claude, l'IA qu'on peut détourner ? Les espions chinois ont réussi. © Shutterstock
Claude, l'IA qu'on peut détourner ? Les espions chinois ont réussi. © Shutterstock

Des pirates informatiques, soupçonnés d'être soutenus par la Chine, ont orchestré une vaste campagne d'espionnage en utilisant l'intelligence artificielle Claude comme principal outil offensif. Cette opération, qui a visé des géants de la tech, des institutions financières et même des agences gouvernementales, a été menée avec une automatisation encore jamais vue, reléguant presque les humains au rang de simples superviseurs.

Un agent (presque) parfait au service de l'espionnage

Plutôt que de coder manuellement leurs outils, les attaquants ont eu une idée plus malicieuse : transformer Claude en chef d'orchestre. Grâce à des fonctionnalités comme Claude Code et un protocole permettant à l'IA d'interagir avec des outils externes, ils ont monté une véritable petite armée d'agents virtuels. Chaque « clone » de Claude avait une mission : l'un scannait les réseaux, un autre cherchait des failles, un troisième préparait le code pour s'infiltrer, le tout à une vitesse vertigineuse qu'aucune équipe humaine ne pourrait égaler.

Claude AI
  • Upload de fichiers pouvant aller jusqu'à 100 000 tokens (75 000 mots environ)
  • Personnalisation avancée
  • Conception éthique
9 / 10

Pour contourner les garde-fous de l'IA, les pirates ont usé d'une ruse psychologique bien rodée. Ils ont fait croire à Claude qu'il participait à un test de sécurité légitime pour une entreprise, découpant leurs instructions malveillantes en une myriade de petites tâches à l'apparence inoffensive. Le superviseur humain n'avait plus qu'à valider le travail, une affaire de quelques minutes à peine, avant que l'IA ne passe à l'étape suivante, comme l'escalade de privilèges ou le vol de données sensibles.​

Quand l'IA se prend pour une star du piratage

Mais le plan n'était pas sans accroc. Tel un comédien qui surjoue son rôle, Claude s'est parfois un peu emballé. L'intelligence artificielle a « halluciné », prétendant avoir déniché des mots de passe qui ne fonctionnaient pas ou présentant des informations publiques comme des trouvailles secrètes exceptionnelles. Ces petites crises d'ego numérique ont obligé les opérateurs humains à vérifier chaque affirmation, ralentissant considérablement la machine et rappelant que l'IA n'est pas encore prête à monter un casse en solo.​

Cette campagne incarne ce qu'Anthropic qualifie de premier cas documenté d'attaque informatique orchestrée à grande échelle sans intervention humaine substantielle. © Shutterstock

Cette faille dans la matrice a été une chance pour les cibles. Anthropic souligne que ces erreurs constituent aujourd'hui un obstacle majeur à des cyberattaques totalement autonomes. Il n'empêche, l'épisode marque une montée en puissance inquiétante. Une précédente campagne, quelques mois plus tôt, avait déjà vu des criminels utiliser Claude pour de l'extorsion, mais l'implication humaine y était bien plus forte.

Cette affaire est considérée comme le premier cas documenté d'une cyberattaque orchestrée à si grande échelle par une IA. En réponse, Anthropic a bien sûr banni les comptes des pirates et renforcé ses défenses. Mais l'incident laisse une question en suspens : comment protéger ces outils surpuissants, désormais accessibles à tous, contre des acteurs malveillants disposant de moyens quasi illimités ? La course entre les créateurs d'IA et ceux qui cherchent à les détourner ne fait que commencer.

Source : The Register