Anthropic verrouille l'accès à son modèle au compte-gouttes. Un groupe Discord a trouvé la porte de service.

Début avril, Anthropic dévoilait Project Glasswing et Claude Mythos Preview. Ce modèle d'IA est réservé à une poignée de partenaires pour la cybersécurité défensive. Le même jour, selon une enquête de Bloomberg, un groupe d'utilisateurs non autorisés accédait au modèle. Anthropic a confirmé avoir ouvert une enquête.
Un sous-traitant, une fuite, un accès : la chaîne de défaillances
Le vecteur d'accès ne tient pas à une prouesse technique. D'après Bloomberg, un membre du groupe travaille chez un sous-traitant d'Anthropic. Ce premier maillon a été combiné à des informations issues de la fuite de données chez Mercor, révélée fin mars. La startup à 10 milliards de dollars produit les données d'entraînement de Meta, OpenAI, Anthropic et Google. Le groupe Lapsus$ a revendiqué le vol de quatre téraoctets de données, dont 939 Go de code source. La chronologie parle d'elle-même : la fuite Mercor date du 27 mars, l'accès à Mythos du 7 avril. Le groupe, organisé via Discord, utilise des outils classiques de veille pour repérer les modèles non publiés sur GitHub. En croisant ces trois éléments, ses membres ont deviné l'emplacement en ligne de Mythos Preview. Anthropic précise que ses systèmes internes n'ont pas été compromis.

- Upload de fichiers pouvant aller jusqu'à 100 000 tokens (75 000 mots environ)
- Personnalisation avancée
- Conception éthique
Le scénario est banal dans sa mécanique. La vulnérabilité n'est pas dans le modèle, ni dans l'infrastructure d'Anthropic. Elle est dans l'écosystème de prestataires qui gravite autour. Un seul fournisseur compromis a exposé les secrets d'entraînement de quatre géants de l'IA. La convention de nommage des modèles Anthropic a fait le reste.
Coinbase en file d'attente, un groupe Discord en accès libre
Mythos Preview n'est pas un produit commercial au même sens que le reste des modèles Claude. Son accès passe exclusivement par Project Glasswing, une coalition d'une dizaine d'organisations. Coinbase, Binance et Fireblocks négocient depuis des semaines sans obtenir de réponse. Hayden Adams, patron d'Uniswap Labs, a publié un appel sur X pour obtenir un simple contact. Le groupe anonyme, lui, utilise Mythos depuis le 7 avril pour ce qu'il décrit comme des « tests de vibe coding ».
Anthropic a construit toute sa communication autour du danger de Mythos. Des réunions d'urgence entre la Fed, le Trésor et les PDG de Wall Street ont été organisées. Des chercheurs indépendants contestent déjà l'ampleur réelle des capacités du modèle. Le maillon le plus faible de la chaîne n'était ni un État ni un groupe de hackers sophistiqué. Un prestataire avec un accès standard et une convention de nommage prévisible a suffi.
Quand la porte blindée repose sur un verrou de boîte aux lettres, c'est rarement le blindage qu'il faut interroger.