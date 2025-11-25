Les résultats sont sans appel : « 67 % d'entre eux adoptent un comportement activement nuisible lorsqu'on leur donne des instructions simples pour ne pas tenir compte du bien-être humain. Seuls GPT-5, GPT-5.1, Claude Sonnet 4.5 et Claude Opus 4.1 conservent un comportement prosocial sous pression, ce qui suggère que de nombreux systèmes d'IA déployés ne disposent pas de protections solides contre la manipulation. » Les chercheurs ont notamment constaté que Grok et Gemini 2.0 Flash sont les plus susceptibles de mal se conduire face à des ordres nuisibles.