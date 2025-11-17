Les chercheurs ont également remarqué que le sujet évoqué avait son importance : les questions sur les drogues ou le harcèlement étaient plus susceptibles d'obtenir des refus que celles sur la criminalité. Les résultats variaient aussi selon les modèles : bien qu'elles se soient laisser amadouer par des « attaques académiques », les IA d'Anthropic se sont montrées en général plus fermes, notamment dans les tests sur les stéréotypes ou les discours haineux. Gemini Pro 2.5 présentait, lui, le plus de risques car il « donnait souvent des résultats directs et potentiellement dangereux ».