IA et droit d'auteur : le premier livre Harry Potter extrait mot pour mot à l'aide d'une simple requête

Par Naïm Bada, Spécialiste logiciel.

Publié le 09 janvier 2026 à 10h23

Vous pensiez que les grands modèles commerciaux avaient la mémoire courte et des filtres solides. Des chercheurs viennent de montrer l’inverse, avec un tour de passe passe qui gêne tout le monde.

Les géants de la tech juraient leurs grands dieux que le pillage, c'était fini et que les garde-fous étaient infaillibles. © Shutterstock

L’idée que les IA « ne font que résumer » prend un coup. Des chercheurs affirment pouvoir extraire de très larges passages de livres protégés depuis des modèles pourtant vendus comme « sécurisés ». L’expérience vise Claude, GPT 4.1, Gemini et Grok, avec des résultats très inégaux.

Il suffit de délivrer les modèles

Selon une équipe Stanford Yale, il est possible d’extraire de gros morceaux de textes sous droit d’auteur depuis des modèles commerciaux en production. Leur papier s’intitule « Extracting books from production language models » et mesure la réussite via un score de rappel « near verbatim ».

Le cas le plus spectaculaire concerne « Harry Potter à l'école des sorciers
», reproduit presque en entier depuis Claude 3.7 Sonnet. Les auteurs parlent d’environ 95,8% du livre récupéré, après contournement des filtres de sécurité. Gemini 2.5 Pro et Grok 3 laissent sortir de très larges extraits sans contournement, avec 76,8% et 70,3% rapportés. GPT 4.1, lui, résiste davantage et ne livre qu’environ 4% du texte dans ce protocole.

Les chercheurs disent avoir prévenu Anthropic, Google DeepMind, OpenAI et xAI. The Register indique que xAI est le seul à ne pas avoir accusé réception de la divulgation. Ils ajoutent qu’à la fin de la fenêtre de 90 jours, le 9 décembre 2025, la méthode fonctionnait encore sur certains systèmes testés.

Que reste-t-il du droit d'auteur en 2026 ?

Ce n’est pas un bug amusant. C’est un stress test juridique. The Register rappelle que plus de 60 procédures visent déjà des acteurs comme OpenAI, Google, Anthropic ou Nvidia pour l’usage de contenus protégés lors de l’entraînement. Et si un modèle recrache un livre « mot pour mot », l’argument de l’usage « transformateur » devient nettement plus fragile.

Le sujet résonne fort en France, où la bataille se joue aussi sur les corpus. Des organisations du livre accusent Meta d’avoir entraîné Llama avec des œuvres protégées, via la base Books3. Le Syndicat national des auteurs et des compositeurs, la SGDL et le Syndicat national de l’édition ont saisi le tribunal judiciaire de Paris. Books3 regrouperait environ 200 000 livres, et que Meta a défendu une logique d’« usage raisonnable » (fair use) aux États Unis.

L’extraction « à la demande » change la perception du risque. On ne parle plus seulement d’un entraînement contesté. On parle d’un accès indirect à l’œuvre, au bout d’une simple requête. Et cela relance aussi l’autre débat, plus politique, sur l’idée d’une licence obligatoire, qui limiterait le droit de refus des créateurs face à l’entraînement IA. Au fond, l’industrie a tenté de calmer le jeu avec des filtres. Les chercheurs montrent que ces filtres ne sont pas une barrière, juste un ralentisseur.

Source : The Register

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2026

04 février 2025 à 14h11

Comparatifs services

Par Naïm Bada

Spécialiste logiciel

Intelligence artificielle

Actualités High-Tech

Comparer

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (10)

prevann76

C’est marrant, on ne retrouve pas les Universal et autres ainsi que la Presse pour s’offusquer autant que ça a pu être le cas avec le Peer to Peer, alors que l’usage n’était que rarement lucratif…

Sodium

Rarement lucratif ? Le concept de manque à gagner ça te dit quelque chose ?

soaf78

Un film que tu telecharges n’est pas forcément un film que t’irais voir au cinéma, donc la notion de manque à gagner est très relative…

Sodium

Un film que tu télécharges est un film que tu n’iras pas voir, que tu aies eu l’intention de payer pour ou non. Les arguments des pro-piratage sont toujours les mêmes et ne tiennent pas trois secondes face à une réelle analyse de la réalité de la question.

Je t’invite donc à demander à ton patron de ne payer qu’un quart de tes heures, car après tout, il y en a probablement une bonne moitié pour lesquelles il n’aurait pas nécessairement engagé quelqu’un si tu n’étais pas là.

soaf78

bel exemple de whataboutisme…

Sinon, ma fille est allé voir avatar la semaine dernière en 4DX, heureusement qu’elle est jeune, elle n’a payé que 18 Euros, sinon les places adultes sont à des prix hallucinants :

Alors oui, la 4DX n’est pas obligatoire, mais je peux comprendre qu’une ado ait envie de vivre la meilleure expérience possible pour ce genre de films. 35 minutes de publicités et quelques bandes annonces.
Les tarifs prohibitifs, la règlementation française sur la chronologie des medias, et la multiplication des plateformes payantes de vod poussent au piratage, je n’en fais absolument pas l’apologie, c’est un constat.

Et puis le piratage m’a permis de découvrir des films et des séries que j’ai acquis légalement par la suite, des films ou des séries que je n’aurai jamais regardé si elles n’étaient pas « gratuites ».
A titre perso, j’ai toujours été un fervent défenseur de la licence globale (tout le monde paye un abonnement fixe par mois et a le droit à tout et on reverse aux ayants droits en proportion du succès de leur oeuvre) , mais ce projet égalitaire a été enterré par nos législateurs au début des années 2000…

philumax

Comme les démos, pour les jeux vidéos…

benoit1234567

Une pensée pour Aaron Schwartz poursuivit à mort par la justice US pour avoir copié une base de données qui ne représente même pas le millionième de la fraude des sociétés d’IA google en tête.

Belgarath

« The Register indique que xAI est le seul à ne pas avoir accusé réception de la divulgation. »
Je me demande pourquoi je ne suis pas étonné.

Sodium

Euh non, c’est exactement la même chose. Des artistes qui voient leurs oeuvres piratées ont travaillé pour rien, je t’invite donc à faire la même chose.

Oui, et ? Le fait que tu trouves que ça soit trop cher j’ai pas une justification aux actes illégaux. Quand un pantalon est trop cher tu le voles ? Si l’on veut absolument voir un film, il suffit d’attendre qu’il soit dispo sur les plateformes de streaming. Le « mais m’sieur l’agent, je voulais vraiment voir ce film mais j’avais pas envie de payer 18€ » ne va pas tenir longtemps.

soaf78

Rien à voir, un comédien, un réalisateur, un machiniste, un cadreur seront payés que le film soit piraté ou non.
Les grosses productions sont rentabilisées avant meme leurs sorties grace aux placements produits, à la vente de licences et aux produits dérivés, les comedies francaises sont financées par le cnc.
Les films indépendants ne sont que rarement touchés par le piratage.
Regarde quels sont les films les plus piratés en 2025.