J’avais également souligné ce point lors d’un précédent article : la source des données est discutable et contient des images non libres de droits. Il y a plusieurs points de vue qui se défendent tous. Un photographe ou un dessinateur dont une de ses oeuvres aurait été utilisée sans son consentement, il est clair que ce n’est pas très fair play, d’où peut-être la nécessité de réguler, même si tout le monde s’inspire de tout le monde dans la réalité.
La polémique existerait encore même si les modèles d’IA étaient certifiés comme étant obtenus uniquement sur base de contenu 100% libre. Je crois aussi que c’est une certaine appréhension de voir qu’une machine peut faire le boulot et même mieux dans un temps record là où un graphiste y aurait passé des semaines. C’est triste, mais c’est pourtant le cas.
Mais si on part du principe qu’un modèle d’IA ne contient plus des images originales (qu’elles soient ou non libres) mais uniquement une représentation mathématique de celles-ci, alors on peut considérer qu’une IA fait une oeuvre dérivée mais n’enfreint pas forcément le droit d’auteur. Ce serait comme si une personne savait dessiner à la perfection Mickey ou Donald, c’est une représentation dans son esprit mais ça ne l’autorise pas pour autant à faire des dessins de ces personnages et les commercialiser.
En revanche, une photo d’un arbre, d’un papillon ou tout autre élément qui est juste quelque chose que tout le monde peut voir, rien n’empêche de générer des images et il n’y a pas de droits d’auteur. C’est donc aussi l’utilisation de l’outil qui en est faite.
Bref c’est un long débat.