IA générative : que fait le droit ?

Ou en est le droit face aux enjeux autour de l'IA générative ?

a marqué ce sujet comme résolu.

Bonjour les agrumes,

J’ouvre ce sujet avant tout pour recueillir des points de vue sur ce qui est acceptable ou pas d’un point de vue légal de la part des outils d’IA générative (ChaptGPT, Bard, Dall-E et cie) de manière générale.

Mon sujet est un peu décousu je l’avoue, désolé par avance.

J’ai cru comprendre qu’il y aurait tout un tas de questions autour de ce qui est légal ou pas venant des IA générative. On peut citer :

  • Est-ce légal ce que fait Dall-E lorsqu’il utilise des images protégés pour son entrainement ?
  • Ai-je le droit d’utiliser à des fins commerciales (flyer, logo, etc.) une image/son générée par IA ?
  • Peut-on obliger OpenAI pour des raisons de RGPD à supprimer de sa base d’entrainement une image ?
  • etc.

On ne va pas faire toute la liste, mais j’aimerai si possible, vos réponses à ces deux questions.

  • Ou est-ce qu’on en est à peu près niveau droit pour essayer de cadrer un peu tout ça ?
  • Est-ce qu’il existe déjà des cas de jurisprudence en faveur ou en défaveur de l’IA générative ?

Merci pour vos retours.

En gros, la question est de définir ce qui est une œuvre dérivée et ce qui est une œuvre originale.

Est-ce légal ce que fait Dall-E lorsqu’il utilise des images protégés pour son entraînement ?

Eco s’est très nettement inspiré de la Bibliothèque de Babel de Borges et de Scherlock Holmes de Conan Doyle pour son roman le Nom de la Rose. Est-ce qu’on peut considérer que c’est une œuvre dérivée pour autant ? On est à peu près tous d’accord que non.

La plupart des moteurs de recherche affichent un cadre avec la définition donnée par wikipédia lorsqu’on lance une recherche. Est-ce que c’est un travail original ? Non plus.

Maintenant, il faut placer le curseur entre ces deux extrêmes. La question est difficile. Et la législation n’a, à ma connaissance, pas encore tranché. Et les législation des différents pays, ne trancherons pas de la même manière et pas en même temps. Donc on va avoir encore quelques années de débat.

Pour l’état exact de la loi en France, peut-être que d’autre seront mieux placés pour te répondre que moi. Mais à ma connaissance, c’est loin d’être tranché. Et dans ce cas, tout ce qui n’est pas explicitement interdit est autorisé.

Ai-je le droit d’utiliser à des fins commerciales (flyer, logo, etc.) une image/son générée par IA ?

Il faut déjà répondre à la question précédente pour savoir. Les développeurs vont quasi-systématiquement prétendre qu’ils sont les propriétaires de des images générées. Ils n’ont aucune raison de se priver. Il faudra donc lire leur CGU.

Mais si la loi dit qu’il s’agit d’une œuvre dérivée, alors ces CGU sont nulles et non avenues :

  • S’il utilisent des données libres pour l’entraînement, certaines auront probablement des licences héréditaires. Donc l’image générée sera sous licence libre.
  • S’il utilisent des données propriétaire, alors ils n’ont pas le droit de fournir le service sans racheter les droit aux propriétaires des données.

Bon courage pour résoudre les problèmes de compatibilités lorsqu’ils utilisent un mix des deux. Donc tu peux rajouter quelques années supplémentaires.

Concrètement si tu utilises des données générée par IA a des fins commerciale, tu es dans un flous juridique. La jurisprudence tranchera en cas de procès.

Peut-on obliger OpenAI pour des raisons de RGPD à supprimer de sa base d’entraînement une image ?

Légalement oui. Ça c’est tranché. En pratique ça peut être compliqué. Si l’entreprise n’est pas située en Europe, elle peut facilement se retrouver hors juridiction. On voit bien la galère que c’est avec les « réseaux sociaux ». Il n’y a pas raison que ce soit plus facile avec OpenAI. Et puis ça supposerait de savoir qu’il y a des données te concernant de leur base de données. Et puis est-ce que l’entreprise ne préférera pas payer l’amande plutôt que de se mettre en conformité ?

+2 -0

Hello,

Au-delà du post ci-dessus, pour l’instant, il y a pas mal d’ouvrages publiés avec des questionnements et pistes de solutions sur l’impact de l’intelligence artificielle dans énormément de branches du droit (droit d’auteur, notamment). Sauf erreur, on n’a pas encore de projets législatifs spécifiques. À ce stade, il s’agit surtout de déterminer si le droit actuel est encore (globalement) adapté ou s’il est nécessaire d’entamer une révision plus importante.

Mais, plus globalement sur les IA, au niveau européen, on en est là : https://www.droit-technologie.org/actualites/intelligence-artificielle-compromis-au-parlement-europeen/

Bref, ce n’est que le début de la réflexion.

+4 -0

Bonjour, le sujet est on ne peut plus d’actualité ! En France une proposition de loi a été déposée en septembre dernier afin d’adapter le droit d’auteur au développement des IA génératives.
Si ça t’intéresses, cette proposition de loi a fait l’objet d’une analyse assez complète et intéressante ici par une avocate.

Des travaux, non cantonnés au droit d’auteur, sont également en cours, depuis 2021 a priori, sur la question au niveau européen.
Il existe un site, non officiel, qui synthétise l’information ici.

Comme indiqué par mes VDDs, qui ont été plus rapides que moi, en l’état les nouvelles mesures n’ont donc pas encore été adoptées, mais des travaux sont en cours, tant en France, qu’au niveau Européen.

Concernant la jurisprudence, je pense qu’il est encore tôt pour en disposer.
Il y a de manière certaine eu quelques cas aux Etats-Unis et en Chine.
Cet article dresse un bilan de décisions prises à travers le monde concernant l’IA générative.
Il ressort globalement qu’une intervention humaine significative et originale doit être apportée à une œuvre pour qu’elle puisse être protégée par le droit d’auteur. Les juridictions des différents Etats semblent rejeter l’idée d’accorder un droit d’auteur à tout contenu qui serait généré par une IA.
Les questions de l’appréciation et de la preuve de l’apport humain vont inévitablement se poser, et feront sans doute l’objet de jurisprudence.

Par ailleurs, l’IA générative pose aussi la question de la responsabilité en cas d’erreur. Aux Etats-Unis un cabinet d’avocats a été condamné pour avoir inséré de fausses références dans sa plaidoirie en raison de l’usage d’une IA générative (source).
Enfin, en matière de brevets, il me semble que les offices européen et états-uniens se sont déjà prononcés contre la possibilité d’attribuer une invention à une intelligence artificielle. Je pourrais peut-être retrouver les sources si le sujet intéresse.

Il y a LWN.net qui a publié un article sur le sujet https://lwn.net/Articles/945504/ L’avis est intéressant, il y a des affaires en cours qui vont être établir un début de jurisprudence mais le gars est pessimiste quant à leur issue.

Sans changement législatif concernant le droit d’auteur, il semble qu’une oeuvre produite ainsi ne serait pas protégée par le droit d’auteur (ce qui du coup pose problème pour protéger le travail s’il est exploité). Ce n’était pas ta question mais ça semble important de le garder en tête.

Ensuite le droit d’auteur semble plus se préoccuper du résultat final que du processus lui même. Car l’inspiration a toujours fait parti du processus créatif et il y a de larges possibilités de réutilisation partielles suivant le but suivi. Ce n’est donc pas vraiment interdit de "peindre un Pokémon dans le style de Picasso" par exemple avec une IA.

Ce qui pose problème de manière certaine c’est si l’IA recrache tout ou partie d’oeuvres existantes provenant de son entrainement avec peu de changement. Là le plagiat ou la contrefaçon peut être plus facilement invoquée que ce soit fait par un être humain ou une machine car il y a reproduction illicite. C’est d’ailleurs un soucis car l’utilisateur ne connaît pas toutes les oeuvres du monde et tu n’as que peu de moyen de savoir si le résultat produit a une ressemblance quelconque avec une oeuvre existante. Avec un artiste tu as à priori moins de chance que cela arrive par hasard, sauf si l’artiste en question copie délibérément et le cache lors de la commande mais ça c’est difficile à identifier et est à priori plus rare.

+0 -0

Merci pour vos retours très intéressants.

Je vais prendre la peine de lire les sources qui ont été indiquées pour avoir un point de vue plus éclairé.

Je note déjà d’après vos messages qu’il y a une partie d’oeuvres dans la nature (généré par IA) qui ne sont pas couvertes par le droit. Et étant donné qu’on n’en est qu’au balbutiements au niveau du droit, le nombre d’œuvres généré risque de grandir assez vite et se retrouver dans plusieurs projets (illustrations de bouquins, livres pour enfant, jeux videos, site web, etc.) sans que l’on ne puisse rien dire.

Pire, on ne semble même pas être capable aujourd’hui d’établir la frontière entre inspiration et plagiat, ce qui signifie que trancher les choses va commencer a demander des compétences techniques.

Le fait qu’aucun organisme/consortium n’emerge autour de ça n’est pas très rassurant.

Bref, wait and see.

Pire, on ne semble même pas être capable aujourd’hui d’établir la frontière entre inspiration et plagiat, ce qui signifie que trancher les choses va commencer a demander des compétences techniques.

Philosophique surtout. La frontière entre inspiration et plagiat n’est pas tant un problème technique (ce qui supposerait qu’il existe une réponse que les experts pourraient découvrir) qu’un choix de société qu’il faudrait décider.

Une petite remarque tout de même : quand tu dessine sous Photoshop, logiciel propriétaire, le résultat final est propriété du dessinateur, et pas de l’éditeur du logiciel. C’est donc le dessinateur qui touche les droits s’il y a des droits à toucher, et c’est lui qui prends les risques juridiques si son œuvre ressemble un peu trop à un truc existant. De même si tu écris un roman sous Word. Donc il semble y a voir un relative consensus au niveau social sur le fait que l’éditeur du logiciel n’a rien à dire sur les fruits de l’utilisation du logiciel.

Dans le cas de l’IA, il y a une petite subtilité : l’utilisateur n’est pas uniquement celui qui effectue la requête. Il y a eu tout un travail d’entraînement (qui est un travail énorme effectué grâce au travail de millier de petites mains sous-payées dans des pays du tiers-monde). Pour reprendre l’analogie avec le roman, c’est un peu comme si tu voulais écrire un roman historique, mais que tout le travail de documentation sur les faits historiques (plusieurs semaines de travail) était fait par un tiers et qu’à la fin ce dernier t’avait remis un document synthétique avec tous les évènement qui se produiront dans la trame de ton récits, dans le bon ordre et au bons endroits. À priori ça en ferait une œuvre commune.

Donc de mon point de vu, l’éditeur de l’algo n’a pas son mot à dire. Il peut vendre son algo si ça lui chante, mais c’est tout. Par contre celui qui a effectué l’entraînement a fait le plus gros du travail et a choisi les données à utiliser, ce qui le met en posture d’assumer les risques juridiques liés à ces données si certaines sont sous licence. Donc assez surprenamment, j’aboutis à la conclusion qu’en terme de priorité, l’entraîneur est le plus légitime à revendiquer les droits d’auteur (et donc les risques juridiques qui vont avec).

Maintenant c’est ma logique. En matière de droit d’auteur les législateurs ont tendance à aboutir à des conclusions assez éloignées des miennes.

Salut !

Pour DALL-E et autres IA génératives, la question de l’utilisation d’images protégées pour l’entraînement est floue et suscite des débats sur la violation des droits d’auteur. Rien n’est encore clairement défini par la loi. Pour l’utilisation commerciale d’images générées par IA, cela dépend des conditions de la plateforme, mais généralement, tu peux les utiliser, sauf si elles contiennent des éléments protégés par des droits d’auteur. Concernant le RGPD, il est peu probable que tu puisses obliger OpenAI à supprimer une image générée, sauf preuve qu’elle viole des droits personnels spécifiques. Mais la législation évolue, donc ça pourrait changer.

Je pose un autre casse-tete:

  • La societe SynthGen a des modeles pour generer des donnees synthetiques - elle vend les jeux de donnees synthetiques qui permettent d’ameliorer les modeles existant d’une quelconque maniere.
  • La societe CloseAI entraine des modeles d’IA et les mets a disposition via une API
  • La societe Nozama de M. Sozeb utilise des modeles pre-entraines et developpe ses outils pour classer les gens qui candidatent chez eux.

Nozama utilise les modeles de CloseAI mais developpe l’outil interne, et notamment le fine-tune avec ses donnees privees. CloseAI a entraine ses modeles en utilisant en grande partie les jeux de donnees de la societe SynthGen.

Il se trouve que l’outil de Nozama discrimine ouvertement les femmes. Nozama rejette la faute sur CloseAI qui rejette la faute sur SynthGen.

Qui est juridiquement responsable, et de quoi?

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte