Dans son ouvrage classique « Capitalisme, socialisme et démocratie », Josef Schumpeter faisait référence aux « vagues de destruction créatrice » pour décrire comment les rentes de monopole incitent les entrepreneurs à prendre des risques et à innover. La rente de monopole que l’entrepreneur tire de son innovation est de courte durée, car une autre vague de destruction créatrice remplace bientôt cette vague et cède la place à une autre vague d’innovation. À l’ère de l’intelligence artificielle (IA), les « vagues de destruction créatrice » de Schumpeter sont devenues plus courtes et ont pris la forme de ce que j’appelle des « vagues de destruction créatrice « numérique » ». Et comme chaque « vague de destruction créative « numérique » », la dernière vague d’IA générative a également frappé pour la première fois aux portes du droit d’auteur.
L’IA générative offre un potentiel sans précédent pour créer n’importe quel type d’œuvre – qu’elle soit écrite, audiovisuelle ou même du code de programmation – sur simple demande. Comme toute la chaîne de valeur de l’IA Générative semble centrée autour du droit d’auteur, elle soulève des questions tant du côté des entrées que du côté des sorties (lac ici, ici, ici et ici). Du côté de la sortie, les questions pertinentes sont de savoir si la sortie est protégée par le droit d’auteur et si elle enfreint le droit d’auteur des « œuvres « ingérées » pendant la phase de formation du système d’IA » (lac Quintais, ici ; lac aussi ici et ici). Il est également pertinent de se demander si « la production [is] une « œuvre dérivée » de l’œuvre protégée « ingérée » » (lac ici).
La vertèbre de cette chaîne de valeur de l’IA Générative est le Text and Data Mining (TDM) (lac ici, ici et ici). Pour faciliter le processus de TDM, les données sont la clé. Les données sont la nourriture que les algorithmes doivent digérer et régurgiter afin de diffuser des modèles et des informations. Alors que les données en soi n’est « pas » protégée par le droit d’auteur, c’est la « forme créative » et l’expression de l’auteur, à savoir l’œuvre qui est protégée par le droit d’auteur (lac Geiger, Frosio et Bulayenko (2018)). Ainsi, dans le débat sur l’IA générative, l’un des nœuds les plus cruciaux à démêler est la relation entre « TDM et accès au contenu » (lac Ducato et Strowel (2021)). Les poursuites en cours contre les outils d’IA générative aux États-Unis et au Royaume-Uni allèguent que des outils tels que ChatGPT portent directement atteinte aux œuvres protégées par le droit d’auteur (lac ici, ici et ici). Ils incluent des allégations selon lesquelles les modèles d’IA générative, tels que celui d’OpenAI, sont « entraînés » [on] caches d’œuvres protégées spoliées », ce qui constitue un « vol systématique à grande échelle » (lac Guilde des auteurs contre Open AI). Dans l’UE, l’accès légal au contenu est une condition préalable pour bénéficier des exceptions TDM disponibles (Cf. Arts 3 et 4, et considérants 17 et 18 à l’appui, Directive CDSM 2019).). Tant que le résultat généré par l’IA reflète la création intellectuelle de l’auteur, sa touche personnelle, le cadre actuel peut dûment tenir compte de « l’auteur humain romancé » qui est au cœur du droit d’auteur. Mais que se passe-t-il lorsque l’IA générative va plus loin, de telle sorte qu’il n’y a plus de « ressemblance directe avec une œuvre spécifique préexistante » ? (lac Senftleben (2023)). Cela peut, par exemple, être le cas des résultats provenant de données synthétiques générées artificiellement, comme c’est le cas des vidéos deep fake (lac Tyagi (2023)). Les données synthétiques peuvent être définies comme des « données artificielles qui imitent des observations du monde réel » (lac Science des données (2022)). Le défi qui apparaît avec l’essor des données synthétiques est qu’il peut devenir de plus en plus difficile d’établir une corrélation entre les travaux préexistants et les résultats générés par les techniques avancées de TDM. C’est pour cette raison qu’une rémunération opportune et adéquate de l’auteur humain devient cruciale. Introduction de licences légales, comme suggéré par des chercheurs tels que Senftleben et Geiger et Iaiaéquilibrer les intérêts et le droit à la culture et à la science, d’une part, et la liberté d’expression artistique, d’autre part, constituent une recommandation politique très attractive pour tenir compte des différents titulaires de droits et utilisateurs dans le débat sur l’IA générative.
En ce qui concerne le cadre juridique du TDM, les différentes juridictions ont des approches divergentes (lac Flynn et coll. (2022)). La disposition américaine sur l’utilisation équitable semble la plus permissive (au moins jusqu’à ce que le litige actuel soit résolu), suivie par la disposition japonaise sur le TDM en vertu de l’article 30-4 qui autorise l’utilisation des œuvres à des fins autres que de divertissement (lac ici). Au Royaume-Uni, qui propose actuellement le TDM à des fins non commerciales, la discussion sur une exception permissive au TDM à quelque fin que ce soit a été rapidement réduite au silence, la Publishers Association ayant exprimé ses inquiétudes concernant une exception formulée en termes généraux (lac ici, ici et ici). Dans l’UE, l’exception TDM pour les organismes de recherche et les institutions du patrimoine culturel ne permet pas de dérogation en vertu de l’article 3 de la directive CDSM (lac ici et ici). Toutefois, le TDM à des fins commerciales au titre de l’article 4 peut être exclu (lac ici). Il s’agit d’une limite importante de l’approche actuelle de l’UE car, comme cela apparaît de plus en plus clairement, la recherche n’est pas entreprise uniquement par les universités et les instituts de recherche ; Les innovations numériques perturbatrices notables de ces derniers temps sont principalement venues d’acteurs privés. Les dispositions restrictives des articles 3 et 4 du CDSM pourraient donc apparaître comme un « désavantage concurrentiel important pour l’économie de l’UE » (lac ici).
Pour que le droit d’auteur atteigne son objectif fondamental, qui est de renforcer la créativité, chaque nouvelle génération d’auteurs et de créateurs doit jouir de la même liberté que ses prédécesseurs d’utiliser « les œuvres préexistantes comme éléments constitutifs de nouvelles créations » (lac Senftleben (2012) ). Ici, les exceptions et limitations (E&L) ont un rôle important à jouer dans l’équilibre entre les intérêts des utilisateurs et ceux des titulaires de droits. S’il devait y avoir un E&L plus large, quelle devrait être la conception d’un tel cadre ? La portée plus large de l’E&L devrait-elle se limiter uniquement au TDM ?
En ce qui concerne le TDM, il y a eu un appel récurrent en faveur d’une exception TDM largement encadrée dans l’UE, conçue sur le modèle du concept japonais de [non] jouissance d’une œuvre en vertu de l’article 30-4 de la loi japonaise sur le droit d’auteur (lac Ueno (2021)). À mon avis, nous devrions toutefois avoir une exception générale formulée de manière encore plus large (mais bien définie) dans l’UE. Même si le lien entre une exception TDM ciblée et une E&L générale et formulée de manière plus large peut être ténu, il est néanmoins très tendu. Même si un cadre fermé offre sans aucun doute une certitude, la réalité numérique exige de la flexibilité dans l’interprétation des E&L. Cela peut s’expliquer par le fait que la technologie est disruptive et que les développements numériques peuvent suivre un nombre incalculable de chemins. Un cadre E&L ouvert et flexible offre l’espace et la portée nécessaires pour s’adapter à ces chemins imprévisibles suivis par l’innovation et la créativité. Dans sa lettre au commissaire chargé du marché intérieur, la Société européenne du droit d’auteur appelle également à « une réévaluation des exceptions et limitations existantes, en particulier pour la recherche, y compris l’exploration de textes et de données » (lac Société européenne du droit d’auteur (2023)).
Les exceptions TDM plus étroites en vertu des articles 3 et 4 de la directive CDSM sont généralement révélatrices de l’efficacité limitée des E&L fermées. Une E&L au sens large peut non seulement prendre en compte des utilisations telles que le TDM, mais également répondre de manière appropriée à toute autre demande imprévue de l’économie numérique. Dans la pratique, la nature restreinte et fermée des E&L a conduit à plusieurs reprises à des résultats inattendus. L’échantillonnage de musique en est un bon exemple. Dans le repère Pelham Dans cette affaire, l’utilisation par Sabrina Seltur d’un extrait de deux secondes de l’œuvre de musique électrique classique de Kraftwerk, « Metall auf Metall », a donné lieu à un litige de plus de 20 ans et à un renvoi préliminaire devant la CJUE (lac Senftleben(2020) et Jütte et Quintais (2021)).
Considérant que nous avons eu une récente révision du droit d’auteur acquis communautaire, à l’issue d’un long processus législatif, et de nombreux États membres n’ont mis en œuvre que récemment les dispositions de la directive CDSM (voir ici) ; Dans quelle mesure une telle recommandation politique est-elle pratique et réalisable ? Comme il mérite une réflexion non seulement sur la conception d’une E&L au sens large, mais également sur sa cohérence avec les valeurs communes fondamentales de l’UE, la Charte des droits fondamentaux, c’est une réflexion pour un article de suivi…
Cet article de blog résume les principales recherches et conclusions de l’article « The Copyright, Text & Data Mining and the Innovation dimension of Generative AI » (à paraître, 2023, pré-imprimé, disponible ici).