J'ai le plaisir d'accueillir aujourd'hui Martin Huynh. Martin est responsable du service Propriété Industrielle au sein du département Propriété Intellectuelle de Dassault Systèmes, premier éditeur de logiciels français leader des jumeaux virtuels. S’intéressant aux sujets combinant propriété intellectuelle et logiciel, il intervient notamment au CEIPI sur la brevetabilité des inventions mises en œuvre par ordinateur. Il est aussi l’auteur d’un amicus curiae dans le cadre de la décision G1/19 sur la brevetabilité des inventions liées à la simulation.
IA génératives, NLP, LLM et GPT
Il y a quelques semaines se tenait le salon Big Data & IA à Paris. Cette édition illustrait parfaitement la montée en puissance des Intelligences Artificielles Génératives, du Natural Language Processing (NLP), des Large Language Models (LLM) et des Generative Pre-trained Transformer (GPT). De nombreux acteurs présents ont intégré ces technologies à leurs solutions en l’espace de quelques mois seulement. Il existe relativement peu de doctrine sur la brevetabilité même de ces technologies dont le développement fulgurant n’échappe à personne, surtout depuis leur accessibilité à tous vulgarisée par le célèbre Chat GPT. Beaucoup de professionnels en brevet estiment que ce type d’invention est difficile voire impossible à breveter, surtout auprès de l’Office Européen des Brevets (OEB), encore plus que pour d’autres domaines relevant des inventions mises en œuvres par ordinateur (IMO).
Directives d’Examen de l’Office Européen des Brevets
Les parties pertinentes des Directives en vigueur (notamment G-II-3.3.1 « Intelligence artificielle et apprentissage automatique » + G-II-3.6.4 « Systèmes de gestion de bases de données et recherche d'informations ») dressent effectivement un tableau assez défavorable pour des inventions relevant du NLP et des LLM, expliquant en grande partie l’impression générale sur la discrimination pesante sur ces technologies relayée collectivement par bon nombre de professionnels des brevets.
Sauf que… depuis, la décision G1/19 de la Grande Chambre de Recours du 12 mars 2021 est susceptible d’apporter un éclairage nouveau sur le contour de la brevetabilité des IMO et les orientations à donner. Bien que la décision concerne initialement la brevetabilité dans le domaine de la simulation, il est admis que de nombreux enseignements de G1/19 sont généralisables à toutes les IMO, donc y compris le NLP et les LLM bien que non spécifiquement traités par G1/19. Toutefois, cette décision n’a eu aucun impact sur les parties des directives précitées lesquelles n’ont pas été modifiées ou mises à jour depuis les dernières éditions en mars 2022 ou mars 2023, publiées après G1/19, et installant ainsi un peu plus cette discrimination. De plus, toutes les décisions citées sont antérieures à la décision G1/19 du 12 mars 2021. Une analyse à la lumière de G1/19 semble donc être pertinente.
G1/19 : principes de non-privilège et de non-discrimination dans les catégories d’IMO
Selon G1/19, « Aucune catégorie d'inventions mises en œuvre par ordinateur ne peut être exclue a priori de la protection par brevet. » (G1/19 §140). La Grande Chambre de Recours précise que ce principe doit être appliquée de sorte qu’aucune catégorie d’IMO ne doit être « privilégiées au sein de la catégorie plus générale des inventions mises en œuvre par ordinateur, sans pour autant qu'il y ait de base légale qui explique un tel privilège. » (G1/19 §141). Il en est de même pour les discriminations sans base légale (G1/19 §142). Ainsi, considérer en préjugeant non brevetables des inventions relevant du NLP ou des LLM est contraire au principe édicté dans G1/19. Pour ces inventions y compris, « il doit être déterminé au cas par cas s'il est satisfait aux critères classiques de technicité, tels qu'applicables aux inventions mises en œuvre par ordinateur. » (G1/19 §141). Cela implique notamment la mise en pratique d’approche telle que COMVIK (T641/00), éprouvée et admise, pour l’examen des inventions dites mixtes, c’est-à-dire combinant des caractéristiques techniques et des caractéristiques non-techniques.
Technicité : caractère technique et objectif technique
Il est souvent reproché au NLP et au LLM de traiter des données cognitives, notamment des mots et des phrases, autrement dit des données s’adressant à la perception humaine. Cependant, bien qu’effectivement de nature cognitive, lors de leur traitement par un système d’IA, ces données ne font plus appel à la perception humaine mais sont des données traitées par le système d’IA sans intervention humaine. La doctrine de la chaine technique rompue ("broken technical chain fallacy") souvent citée pour les inventions en présence de contenu cognitif, contenu souvent jugé non technique, ne devrait donc pas systématiquement s’appliquer dans la mesure où aucun effet (non technique) dans l’esprit de l’utilisateur ne vient rompre la chaine technique.
La décision G1/19 n’a pas plus éclairci la définition du terme « technique » pourtant déterminante pour l’examen de la brevetabilité des IMO, et ce volontairement afin de tenir compte de l’évolution de la technologie comme elle s’en justifie à plusieurs reprises : « […] la notion de technicité doit rester ouverte » (G1/19 §88) ou « Les critères utilisés dans les questions, comme celui du "problème technique" ou de l'"effet technique allant au-delà de la mise en œuvre de la simulation", ne sont pas des exigences qui ont été définies par le législateur, mais ont été établis par la seule jurisprudence. Ces critères doivent pouvoir encore évoluer à mesure que la technologie avance, et d'autres critères doivent même pouvoir se faire jour s'ils conduisent à des interprétations plus pertinentes du droit. » (G1/19 §65). Une évolution du champ de la technicité serait utile pour prendre en compte certaines réalités technologiques.
La technologie évoluant nécessairement plus rapidement que le droit applicable, il n’est pas étonnant de considérer qu’il faudra encore des années voire des décennies avant que le caractère technique de certaines technologies dites nouvelles et évoluant très rapidement, telles que le NLP ou les LLM, soit banalement reconnu. La reconnaissance suffisante de la technicité du NLP et des LLM est encore loin.
En attendant, il est souvent autant difficile d’expliquer à l’OEB la technicité d’une invention dans le NLP ou les LLM que d’expliquer à des inventeurs data scientists que leur invention n’est pas technique…
Et la suite ?
Je n’estime pas avoir apporté une solution toute faite pour parvenir à la délivrance d’un brevet dans ces domaines techniques mais au moins d’avoir contribué au débat sur leur brevetabilité. Je trouve simplement cette discrimination collective sur les technologies basées sur le langage regrettable voire dommageable. Ces technologies sont certes plutôt difficiles à breveter en l’état actuel des choses. Difficile mais pas impossible. Pour y parvenir, le plus grand défi consistera surtout à raisonner au-delà du cadre légal actuel trop obsolète des Directives ou la jurisprudence et donc oser déposer des demandes de brevet relevant du domaine du NLP et des LLM et de les défendre.