Publié le : 22/07/2024

IA Générative et management des contrats: vers un contrat augmenté

Vers un legal data space européen, un bien commun pour la gouvernance des données contractuelles 

S’il est essentiel de pouvoir transformer ses contrats en données via des CLM et de pouvoir les exploiter dans un RAG interne, il est tout aussi stratégique de pouvoir  mutualiser des datasets afin d’entraîner un modèle de fondation susceptible de comprendre notre  droit des contrats et ses évolutions.

Pour garantir notre souveraineté technologique autour de l’IA en général et plus particulièrement l’IA appliquée au droit, la stratégie numérique européenne pour l’IA et la donnée de confiance, transposée dans le droit européen ( RGPD, AI Act, DSA, Data Act, Data Governance Act) , constitue un atout considérable. La stratégie européenne pour les données vise à créer un marché unique des données qui garantira la compétitivité mondiale de l’Europe et la souveraineté des données. 

Pour entraîner et fiabiliser l’IA Générative appliquée au domaine des contrats, il faut pouvoir mettre en place une gouvernance des données contractuelles complexe, allant au-delà de l’approche binaire ouverte/ fermée et en capacité de garantir le contrôle et la traçabilité. 

Mis en place grâce au Data Governance Act et associés à de nombreux biens communs numériques associés ( GaiA-X, Simpl…), les Data Spaces, ces  “espaces européens communs pour les données” garantissent la disponibilité d’un plus grand nombre de données à utiliser dans l’économie et la société, tout en permettant aux entreprises et aux personnes qui génèrent les données de garder le contrôle. 

Dans le cadre de la constitution de notre  consortium pour répondre à l’appel à projet de la BPI sur pour le développement des usages de l’IA Générative, la constitution d’un legal data space , qui s’appuiera sur  les briques pré-existantes pour les acteurs du marché du droit,  voit progressivement le jour. 

Dans une approche dite ‘’multi-RAG’’, Il permettra à chaque acteur de partager des données contractuelles utiles pour le développement collaboratif de l’IA juridique  ( contrats  pseudonymisées, bases légales et règlements pour la conformité d’un contrat X, fichiers de finetuning de droits des contrats sur les différents LLM) afin de  pouvoir exploiter ses datasets enrichis pour sa pratique, et constituer durablement une ontologie du droit des contrats civilistes. 

Pour promouvoir ce futur legal data space européen, l’enjeu est simple et binaire: soit nous partageons nos données contractuelles entre nous, soit elles seront centralisées par une big tech.

Vers un contrat augmenté pour la gouvernance juridique des données utilisées par l’IA Générative 

Mais le développement de ces dataspaces européens implique également une évolution technologique en termes d’IA appliqué au contrat. 

En effet, nos démarches de recherche visant à développer une IA juridique de tradition romano-civiliste et nos compétences de juristes legaltech nous ont amené à travailler sur la manière optimale de traduire le droit dans le code. 

Notamment, nous avons pu observer qu’il s’avère impossible et non souhaitable de traduire nativement l’ensemble du droit dans le code à travers l’encodage, et de représenter le droit intégralement dans une approche arithmétique. 

C’est dans ce cadre que nous avons testé de nouvelles hypothèses consistant non plus à représenter le droit intégralement dans une approche arithmétique, mais dans un cadre de régulation numérique qui doit se réinventer pour imposer sa gouvernance et sa légitimité à une société déjà gouvernée par les algorithmes et la programmation (approche Code Is Law). 

Ainsi, dans le prolongement des travaux relatifs à la technologie du machine learning au service du juriste augmenté et au scrapping de données légales (Scrapping Legal), nous avons pu participer en collaboration avec l’Institut Digital New Deal, à un projet de recherche impulsé par la Commission Européenne sur la régulation des dataspaces. Le but principal était de modéliser les chartes de gouvernance des data spaces selon les principes du « Law Is Code » en prenant en compte la forme de standards juridico-techniques ouverts permettant : 

  • de disposer de biens communs numériques pour modéliser les chartes et intégrer de la hard law et de la soft law ;
  • de définir des processus garantissant l’interopérabilité entre les corpus de règles applicables
  • de créer des outils et de définir des niveaux de décision d’aménagement entre les différents
    outils.

Afin de définir des processus susceptibles de garantir l’interopérabilité, la stratégie adoptée repose sur la traduction des principales règles issues de la hard law et de la soft law sectoriel dans un référentiel ouvert basé sur la logique déontique, en repartant du corpus de règles communes issu du code européen . 

Cette norme supranationale, enrichie par les autres dispositions applicables à la réglementation de l’IA en cours d’élaboration au niveau européen, doit permettre de faire le lien entre l’ensemble des chartes de gouvernance des données et des différents dataspaces labellisés et servira de préambule. 

Sous cet angle, la démarche poursuivie consiste à définir des règles partagées pour identifier les éléments des chartes qui ne seront pas compatibles d’un système à un autre et des processus pour lever l’incompatibilité.

L’hypothèse testée consiste donc à la mise en place d’un Legal Framework, codé en HDRL « Holistic Data Rule Language » pour articuler les règles de partage des données et les recueils de règles, englobant à la fois les lois contraignantes et non contraignantes, et servant de « lingua franca » à l’écosystème de partage des données de l’UE.

Ce langage commun permettrait à toutes les parties prenantes de mieux comprendre les règles de partage des données, faciliterait les processus d’automatisation au sein de l’écosystème et aiderait à mieux contrôler l’équilibre entre l’innovation et la réglementation.

Plus spécifiquement pour déployer l’utilisation de l’IA Générative dans le domaine des contrats, il permettra aux acteurs du droit et de la tech de partager des droits et des devoirs sur des données contractuelles, pseudonymisées ou non, et de travailler collaborativement sur le codéveloppement d’un LLM continental adapté à la tradition civiliste du droit des contrats. 

 

par Thomas Saint-Aubin et Pierre Marchès, lire l’article complet publié dans la revue  »Droit et Patrimoine »  et disponible en Open Access:  https://hal.science/hal-04626943v1

Partagez cet article

Vous aimeriez aussi :

Démarrez votre essai gratuit

Utilisateurs