La Legal IA au cœur d’un travail collaboratif
Notre directeur associé, Thomas Saint-Aubin, qui pilote notre démarche d’innovation, a présenté lors du Tech Up Legal notre vision pour la constitution de ces biens communs numériques de la Legal IA en présence de M. Martin Bussy, CEO de Legal Innovation & Transformation, de M. le professeur Thibaut Douville, professeur des universités, Agrégé de Droit Privé à l’Université de Caen-Normandie et de Mme Valéry Lontchi, présidente d’Avotech et CEO de Chat.legal.IA, une solution d’IA pour les professionnels du droit.
Nous participons au regroupement en cours des acteurs du droit qui souhaitent co-développer des modèles d’affaires autour des communs numériques pour en garantir la mise à jour et le codéveloppement dans la durée.
Il s’agit notamment de garantir :
- La prise en compte du modèle de Civil Law dans des LLM (Large Language Models) entraînés sur des modèles Common Law
- La maîtrise par les juristes des réponses juridiques générées par l’IA
- L’identification et la définition d’une erreur juridique dans une réponse générée par la Legal IA.
Au cours de son intervention, Thomas Saint-Aubin a présenté quelques exemples des communs numériques de l’IA en cours de développement dans l’écosystème.
Compliance IA et éthique numérique, indispensables de la Legal IA
Il s’agit d’encourager la mise à disposition ouverte ou partagée d’outils d’évaluation des IA génératives pour différentes tâches
Depuis 4 ans, sous l’impulsion du Augmented Law Institute de l’EDEC, avec notamment le cabinet Govern and Law et l’AFJE , nous sommes impliqués dans le projet ‘’Digital Ethic Officer’’ qui vise à former des juristes au management juridique et éthique de l’IA.
On relève l’absence d’outils communs d’auto-évaluation permettant d’évaluer la fiabilité des résultats générés par l’IA et la conformité des solutions existantes.
Il semble opportun de fournir des outils d’évaluation pour la conformité des IA génératives et des ressources en accès libre.
Ce réseau DEO contribue à l’émergence d’une doctrine et d’outil partagé sur cette thématique stratégique pour déployer des IA juridiques souveraines et conformes.
Legal IA et LLM
Il s’agit d’encourager la mise à disposition de giga-modèles génératifs “adaptés” à des cas d’usage métier spécifiques, qui permettront à certains partenaires du projet de commercialiser un ou plusieurs produits ou services innovants.
Cette démarche consiste notamment à fournir sous licence ouverte ou à réciprocité des modèles de fondation Legal IA et des ontologies juridiques, par exemple sur le droit des contrats.
Thomas Saint-Aubin a pris l’exemple de SaulLM-7B, un grand modèle de langage (LLM) conçu pour le domaine juridique.
Avec plus de 7 milliards de paramètres, SaulLM-7B est le premier LLM conçu explicitement pour la compréhension et la génération de textes juridiques.
Ce Legal LLM s’appuie sur l’architecture Mistral 7B. SaulLM-7B est entraîné sur un corpus juridique principalement anglais de plus de 30 milliards de tokens.
Le codéveloppement de Legal LLM verticalisé dans le secteur juridique est au cœur de notre démarche d’innovation avec nos partenaires universitaires, les autres legaltech et les professionnels du droit.
Les textes juridiques, notamment fondés sur la tradition romano-civiliste, qui sont caractérisés par leur syntaxe unique et leur vocabulaire spécialisé, présentent un défi linguistique et technique de premier niveau pour l’innovation IA.
L’approche de SaulLM-7B se concentre sur un pré-entraînement approfondi en utilisant des corpus juridiques dédiés provenant de juridictions anglophones.
Thomas Saint-Aubin a insisté sur 2 points en conclusion :
- SaulLM-7B (et son code d’évaluation) est publié sous la licence MIT (une licence de type permissif) ce qui encourage le développement collaboratif et permet la création de modèle d’affaires vertueux
- Sur son corpus de 30 milliards de token, qui sert de base pour le pré-entraînement continu, SaulLM-7B s’appuie largement sur des données juridiques anglophones et de common law : les données juridiques de l’UE représentent environ 1% de l’UE avec environ 300 millions de token.
Il reste donc tant à faire pour codévelopper une IA juridique ouverte, conforme, souveraine et francophone, SaulLM-7B est un excellent bien commun numérique du droit à intégrer à la démarche.