[LUM#22] Gouverner les données

L’intelligence artificielle repose sur l’existence de données en quantité et en qualité suffisantes. Mais comment s’assurer que la mise à disposition des données de la recherche se fasse dans le respect du droit ? C’est l’objet de la mission qui a été confiée à Agnès Robin par le ministère de l’Enseignement supérieur et de la Recherche.

« Dans un contexte scientifique, qu’il s’agisse de recherche en IA ou autre, l’enjeu est de bien identifier le cadre législatif et réglementaire applicable aux données que l’on veut réutiliser », explique Agnès Robin, enseignante-chercheuse au Laboratoire innovation, communication et marché (Licem*). Si le principe d’ouverture des données de la recherche est affirmé depuis 2012, il comporte néanmoins des limites. La première est justifiée par la protection des données à caractère personnel. Un historien qui fouille les archives par exemple, pourra vouloir exploiter des données de l’état civil. « Le chercheur ne pourra diffuser les données issues de sa recherche qu’après anonymisation » explique la juriste.

Plateforme de ressources juridiques

S’il s’agit de données protégées par le droit d’auteur ou le droit sui generis des bases de données, il devra obtenir l’accord des titulaires de droits, « sauf s’il s’agit de fouille de textes et de données puisque c’est là une opération qui a fait l’objet d’une exception en 2019  ». Enfin, les données qui sont couvertes par un secret (secret défense, secret médical, secret des affaires, etc.) « disposent d’une protection absolue et ne peuvent faire l’objet d’une mise à disposition, sauf à passer par un tiers de confiance ».

Ces trois types de contraintes entraînent des effets différents auxquels il est nécessaire de prêter une attention très forte. Aussi, « l’objet de ma mission est de mettre à disposition des chercheurs et des services d’appui à la recherche, une plateforme qui les aide, en leur fournissant des informations juridiques précises, à analyser les jeux de données qu’ils utilisent ou qu’ils produisent », explique Agnès Robin.

Partage des données

Si la politique de science ouverte affiche une volonté très nette de mettre à disposition de la recherche un maximum de données, elle exige de le faire dans le strict respect des règles « aussi ouvertes que possible, pas plus fermées que nécessaire. A l’origine de la science ouverte, il y a l’idée que les données ne restent pas dans les disques durs alors qu’elles pourraient faire avancer la recherche en étant utilisées par d’autres » justifie la chercheuse.

Pour en assurer le partage, l’Union européenne s’est dotée d’un espace de données commun pour la science ouverte baptisé European open science cloud. Les données de santé font quant à elles l’objet d’une réglementation spécifique encore en cours d’adoption qui permettra à terme leur partage via l’European health data space. « Les enjeux sont énormes pour la recherche comme pour les patients » conclut Agnès Robin !

Droit de l’IA

L’Union européenne a adopté, le 17 mai 2024, un règlement visant à garantir une IA respectueuse des droits fondamentaux. « C’est la toute première réglementation sur l’IA au monde, souligne Agnès Robin. Avant il n’y avait rien ! » Celle-ci introduit notamment la responsabilité qui peut résulter de la mise en œuvre des systèmes d’IA générative. « Il est désormais obligatoire d’organiser ce qu’on appelle l’explicabilité et la transparence algorithmique, autrement dit il faut pouvoir expliquer comment l’IA analyse les données, sur quelles données l’analyse est fondée et quelles sont les règles qui permettent éventuellement de prendre des décisions qui concernent les individus. » Ce qui est loin d’être toujours le cas.

Retrouvez les podcasts de l’UM désormais disponibles sur votre plateforme favorite (Spotify, Deezer, Apple podcasts, Amazon Music…).