“A chacun sa définition de l’intelligence artificielle !”

Alors que l’IA est de plus en plus présente dans nos vies et dans nos imaginaires avec son cortège d’interrogations légitimes et de fantasmes, sa réalité technologique reste pour beaucoup d’entre nous opaque. Réseaux de neurones, apprentissage profond, algorithme… Petite revue de concepts avec Anne Laurent, directrice de l’Institut de sciences des données de Montpellier et vice-présidente déléguée à la science ouverte et aux données de la recherche à l’UM.

Techniquement, comment pourrait-on décrire le fonctionnement d’une IA ?

Le concept générique de l’IA fait référence à la capacité pour une machine de reproduire nos capacités cognitives (raisonner, apprendre, reconnaître, créer…). Mais on se focalise souvent sur l’apprentissage. L’idée est alors de faire apprendre une notion à une machine en l’entraînant à distinguer des situations à partir d’exemples, comme le font les humains. Il existe beaucoup de méthodes d’apprentissage. Les données d’apprentissage en entrée, les exemples, peuvent par exemple être des photos de grains de beauté. Le système doit alors distinguer en sortie s’il s’agit ou non d’un mélanome.

Mais que se passe-t-il entre cette entrée et cette sortie ?

Les méthodes d’apprentissage les plus puissantes actuellement reposent sur les réseaux de neurones avec des systèmes et des traitements très complexes. Les concepts de base sont similaires à la façon dont notre système neuronal fonctionne. Le signal d’entrée active un neurone avant d’être transmis au suivant et ceci sur plusieurs niveaux, on parle de couches de neurones. Entre l’entrée et la sortie, le système va décider de transmettre ou pas au neurone suivant, à quel moment le transmettre etc. pour accomplir sa tâche. C’est cela qu’on appelle l’apprentissage par réseaux neuronaux ou deep learning. Deep signifie profond, parce qu’il y a beaucoup de couches de neurones et de connexions qu’il faut paramétrer. Pour que la machine accomplisse sa tâche avec succès, il faut donc l’entraîner avec des masses de données très importantes.

D’où viennent ces données ?

Quand on parle d’IA en recherche, ce sont des données de recherche issues par exemple d’instruments scientifiques d’imagerie, de séquençage ADN… Ces données sont produites soit par le chercheur ou la chercheuse qui utilise l’IA, soit par d’autres équipes qui ont travaillé sur le sujet et acceptent de les partager pour faire cet apprentissage. C’est là toute l’importance de la science ouverte.

Beaucoup de mathématiciens et d’informaticiens travaillent sur l’IA en créant de nouveaux algorithmes, qu’est-ce qu’un algorithme et quel est son rôle ?

Quand on veut faire faire quelque chose à une machine, il faut lui parler dans son langage, un langage de programmation : Python, Scala ou Java par exemple. Mais on ne code pas, on ne programme pas sans réfléchir. On commence par écrire un algorithme, c’est-à-dire écrire de manière formalisée, mais dans un langage compréhensible par un humain, la description conceptuelle des données utilisées et des opérations que l’on va faire faire à la machine, et les conditions dans lesquelles on va lui faire faire.

Si on devait définir l’intelligence artificielle, quelle pourrait être cette définition ?

Le terme d’IA est né en 1956, depuis il a eu une histoire, des évolutions, certaines sous-thématiques se sont développées plutôt que d’autres. Selon moi, pour définir l’IA, il faut reprendre la vision initiale des premiers pères fondateurs qui lui prêtaient la capacité à reproduire nos compétences cognitives : planifier, raisonner, décider, apprendre, sentir le monde, etc. Mais il faut aussi prendre en compte la rupture apportée récemment par les systèmes commerciaux d’IA générative. Ainsi pour beaucoup de personnes, IA égal IA générative ; pour d’autres, IA égal statistiques… A chacun sa définition de l’IA !

Depuis quelques mois, l’actualité de l’IA est saturée par Chat GPT, une IA générative. Qu’est-ce que c’est l’IA générative ?

C’est une forme d’IA qui permet de générer du contenu : du texte, de l’image, de la vidéo… Elle s’appuie sur l’entrée qu’on lui donne, à quoi elle ajoute tout ce qu’elle a réussi à apprendre dans son modèle. L’utilisateur peut l’orienter en lui donnant du contexte et une finalité. Il va lui demander, par exemple, de lui donner les causes du mélanome, mais en s’adressant à des adolescents qui vont passer leur été sur la plage, ou à leurs parents pour qu’ils sensibilisent mieux les ados. L’IA générative contextualise et adapte le discours à la finalité demandée. Les IA nous fascinent car elles nous parlent à tous.

Quels sont les autres types d’IA présentes dans notre quotidien ?

Certaines IA sont dédiées à des tâches dites de « classification ». Je vous ai parlé des grains de beauté mais j’aurais aussi pu parler de Pl@ntNet, cette application montpelliéraine de reconnaissance des plantes qui peut les classer parmi les milliers de catégories existantes dans la taxonomie végétale. Il y a aussi les IA qu’on dit segmentantes, très utilisées en marketing pour catégoriser la clientèle sans idée préconçue. Il y a des IA qui planifient et qui vont, par exemple, aider à organiser les emploisdu temps en résolvant des problèmes de combinatoires et de contraintes très complexes. D’autres font de la recommandation, sur des plateformes de vidéos enligne par exemple… Il y a énormément de sous-catégories et toutes ces tâches vont être de plus en plus cachées. L’IA utilise de plus en plus de modèles et on ne s’en rend parfois même plus compte…

Une des questions centrales dans le développement de l’IA c’est celle du contrôle. Peut-on vérifier, expliquer le travail de l’IA ?

C’est un sujet très actuel parce qu’il faut faire les choses en toute responsabilité et cela nous est maintenant imposé par le règlement européen voté cet été. Une fois dit cela, il faut différencier des niveaux de contrôle. Les enjeux et les méthodes seront par exemple différents selon que l’on souhaite que l’utilisateur final soit capable de comprendre la décision de l’IA, ou que cette explicabilité se situe plutôt au niveau des experts, par exemple devant un tribunal. J’ai toujours une petite musique en tête qui me dit de ne pas demander à l’IA plus qu’on en demande aux humains. Il ne faut pas s’attendre à ce qu’elle ne fasse pas d’erreurs, pas parce qu’elle est imparfaite, mais parce que la vie n’est pas binaire.

On évoque souvent des biais dans les résultats de l’intelligence artificielle. Peut-on les limiter ?

Il s’agit le plus souvent de biais de représentation dans les données en entrée. Si on veut apprendre à une IA à recommander des sections d’études aux lycéens par exemple et qu’on reproduit simplement la statistique existante, l’IA ne recommandera jamais ou très rarement la section math à des jeunes filles. Pour corriger ces biais, il faut augmenter les données pour donner à la machine des données où il y aura autant de filles que de garçons. C’est aussi la raison pour laquelle la France souhaite créer ses propres modèles d’IA, pour ne pas subir des biais culturels qui ne sont pas les nôtres.

On ne peut donc pas livrer des bases de données brutes à la machine, il faut les travailler ?

Oui et c’est un peu le fond de l’iceberg, un travail dont on parle moins qui est très fastidieux, très méticuleux, mais cela permet de rendre les données les plus exploitables possibles. C’est une des missions de l’ISDM que je dirige.

Quel est exactement le rôle de l’ISDM ?

L’ISDM, Institut de science des données de Montpellier, vient en support aux activités des chercheurs et chercheuses sur le plan de la gestion et du traitement des données de la recherche. Il fournit des outils, des infrastructures, de la formation mais aussi, grâce à la clinique des données, des conseils et des compétences. Nous organisons également les Halles de l’IA, une initiative de l’Université pour faire se rencontrer les acteurs autour de l’IA et des données et nous travaillons beaucoup sur le stockage des données et sur leur mise en sécurité. Pour résumer nous sommes une porte d’entrée pour toutes celles et ceux qui souhaitent monter dans le train de l’IA, et il le faut…

Vous êtes aussi vice-présidente déléguée à la science ouverte, quel est l’enjeu face au développement de l’intelligence artificielle ?

La science ouverte, c’est le carburant de ces apprentissages mais partage ne veut pas dire open bar ! Ouvrir à tous vents est une des modalités du partage mais ce n’est pas la seule, on peut poser des conditions et des restrictions, réfléchir à la sécurisation, à la protection et la valorisation du patrimoine scientifique.

Est-ce que l’IA est incontournable aujourd’hui pour la science ?

Oui, absolument, l’IA va transformer le métier de chercheur en augmentant notre capacité à produire un état de l’art, à vérifier, à structurer ou à challenger nos idées, etc. On va aussi accélérer le prétraitement de nos données, la gestion de certaines tâches administratives ou nos recherches de financement…  

Comment l’UM se positionne face à cette évolution ? 

Partout ! L’UM porte des projets ambitieux. Il s’agit à la fois de donner aux chercheurs et aux chercheuses la capacité de prendre en main toutes les formes d’IA, de donner à voir cette puissance de feu qu’a l’IA pour s’acculturer et changer au fur et à mesure nos pratiques. Tout en restant dans un cadre le plus éthique possible, sans faire « fuiter » nos idées et sans détruire la planète. L’UM soutien aussi avec force la recherche en IA et le développement de nouveaux algorithmes. Sont développées à Montpellier des méthodes de tout premier plan. C’est par exemple le cas des méthodes d’IA en santé, par exemple d’IA fédérée, en lien avec l’Inria. Entre l’utilisation et le développement il n’y a pas un énorme seuil, les deux s’alimentent.

Nous n’avons pas fait partie de la sélection finale dans l’appel d’offre IA Cluster, est-ce un frein au développement de l’IA à Montpellier ?   

Non car la dynamique IA cluster se poursuit avec beaucoup d’énergie. Les acteurs du monde socio-économique nous ont réaffirmé leur volonté de poursuivre cette dynamique. La Métropole est extrêmement motivée, la Région a voté cet été une stratégie IA très forte, les financeurs nous suivent… Le prochain enjeu sera de structurer cette dynamique et de la faire vivre. Nous avons également la chance de travailler avec le CHU qui compte parmi les plus dynamiques et les plus avancés sur la question de l’IA et du traitement des données de santé. Nous avons toutes les pièces du puzzle à Montpellier, avec un jeu d’acteurs très, très favorable, que je ne vois nulle part ailleurs.  

Retrouvez les podcasts de l’UM désormais disponibles sur votre plateforme favorite (Spotify, Deezer, Apple podcasts, Amazon Music…).