Aller au contenu principal

Science des données et intelligence artificielle à l’Université Paris-Saclay

Innovation Article publié le 04 mars 2021 , mis à jour le 04 mars 2021

L’Université Paris-Saclay se positionne en acteur majeur de la recherche, de la formation, et de l’innovation en matière de science des données et d’intelligence artificielle (IA), et multiplie les initiatives. L’institut DATAIA Paris-Saclay est l’un de ses porte-drapeaux, en France et à l’international, et favorise des collaborations public-privé. L’Agence nationale pour la recherche soutient aussi l’Université dans plusieurs projets en IA, notamment avec un programme de chaires de recherche. L’Université abrite aussi d’autres chaires et partenariats public-privé.

L’institut DATAIA Paris-Saclay a été créé dans le cadre de l’appel Institut Convergences en 2017. L’Institut s’inscrit pleinement dans ce programme, pour développer des projets d’IA au service de l’humain dans l’écosystème de Paris-Saclay.

Initialement piloté par les entités de l’ex-ComUE Université Paris-Saclay (la communauté d’université et d’établissements de l’Université Paris-Saclay) - avant la création officielle de l’Université Paris-Saclay le 6 novembre 2019 - et de l’Institut polytechnique de Paris (IP Paris), DATAIA Paris-Saclay rejoint désormais pleinement le giron de l’université. Le principe en est acté et la convention est en cours de signature. Bertrand Thirion, directeur de DATAIA Paris-Saclay et directeur de recherche en analyse statistique et imagerie du cerveau à Inria Saclay précise : « Nous avons ajusté le positionnement de DATAIA Paris-Saclay pour en faire l’institut d’IA de l’Université Paris-Saclay. Nous allons bien sûr continuer à travailler en collaboration avec nos collègues de l’IP Paris et HEC qui mènent des projets de grande qualité, et complémentaires aux nôtres en matière d’IA ».

La mission de DATAIA Paris-Saclay : innovation, éthique et partenariats industriels

DATAIA Paris-Saclay regroupe les expertises pluridisciplinaires de l’Université Paris-Saclay afin de booster la recherche en sciences de données et en IA : « Nous structurons et favorisons les interactions scientifiques grâce à la mise à disposition auprès du monde académique de tout le potentiel de la science des données ». Et les domaines d’interventions de l’institut sont nombreux : énergie et écologie, e-science, industrie, réseaux des personnes et des objets, santé et bien-être, urbanisation 4.0 et transport.

DATAIA Paris-Saclay crée aussi des ponts entre des disciplines traditionnellement cloisonnées : les mathématiques, les sciences informatiques et les sciences juridiques, économiques et sociales. Les enjeux sociétaux et éthiques liés à ces innovations sont en effet prégnants et ne peuvent faire l’économie d’une collaboration serrée entre les disciplines scientifiques et les sciences humaines. « Nous souhaitons promouvoir un monde où la machine est dédiée au service du progrès humain, et nous mettons un point d’honneur à sensibiliser et éduquer tout le personnel académique à ces questions ».

L’institut intègre par ailleurs un programme d’affiliation industrielle afin de favoriser des collaborations avec le monde économique. Ces derniers soumettent à l’institut des problématiques donnant lieu à la création de projets de recherche en laboratoire ou de chaires dédiées.

Un rayonnement européen et international

DATAIA Paris-Saclay initie aussi des collaborations scientifiques à l’échelle européenne. En septembre dernier, l’institut a créé, en partenariat notamment avec l’institut interdisciplinaire d'intelligence artificielle (Paris artificial intelligence research institute - PRAIRIE) de l’université de Paris et l’université Paris, sciences et lettres (PSL), et le Sorbonne center for artificial intelligence (SCAI) de Sorbonne Université, un nouveau nœud du réseau européen ELLIS (European laboratory for learning and intelligent systems) à Paris. Ce regroupement scientifique favorise la recherche européenne en intelligence artificielle.

Au niveau international, les chercheurs de DATAIA Paris-Saclay sont très impliqués dans la constitution des réglementations internationales. Ils contribuent notamment au « Global Partnership on IA », une initiative lancée par le Canada et la France, puis rejointe par l'Union européenne et dix autres pays, pour promouvoir une utilisation responsable de l’IA.

Les soutiens de l’ANR

En matière de financement, en avril dernier, le programme doctoral UDOPIA de l’Université Paris-Saclay est retenu par l’ANR dans le cadre de son appel à projet « contrats doctoraux en intelligence artificielle - établissement » qui s’inscrit dans la stratégie nationale pour l’intelligence artificielle. Le projet reçoit ainsi 1,8 million d’euros pour cofinancer 30 bourses de thèses pendant trois ans. Les dix premiers étudiants arrivés en octobre 2020 ont accès au vaste écosystème de DATAIA Paris-Saclay et bénéficient de ses liens avec l’industrie.

L’ANR finance aussi un programme de 40 chaires de recherche et d’enseignement en IA, à hauteur de 22 millions d’euros, dont 10 sont issues de l’Université Paris-Saclay. Elles sont dédiées à des projets de recherche pour une durée de quatre ans. Certaines chaires nouent des partenariats avec des acteurs industriels.

Les chaires de l’Université Paris-Saclay

Les 10 lauréates de l'appel à projets de l’ANR situées sur le plateau sont déjà très actives. Plusieurs travaillent sur des sujets liés aux neurosciences, à l’instar de Brain (Bridging artificial intelligence and neuroscience), portée par Alexandre Gramfort, chercheur au sein de l’équipe Parietal (Université Paris-Saclay, Inria, CEA). Mais aussi de Big2Small, portée par Edouard Duchesnay, chercheur à Neurospin (Université Paris-Saclay, CEA). D’autres portent sur des applications liées à la santé comme TopAI (Topological data analysis for machine learning and AI), portée par Frédéric Chazal, chercheur au sein de l’équipe Datashape (Université Paris-Saclay, Inria). Et Learnl, portée par Gaël Varoquaux, chercheur au sein de l’équipe Parietal (Université Paris-Saclay, Inria, CEA). Humaaine (Human-machine affective interaction & ethics), portée par Laurence Devillers, chercheuse au Laboratoire interdisciplinaire des sciences du numérique (LISN - Université Paris-Saclay, CNRS, CentraleSupélec, Inria), travaille sur la conception de systèmes éthiques d’IA. La chaire Humania, portée par Isabelle Guyon, professeure de big data à l’Université Paris-Saclay et membre de l’équipe Tackling the underspecified (TAU) commune entre Inria Saclay et le LISN, prévoit quant à elle de rendre l’IA accessible à tous.

La chaire Karaib (Knowledge and representation intégration on the brain), portée par Bertrand Thirion, est spécialisée en agrégation et formalisation de connaissances dans le domaine des neurosciences, afin de développer la compréhension de la structure et de la fonction du cerveau à partir de données de neuro-imagerie. « Nous voulons améliorer la formalisation de données en neurosciences pour participer à la refonte des catégories héritées de la psychologie, en rendant la science reproductible. En neurosciences, le partage de données n’est pas encore une évidence. Mais cela est en train de changer, grâce à une nouvelle génération de chercheurs qui a compris l’importance de partager leurs outils de travail et les données qui sous-tendent leurs résultats. L’outil Karaib va permettre de mieux exploiter ces données hétérogènes. »

La chaire Bridgeable (Bridging the gap between iterative proximal methods and neural networks) est portée par Jean-Christophe Pesquet, directeur du Centre de vision numérique (CNV - Université Paris-Saclay, CentraleSupélec) et de l’équipe Optimisation, imagerie et santé (OPIS - Université Paris-Saclay, CentraleSupélec, Inria). Elle a pour objectif de répondre à deux problématiques principales : l’explicabilité et la fiabilité de l’IA, qui repose sur des réseaux de neurones. À l’heure actuelle, il n’est pas toujours possible d’expliquer pourquoi certains algorithmes d’IA conduisent à certaines décisions. Et la sensibilité aux perturbations adverses des réseaux de neurones peut parfois complètement fausser une prise de décision par une IA. C’est grâce aux outils mathématiques de l’optimisation que cette chaire ambitionne de résoudre ces problèmes. « Nous sommes convaincus que c’est dans le domaine des mathématiques que nous pourrons trouver des garanties absolues. »

La chaire Foldicco, portée par Jean-François Mangin, chercheur à Neurospin (Université Paris-Saclay, CEA) s’intéresse à la géométrie du cerveau, et plus particulièrement aux plissements du cortex. Grâce à l’IA, son équipe travaille à y déceler des signatures, jusque-là insaisissables, pour diagnostiquer très précocement un risque de pathologie psychiatrique lié à une anomalie de développement. « Chaque cerveau est unique ; les motifs de plissement dans la population sont si variés que nos capacités cognitives ne permettent pas de déchiffrer leur sens. Ce sont en quelque sorte des hiéroglyphes et l’IA est une alliée indispensable pour transformer en pierre de rosette les grandes bases de données récentes qui combinent cartographie anatomique et fonctionnelle. » La chaire ambitionne de créer un dictionnaire des motifs à partir d’une base de neuro-imagerie issue de plus de 70 000 personnes.

La chaire Biscotte (Bridging statistical and computational efficiency in artificial intelligence) est portée par Gilles Blanchard, chercheur au Laboratoire de mathématiques d'Orsay (LMO – Université Paris-Saclay, CNRS). Son équipe travaille à combiner l’efficacité statistique et computationnelle pour optimiser l’apprentissage automatisé de l’IA. C’est-à-dire évaluer le volume de données nécessaire à l’IA pour apprendre des informations et prédire des évènements. « Plus on a de données, plus on favorise un apprentissage précis et sans erreur. Comme pour la reconnaissance d’images. » Au vu des volumes massifs de données à manipuler, la chaire développe aussi des approches computationnelles, comme les méthodes à noyau ou de sélection de variables, pour trouver la manière de réduire les temps de calculs et de mémoire, et leur consommation énergétique. « Notre contribution fondamentale et théorique pourra à terme être intégrée dans des « boîtes à outils », c’est-à-dire des logiciels applicatifs, utilisables pour de multiples cas d’usages. »

Créés avant le lancement de DATAIA, d’autres initiatives sont dédiées à l’IA au sein de l’Université. À l’instar de la chaire Langages dynamiques orientés données, de la Fondation Paris-Saclay Université, portée par Kim Nguyen, chercheur et maître de conférences en informatique. Son programme de travail consiste à valoriser, traiter et regrouper les données issues de multiples sources, grâce à un langage de programmation accessible. Mais aussi de la chaire Industrial data analytics and machine learning du Centre Borelli (Université Paris-Saclay, CNRS, ENS Paris-Saclay, Université de Paris, SSA), dont est titulaire Mathilde Mougeot, chercheuse et professeure en science des données à l’ENSIIE. Créée en 2016, cette chaire collabore étroitement avec les partenaires industriels : Atos, Banque de France, Bertin Technologies, Michelin, SNCF. Le programme de la chaire s'est fixé trois objectifs : la recherche scientifique, la diffusion des connaissances et la formation des jeunes chercheurs. Pour le premier, il s’agit de travaux de recherche académique en mathématiques de haut niveau et appliquées, pour résoudre des grands défis industriels. Les principales thématiques sont l’apprentissage par transfert, le traitement des signaux sur graphes et la surveillance de systèmes complexes. « L’IA a besoin de grands jeux de données pour calibrer par apprentissage des modèles performants. Des jeux de données restreints peuvent constituer un frein pour y parvenir. Nous travaillons sur des méthodes d'apprentissage par transfert capables de transférer à de nouvelles données cibles des connaissances acquises à partir de données sources, afin de résoudre des problèmes pour lesquels les réseaux de neurones n’ont pas été explicitement entraînés. »

AIDA : un partenariat public-privé avec IBM

L’attractivité et la puissance de DATAIA est pleinement illustrée par le partenariat noué entre l’Université et le département recherche et développement d’IBM France pour développer le projet AIDA (Artificial Intelligence for Digital Automation). Dédié à la recherche collaborative, il vise, pour IBM, à développer des outils d’automatisation des processus opérationnels des entreprises grâce à l’IA. Et pour l’Université, à mettre en œuvre son excellence académique en matière d’IA , avec six laboratoires mobilisés sur le projet (LISN, LGI, L2S, LIST, Centre Borelli et ISP), sur des problématiques opérationnelles. Ce Programme stratégique pour la compétitivité (PSPC), dont les travaux ont débuté en 2019, s’inscrit dans le Programme d’investissement d’avenir (PIA), qui le finance à hauteur de 12 millions d’euros. S’y ajoutent 21 millions d’euros financés par IBM et des industries partenaires (STET, Softeam, et Decision Brain).

Pour développer des solutions d’automatisation, « big blue » bute contre trois difficultés principales pour lesquelles elle requiert l’expertise de l’Université. Il s’agit de développer les capacités évolutives des solutions développées, et de résoudre le problème d’incertitude sur les données et leur “bruit” (c’est-à-dire leurs imprécisions ou approximations). « Ce sont des sujets très importants car ils ont un fort impact sur l’acceptabilité de la technologie par ses futurs utilisateurs. Il faut créer de la confiance, et donc assurer l’explicabilité des processus de décision, pour ne pas courir le risque que la technologie soit in fine rejetée par la société », commente Michel Mariton, vice-président Développement économique à l’Université Paris-Saclay.

De nouvelles coopérations s’ébauchent déjà autour de sujets relatifs aux sciences sociales. Car l’IA modifie les interactions entre l’humain et la machine, et transforme l’organisation des entreprises, avec des conséquences que les sociologues contribuent à comprendre. 

Fort de ces multiples collaborations, IBM a pris la décision de s’installer sur le campus de l’Université, et fait actuellement construire un immeuble à cet effet qui accueillera 250 de ses collaborateurs d’ici la fin de l’année 2021. « Notre partenariat va désormais bien au-delà du projet AIDA. IBM souhaite s’enraciner durablement dans une communauté de recherche, et nous bénéficions de leur expérience industrielle. Nous nourrissons aussi l’espoir que la firme décide dans quelque temps d’installer une branche de IBM research sur le campus. »

Au-delà des coopérations en recherche, c’est aussi la formation qui bénéficie de ce rapprochement, en cohérence avec la volonté de l’Université de réunir dans une même ambition formation et recherche. L’enseignement est ainsi enrichi grâce aux nombreux cas d’études pratiques dans lesquels les professeurs peuvent puiser. « C’est un point déterminant, car l’IA représente une révolution industrielle qui va profondément transformer les pratiques de toutes les entreprises. Comme par exemple celles du secteur de la mécanique ou de l’électronique, qui n’ont pas aujourd’hui de compétences internes sur les données et leurs algorithmes. Nous avons donc une opportunité pour que les diplômés qui sortent de notre Université, du niveau licence au post-doctorat, apportent des compétences robustes en IA, et contribuent à la transformation numérique de ces entreprises », conclut Michel Mariton.