Johanne Cohen et Sophie Rosset : les nouvelles directrices du Laboratoire interdisciplinaire des sciences du numérique

Portraits de chercheurs Article publié le 29 avril 2021 , mis à jour le 29 avril 2021

Les parcours de Sophie Rosset, chercheuse dans le domaine du dialogue et des systèmes de dialogue, et de Johanne Cohen, chercheuse en informatique, se rejoignent aujourd’hui au sein du Laboratoire interdisciplinaire des sciences du numérique - LISN (Université Paris-Saclay, CNRS, CentraleSupélec, Inria), tout récemment créé. Respectivement directrice et directrice-adjointe de ce nouveau laboratoire, elles ont, chacune dans leur domaine, un parcours riche et singulier. 

Le domaine de recherche de prédilection de Johanne Cohen consiste à optimiser les algorithmes avec des applications au secteur des télécommunications, dans lequel des agents, humains ou artificiels, peuvent avoir des intérêts divergents.

Passionnée également d’échecs, elle les pratique depuis plusieurs années. Ce jeu millénaire implique de réaliser des calculs pour préparer ses coups à l’avance et anticiper toutes les offensives possibles d’un adversaire. Difficile de ne pas y voir une analogie avec son domaine de recherche : « je vois la création d’algorithmes comme la conception d’un jeu contre un adversaire, en fonction de sa puissance ». 

 

Les mathématiques et la conception d’algorithmes, une passion

Johanne Cohen s’intéresse très tôt aux mathématiques, matière où elle excelle. Elle s’oriente en effet vers un cursus en mathématiques, informatique et physique à l’Université Claude Bernard de Lyon en 1990. Puis elle poursuit sur cette voie en 1992 à l’Ecole normale supérieure de cette ville. « J’étais la seule femme de ma promotion mais cela ne m’a pas découragée. » Dès sa première année, elle se spécialise en algorithmique, qu’elle identifie rapidement comme sa discipline de prédilection. « J’aime beaucoup me confronter à des situations problématiques de type "casse-tête chinois" et trouver une solution automatique pour les résoudre. » 

 

Une spécialisation dans le domaine des réseaux

À la fin de ces trois années d’études, elle se lance dans une thèse en algorithmique dans les télécommunications, afin d’étudier la manière de calculer des routes dans les réseaux de communication. Elle l’effectue en 1998, au sein du Laboratoire de recherche en informatique - LRI (Université Paris-Saclay, CNRS). Puis, en 1999 et jusqu’en 2008, elle travaille à l’Université Henri Poincaré (Nancy 1), aujourd’hui Université de Lorraine, en tant que maîtresse de conférences spécialisée en algorithmes distribués. 

 

La théorie des jeux 

De 2008 à 2013, Johanne Cohen rejoint le laboratoire Parallélisme, réseaux, systèmes, modélisation - PRISM (Université Paris-Saclay, UVSQ, CNRS) en tant que chargée de recherche. Elle oriente ses travaux sur la conception d’algorithmes dans la théorie des jeux. La chercheuse utilise cette approche pour optimiser la commutation par paquets (c’est-à-dire la circulation des données), grâce à la conception d’algorithmes de distribution et répartition des tâches. « Cela évite la surcharge ou même un effondrement des réseaux. Et pour ceux sans fil, cela équilibre les flux, pour prévenir par exemple des incidents sur les antennes ou le ralentissement des communications. » 

 

L’ouverture à la biologie

Johanne Cohen aime s’atteler à de nouveaux sujets de recherche, ce qui la mène à retrouver le LRI en 2013. « Changer de laboratoire est très stimulant. J’aime varier mes domaines de recherche et rencontrer de nouvelles personnes pour avoir une grande ouverture scientifique. » Elle y travaille, entre autres, sur la théorie des graphes appliquée au domaine de la biologie, au sein de l’équipe GALAC (Graphes, algorithmes et combinatoire). Elle collabore aussi avec l’équipe bio-informatique du laboratoire où elle étudie la modélisation des composants de l’acide ribonucléique (ARN) en trois dimensions. Et en parallèle, elle poursuit ses recherches dans le domaine des télécommunications.

 

Les sciences du dialogue pour débuter 

De son côté, Sophie Rosset se spécialise dès ses études universitaires en sciences du langage qu’elle débute en 1988. D’abord à l’Université Lumière Lyon 2, puis à l’Université du Québec à Montréal où elle réalise une maîtrise d’études avancées en linguistique théorique en 1991. Elle y devient aussi assistante de recherche, ce qui confirme son goût pour la recherche. À son retour en France en 1994, elle rejoint le Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur - LIMSI (Université Paris-Saclay, CNRS), où elle découvre avec grand intérêt le sujet des changements de fréquence dans la parole, appelés glissandi. Elle y intègre une équipe qui étudie les systèmes de dialogue humain-machine. « Ça a été un coup de foudre scientifique ! »

 

Dialogue oral humain-machine

Sophie Rosset valorise ensuite son travail scientifique par une thèse sur les stratégies de dialogue pour des systèmes d’interrogation orale de bases de données qu’elle soutient en 2000. Ses travaux consistent à rendre computationnels des modèles pragmatiques de la communication - c’est-à-dire les éléments du langage dont la signification ne peut être comprise qu'en connaissant le contexte de leur emploi - et les adapter à une interaction humain-machine. Ils sont ensuite valorisés et transférés à l’entreprise VECSYS, spécialisée dans la transcription multilingue de contenus audio et vidéo. 

 

Un système de dialogue en domaine ouvert

« Dans mon domaine de recherche, la pluridisciplinarité est au cœur de nos modes de travail. Cette richesse m’exalte beaucoup, car j’aime apprendre et découvrir de nouveaux sujets en permanence. » En 2002, Sophie Rosset est recrutée comme chargée de recherche au LIMSI, dans l’équipe Traitement du langage parlé. « J’y convaincs quelques collègues de travailler sur un projet ambitieux, celui d’étudier le dialogue en domaine ouvert, pour concevoir un système capable d’interagir avec un humain sur tous types de sujets. » À cette époque, la recherche se concentre en effet sur des projets en domaines limités - comme réserver un billet de train par exemple – et l’ouvrir à une échelle illimitée pose des défis importants en termes de modélisation des connaissances. 

 

L’extraction d’information

À la fin des années 2000, Sophie Rosset s’intéresse à la recherche de réponse à des questions précises et à l’extraction d’information. Elle mène la mise au point d’un système de recherche de réponses à des questions précises dans des données multilingues. Ces travaux l’amènent à s’intéresser aux modèles de représentation des entités nommées, des objets textuels (c'est-à-dire un mot ou un groupe de mots) catégorisables. Elle conçoit un nouveau modèle de représentation, complexe et capable de représenter dans des textes beaucoup plus d’informations qu’auparavant. Il est aujourd’hui utilisé par une équipe de l’Ecole polytechnique fédérale de Lausanne (EPFL) dans le cadre d’un challenge international où des équipes de différents pays ont proposé des systèmes pour réaliser cette tâche d’extraction d’information dans des documents historiques (du XIXe siècle pour certains). 

 

« Patient Genesys »

En 2014, la chercheuse applique son expertise des systèmes de dialogue au secteur médical. Elle dirige le projet de conception d’un patient virtuel, « Patient Genesys », destiné aux étudiants en médecine. Ces derniers lui adressent des questions cliniques afin de s’entrainer au diagnostic médical, et le système est en mesure de s’adapter tout seul à de nouvelles spécialités médicales. « Grâce à l’intégration de méthodes de traitement automatique des langues et d’algorithmes d’optimisation des recherches dans des ressources terminologiques, nous avons conçu le premier système de dialogue virtuel capable de fonctionner quel que soit le domaine médical. » En 2016, le logiciel est transféré à SimforHealth, start-up spécialisée en simulation numérique dans le domaine de la santé.

 

De nouvelles méthodes d’apprentissage

Ces projets d’extraction d’information et de conception de système de dialogue et d’apprentissage incrémental ont ouvert de nouveaux horizons de recherche à Sophie Rosset.  « Aujourd’hui, je travaille sur des systèmes de dialogue qui intègrent ces deux aspects et je m’oriente, entre autres, vers la conception de méthodes d’apprentissage dans les cas où peu de données sont disponibles. » La chercheuse et son équipe travaillent ainsi à déterminer la meilleure manière de générer des données textuelles nécessaires à l’apprentissage des machines à partir de descriptions formelles. Et comme Sophie Rosset aime traiter plusieurs sujets à la fois, elle s’intéresse aussi à l’apprentissage par transfert, qui consiste à déplacer des connaissances d’un domaine sémantique à un autre ou d’une langue à une autre.

 

La co-création du LISN

En 2019, Sophie Rosset et Johanne Cohen s’impliquent toutes deux dans le projet de fusion d’équipes du LIMSI et du LRI. Elles participent à l’élaboration du projet scientifique qui rend possible la création du nouveau laboratoire : le LISN. « J’y ai vu une formidable opportunité d’enrichir nos thématiques de recherches », commente Sophie Rosset. « Ce projet m’a beaucoup enthousiasmé car il est synonyme de nouvelles collaborations, thématiques de recherche et aventures scientifiques », renchérit Johanne Cohen. D’ailleurs Johanne Cohen a beaucoup d’idées pour la suite. Elle souhaite se rapprocher du département science des données du LISN ou encore de son département science et technologie des langues pour y amener les outils d’algorithmique. « J’ambitionne par ailleurs de créer un club d’échec au sein du laboratoire et pourquoi pas d’organiser un championnat ! » 

De son côté, Sophie Rosset, passionnée par le travail collectif et la rigueur scientifique, souhaite donner la possibilité aux chercheurs et chercheuses et aux ingénieurs et techniciens du nouveau laboratoire de s’épanouir dans cette nouvelle entité : « je veux que tous y trouvent la possibilité de soutenir et mener les recherches qui leur tiennent à cœur, et que ce laboratoire les enthousiasme autant que Johanne et moi ». Le LISN compte aujourd’hui environ 400 personnes et est ouvert aux recrutements. « Nous accueillons toute nouvelle personne qui souhaite se joindre à la formidable aventure du LISN, unique en France et à l’international ! », annonce sa directrice.
 

Sophie Rosset (à gauche) et Johanne Cohen (à droite)