Des algorithmes qui apprennent et classent : le travail d’Isabelle Guyon récompensé

Portraits de chercheurs Article publié le 28 mai 2020 , mis à jour le 22 septembre 2020

Créer des ordinateurs qui déterminent eux-mêmes comment classer des données : voilà ce qu’ont accompli Isabelle Guyon et ses collaborateurs Bernhard Schölkopf et Vladimir Vapnik dans les années 1990. Ils sont récompensés cette année par la fondation BBVA pour ce travail, déjà reconnu à l’échelle internationale comme une avancée majeure dans le champ de l’apprentissage automatique – un domaine de l’intelligence artificielle. Retour sur ce travail et sur le parcours d’Isabelle Guyon, aujourd’hui professeur de Big data à l’Université Paris-Saclay et membre de l’équipe Tackling the Underspecified (TAU) commune entre Inria Saclay et le Laboratoire de recherche en informatique (LRI - Université Paris-Saclay, CNRS).

Programmer des algorithmes qui apprennent à l’aide d’exemples : voilà le cœur du machine learning, ou apprentissage automatique. Si les recherches et les applications dans ce domaine fleurissent aujourd’hui, elles n’en sont encore qu’à leurs balbutiements dans les années 1990. À cette époque, Isabelle Guyon travaille dans les laboratoires Bell, aux États-Unis, où elle rencontre les chercheurs Bernhard Boser et Vladimir Vapnik. Ensemble, ils développent une technique de tri des données qui fait florès, le SVM – support vector machine ou séparateurs à vaste marge.

 

Les SVM : des algorithmes de classification, et bien plus encore

Un algorithme SVM est un algorithme d’apprentissage automatique : si on lui fournit des données représentant différentes catégories d’objets – des exemples d’apprentissage –, l’algorithme est capable d’en tirer les informations nécessaires pour déterminer des règles différenciant ces catégories de données. Par la suite, il peut prédire si une nouvelle donnée appartient à l’une ou l’autre des catégories. « Il s'agit au départ d'un algorithme de classification, rappelle Isabelle Guyon. Mais son utilisation s’est depuis généralisée à d'autres types de tâches et de domaines. Les problèmes de classification aident par exemple à trier des spams ou au diagnostic médical. »

Citée à plus de 11 000 reprises, la publication originale décrivant l’algorithme SVM constitue une référence dans le domaine de l’apprentissage automatique. « Les SVM sont la combinaison de plusieurs idées : celle de l'algorithme à vaste marge formulée par V. Vapnik dans les années 1960, et celle des méthodes Kernel que j'ai étudiées pendant mon doctorat », déclare Isabelle Guyon.  L’algorithme à vaste marge imaginé par Vapnik classifie les objets selon un montant modulé par les paramètres de l’objet : chaque paramètre est assorti d’un coefficient numérique et leur somme (pondérée par les coefficients numériques) détermine la catégorie de l’objet. Cet algorithme, qui est un séparateur linéaire, optimise la marge entre les échantillons d’apprentissage pour obtenir une classification plus exacte des données après l’apprentissage. Les méthodes Kernel viennent élargir le champ des possibles en classant des données inséparables linéairement. Les SVM développés font également intervenir des termes encore utilisés en optimisation numérique, tels que celui de minimisation de l’erreur: la fraction d’exemples mal classés durant l’apprentissage. Au final, ces algorithmes se révèlent très fructueux pour la communauté scientifique.  Le co-récipiendaire du prix de la fondation BBVA, Bernhard Schölkopf, a d’ailleurs contribué au rayonnement des méthodes de Kernel suite à l’engouement suscité par les SVM et leur succès.

 

Multiples vies professionnelles

Après son travail aux Bell Labs, Isabelle Guyon crée en 1996 son entreprise de conseil en apprentissage automatique, Clopinet, en Californie. Elle travaille de chez elle tout en élevant ses enfants. Quelques années plus tard, elle rentre en France et en 2016, elle rejoint l’Université Paris-Saclay, où elle occupe désormais une chaire d’enseignement en Big data. Au cœur de son enseignement : savoir bien comprendre les données et les méthodes disponibles dans le domaine de l’apprentissage automatique. « Les données sont essentielles quand on fait de l'apprentissage automatique. Je fais donc toujours travailler les étudiants sur leur bonne compréhension des données et sur l'importance de leur collecte. Un grand nombre de méthodes peuvent être étudiées, j'essaie de faire en sorte que les étudiants comprennent comment elles fonctionnent, car pour les utiliser à bon escient, il ne faut pas s’en servir à l'aveugle, mais saisir ce qu’il s’y passe. »

La spécialiste du machine learning travaille par ailleurs au sein de l’équipe Tackling the Underspecified (TAU), commune entre Inria Saclay et le Laboratoire de recherche en informatique (LRI - Université Paris-Saclay, CNRS). En partenariat avec RTE, elle développe des méthodes basées sur l’apprentissage automatique et destinées à optimiser la distribution de l'électricité sur la grille du réseau électrique français.

 

L’intelligence artificielle pour tous

Isabelle Guyon se passionne pour la diffusion des méthodes d’intelligence artificielle et d’apprentissage automatique auprès d’un large public. À l’époque de Clopinet, elle fonde ChaLearn, une organisation à but non lucratif qui organise des challenges en apprentissage machine et qu’elle préside. Aujourd’hui encore, ChaLearn monte des challenges en partenariat avec des collectivités territoriales comme la région Île-de-France, ou avec de grandes entreprises comme Dassault ou RTE. Parmi les participants : des étudiants, des chercheurs ou encore des ingénieurs, qui souhaitent se former à l’intelligence artificielle. Formuler le problème sous la forme d’un challenge, auquel participent des centaines de personnes, permet d’en optimiser la solution. « Je pense que de mauvaises utilisations peuvent être faites des méthodes d’IA. Mais si elles sont mises à la disposition du plus grand nombre, on a des chances que les individus en fassent une meilleure utilisation à tous les niveaux, remarque Isabelle Guyon, qui précise : « Notre souhait serait que ces outils soient gratuits, faciles d’utilisation et accessibles à tous ».

La chercheuse salue le prix remis par la fondation BBVA, qui, selon elle, reconnaît ainsi la contribution de toutes les personnes ayant contribué au développement de l’apprentissage automatique.