Philippe Preux, pionnier de l’apprentissage automatique

Mis à jour le 08/04/2021

Depuis 2006, Philippe Preux est à la tête de l’équipe SequeL (Sequential Learning) au centre Inria de Lille. Comme son nom le laisse deviner, SequeL est une équipe spécialisée dans l’apprentissage et la prise de décision séquentiels, c’est-à-dire par une suite ordonnée d’opérations, comme cela se fait par exemple dans des jeux vidéo ou des jeux de plateau tels le go, les échecs ou les dames. Portrait d’un chercheur dont le travail « consiste à étudier comment un agent autonome, tel un robot, peut apprendre à réaliser une tâche spécifique, comme conduire une voiture ou résoudre un Rubik’s cube »…

Philippe Preux
Inria / Photo Alice Decarpigny

SequeL peut se targuer d’être l’une des grandes équipes de recherche publique qui travaille sur l’apprentissage et la prise de décision dits séquentiels. Sa spécialité ? L’apprentissage par « renforcement », un sujet au cœur des problématiques d'intelligence artificielle. L’objectif est d’apprendre, grâce aux expériences successives, à trouver la meilleure solution à un problème le plus rapidement possible. Pour cela, Philippe Preux cherche à imaginer les méthodes les plus efficaces pour résoudre des problèmes en IA – c’est-à-dire celles qui sont les moins gourmandes en termes de temps, d’énergie et de ressources informatiques. La problématique du « numérique frugal » intéresse le chercheur :

N’oublions pas que l’apprentissage « vedette » aujourd’hui, c’est-à-dire n’est tout simplement pas durable parce que bien trop énergivore. Nous n’avons pas encore travaillé sur le sujet mais il nous intéresse pour les années à venir.

Le comportement humain, une source d’inspiration

Devenu un expert en son domaine, Philippe Preux a toutefois commencé sa carrière dans un tout autre champ. « Quand j’étais étudiant, dans les années 1980, on parlait beaucoup de l’intelligence artificielle et c’est un sujet qui me passionnait, mais j’ai fait mon doctorat dans une autre sphère en informatique, relate-t-il. Je suis revenu à l’IA après ma thèse et j’ai étudié les algorithmes dits évolutionnaires, c’est-à-dire dont le fonctionnement est inspiré par la théorie de la sélection naturelle des espèces en biologie, puis l’apprentissage automatique et par renforcement, lorsque j’étais maître de conférences à l’Université du Littoral. »

Durant cette période, de 1994 à 2005, Philippe Preux travaille avec des psychologues car il veut comprendre comment l’humain adapte son comportement à son environnement. Son objectif est de s’en inspirer, afin que des agents artificiels parviennent à faire la même chose.

C’est ainsi que je me suis intéressé à l’apprentissage automatique, précise-t-il. Et même si aujourd’hui je ne suis plus en contact avec des psychologues, je suis toujours convaincu que les comportements animal et humain, demeurent l’une des sources d'inspiration essentielles pour produire quelque chose d’important en IA. Cela nous donne un cadre pour formaliser le sujet.

De la santé à l’éducation, en passant par l’agriculture

Comment Philippe Preux aborde-t-il ses recherches ? Il se dit avant tout « pragmatique » :

Je souhaite comprendre le fond des choses, comment elles fonctionnent et pourquoi elles sont comme elles sont. De manière générale je suis très curieux.

Avec l’équipe SequeL, il a beaucoup travaillé sur la publicité sur internet et des applications dites de recommandation. Le chercheur a ainsi acquis une expertise sur les fonctionnements et les performances possibles de ces systèmes de recommandation. Des compétences fort utiles dans ses projets actuels qui concernent tout un éventail de domaines comme la médecine, l’agriculture ou l’éducation.

En médecine, Philippe Preux travaille avec les médecins et chirurgiens au CHU de Lille, notamment sur le projet Bandits for Health (voir encadré), ce qui lui a permis de décrocher, avec son équipe, un prix de la fondation I-SITE ULNE. « Ce prix nous donne les moyens de recruter un doctorant et de faire le lien entre deux disciplines assez différentes, la médecine et l’informatique, se félicite-t-il. Il nous permet ainsi de travailler sur des questions à la fois scientifiques et applicatives. » Il collabore aussi avec l’équipe Defrost au centre Inria de Lille pour créer des robots qui effectuent des interventions chirurgicales. « Nous aimerions rendre ces robots capables de se piloter automatiquement », indique-t-il.

Du côté de l’agriculture, ses projets concernent la gestion d’exploitation agricole dans les pays émergents. Ils impliquent le Centre de coopération internationale en recherche agronomique pour le développement (Cirad) en France, le Groupe consultatif pour la recherche agricole internationale (CGIAR) à l’international, l’Université de Zambie et l’Université d’État du Michigan. Philippe Preux s’investit aussi dans l’éducation en ligne (e-learning) pour aider des élèves à progresser d’une manière efficace en leur proposant l’exercice le plus adapté à leurs performances.

Des collaborations avec de grands groupes, mais aussi avec des PME et des start-up

Quel que soit le domaine d’application, Philippe Preux peut compter sur l’accompagnement d’Inria pour passer de la recherche à des productions concrètes.

Même si mes travaux relèvent de la recherche fondamentale, Inria nous encourage à faire du transfert technologique avec les entreprises, souligne-t-il. Des services et des équipes dédiées nous aident dans cette démarche, ainsi que dans les négociations ou la rédaction du contrat avec une entreprise – des étapes qui ne sont pas forcément évidentes pour un chercheur.

Sur ce plan, Philippe Preux confie avoir pris de l’assurance.

Avant d’arriver à Inria, je n’avais jamais travaillé avec une entreprise ou en transfert de technologie – étant focalisé sur la partie purement scientifique de mes projets – mais aujourd’hui je me sens à l’aise avec ça.

Il a ainsi collaboré avec de grands groupes comme Orange Labs, Criteo, Renault, mais aussi avec des PME et des start-up.

Néanmoins, sa passion demeure la recherche fondamentale. « Inria est l'un des quelques instituts de recherche dans le monde où nous pouvons, en tant que jeunes chercheurs, doctorants ou post-doctorants venir travailler, développer nos idées, prendre des risques, estime-t-il. Nous sommes réellement libres de faire de la recherche sur un sujet qui nous intéresse, et nous avons une grande autonomie de travail. » Outre la liberté, Philippe Preux apprécie également le réseau dont il bénéficie. « Des liens étroits existent entre les différents centres et équipes Inria, et c’est aussi ce qui fait la richesse de l’institut. Celui-ci incarne donc le lieu de choix pour faire de la recherche en informatique et en mathématiques ».


* La fondation I-SITE ULNE souhaite renforcer et faire rayonner l’excellence en recherche et en formation via des projets interdisciplinaires. Bandits for Health est l’un des cinq projets Expand financés à concurrence de 150 K€.    

Bandits for Health pour personnaliser le suivi médical

Philippe Preux est l’un des heureux lauréats de l’appel à projet interdisciplinaire Sustain and Expand 2, lancé en juin 2018 par la fondation I-SITE ULNE*, pour son projet Bandits for Health qui croise médecine et informatique. Les protocoles médicaux sont souvent les mêmes pour tous les patients, or ceux-ci n’ont pas tous besoin du même suivi. Ainsi, certains d'entre eux se portent très bien après une intervention chirurgicale, tandis que d’autres peuvent connaître des complications inattendues. « Pour aborder cette problématique et personnaliser le suivi médical, nous développons un système d’IA qui détermine, pour chaque patient, le bon protocole à suivre pour que chacun consulte le bon médecin au bon moment », explique le chercheur. 

Quel est le procédé mis en œuvre pour parvenir à ce résultat ?

La technique que nous utilisons se nomme le problème des bandits, ou comment identifier au plus vite la « machine à sous gagnante » (le bandit) parmi plusieurs au casino, la probabilité de gagner étant légèrement différente pour chaque machine.

Ce champ de recherche est vieux de près d’un siècle – l’introduction des bandits dans le cadre d’essais cliniques en médecine remonte à 1932. Depuis une dizaine d’années, il s’est fortement développé, comme le note Philippe Preux :

Les bandits sont très utilisés dans de nombreux champs d'application comme les systèmes de recommandation en médecine, en marketing ou encore dans l’enseignement.