Numérique frugal

Machine learning : comment allier performance d’apprentissage et sobriété numérique ?

Date:
Mis à jour le 15/04/2022
Le machine learning, composante de l’intelligence artificielle, connaît un essor spectaculaire ces dernières années, et l’efficacité des algorithmes est au cœur de ce développement. Rencontre avec Benjamin Guedj, à la tête d’Inria London Programme, qui s’intéresse aux performances de généralisation en machine learning, plus particulièrement en deep learning, et qui œuvre au rapprochement entre la France et le Royaume-Uni sur cette thématique stratégique.
Chercheur de l'équipe MODAL
© Inria / Photo C. Morel

Contribuer au développement d’un numérique frugal

L’aventure britannique de Benjamin Guedj commence en 2018, alors qu’il est chercheur au sein de l’équipe Modal, au centre Inria de l'université de Lille. « Depuis mes travaux de thèse, conduits à Sorbonne Université et Télécom ParisTech entre 2011 et 2013, je m’intéresse aux algorithmes d’apprentissage automatique comme brique de base de systèmes d’intelligence artificielle, et à la façon dont on peut caractériser et améliorer leurs performances statistiques, indique-t-il. Il s’agit en particulier de leur permettre de ‘généraliser’ leur apprentissage à partir de données et d’utiliser le moins de ressources de calcul possible, une démarche permettant de développer un numérique frugal. Ayant intégré Inria en 2014, j’ai contribué à renforcer les fondements mathématiques du machine learning sous l’angle de la théorie ‘PAC-bayésienne’ ».

C’est en répondant à l’invitation de John Shawe-Taylor, l’un des plus éminents experts internationaux de cette théorie, que Benjamin Guedj rejoint University College London (UCL), étant mis à disposition par Inria pour collaborer avec des chercheurs britanniques sur ce sujet. « J’avais soif de nouveaux horizons et de découvertes, tant scientifiques que géographiques, et, à UCL, je me suis immédiatement intégré au sein de la communauté des chercheurs en intelligence artificielle, en prenant très rapidement de nombreuses responsabilités scientifiques et institutionnelles », se souvient-il.

Un programme scientifique ambitieux sur le machine learning

L’investissement scientifique du jeune chercheur et sa formidable énergie à créer du lien entre chercheurs des deux côtés de la Manche se concrétisent, quelques mois après son arrivée au Royaume-Uni, par le Inria London Programme et la feuille de route de son équipe de recherche Genesis, dont le projet scientifique se focalise sur la notion de « généralisation » en machine learning, en se fondant en particulier sur la théorie PAC-bayésienne.

L’intelligence artificielle et sa composante phare, le machine learning, connaissent un essor spectaculaire ces dernières années, avec des applications dans de nombreux domaines. La médecine de demain, personnalisée et prédictive, le véhicule autonome, l’agronomie raisonnée, sont autant d’applications prometteuses.

Les algorithmes d’intelligence artificielle (IA) sont développés afin d’apprendre à une machine à réaliser une tâche sans être programmée explicitement pour le faire, résume Benjamin Guedj. L’IA est porteuse de nombreuses promesses, dont certaines – comme celle d’une intelligence synthétique autonome – semblent largement surestimées ! Ce que ces techniques apportent aujourd’hui entre plutôt dans le champ d’une intelligence augmentée, offrant aux humains des outils d’aide à la prise de décision dans des environnement complexes et incertains (permettant d’analyser une variété de situations, de prendre en compte de nombreux paramètres, à une vitesse largement inaccessible pour un cerveau humain).

Améliorer les performances d’apprentissage des machines

Grâce au machine learning, un programme informatique apprend à réaliser une tâche donnée, par exemple celle de la reconnaissance d’images. « Pour conférer à une machine la capacité de reconnaître un chat sur une photographie, avec une efficacité proche de 100%, il faudra avoir fait analyser par un algorithme des centaines de milliers, voire des millions d’images représentant des chats – et avoir au préalable collecté ces images, en s’assurant qu’elles représentent bien des chats ! », explique Benjamin Guedj. Le succès de la machine provient de sa puissance de calcul, par ailleurs gourmande en énergie, mais elle est paradoxalement très limitée par cette approche « brute force ».

« La capacité d’apprentissage des humains est encore incomparablement plus efficace que celle des machines : un enfant reconnaît un chat après en avoir vu un pour la première fois… et il est capable de transférer cette connaissance pour comprendre qu’un chien ou un lapin, est, comme le chat, un animal, car tous partagent des traits communs (oreilles, pelage, pattes, etc.) », illustre Benjamin Guedj.

C’est cette capacité de « généralisation » qui intéresse les chercheurs de l’équipe Genesis. Ils souhaitent en doter les machines, en s’appuyant sur les progrès de la théorie PAC-bayésienne, laquelle permet de réaliser des prévisions avec une erreur minimale, et ceci avec forte probabilité (théorie dite « probablement approximativement correcte » ou PAC), tout en intégrant une modélisation de l’aléa (approche dite « bayésienne »). Un moyen de modéliser les incertitudes dans les processus d’apprentissage machine qui ouvre la voie à une analyse systématique de la propriété de « généralisation ».

Œuvrer au rapprochement scientifique de la France et du Royaume-Uni

Ce programme de recherche ambitionne aussi de développer des algorithmes efficients, permettant d’accomplir des tâches complexes à moindre coût de calcul. Une manière de contribuer à construire un numérique frugal.

Pour une tâche cognitive simple comme reconnaître un élément dans une image, on estime qu’une machine consomme 4 à 6 ordres de grandeur d’énergie de plus qu’un cerveau humain ! Dans un contexte où le coût financier et environnemental de production de l’énergie est sensiblement à la hausse, améliorer les performances énergétiques de l’IA s’avère une nécessité et un défi scientifique de taille, souligne Benjamin Guedj.

Le chercheur et ses collègues commencent à obtenir des résultats prometteurs dans la voie qu’ils explorent, comme en attestent les nombreuses publications déjà partagées au sein de la communauté scientifique. L’implication de Benjamin Guedj dans le projet dépasse le cadre scientifique, et le chercheur souhaite contribuer à faire d’Inria London un « hub » de l’institut au Royaume-Uni. Un moyen d’œuvrer concrètement au rapprochement scientifique des deux pays sur une thématique aussi stratégique que celle de l’intelligence artificielle.  

Benjamin Guedj récompensé pour son engagement scientifique

Portrait Benjamin Guedj

L’année 2022 comptera peut-être comme l’une des plus remarquables dans la carrière, très prometteuse, de Benjamin Guedj. À 35 ans, il vient de rejoindre les rangs de la promotion 2022 des Young Leaders du Franco-British Council, et recevra dans les prochains mois la prestigieuse distinction de Chevalier dans l’Ordre des Palmes Académiques, lors d’une cérémonie à venir à l’ambassade de France au Royaume-Uni.

Deux distinctions qui récompensent l’engagement de ce jeune chercheur Inria dans le développement de collaborations scientifiques d’ampleur entre la France, notamment en machine learning. Benjamin Guedj a en effet initié un partenariat avec University College London autour de l’intelligence artificielle (IA), qui s’est concrétisé en 2020 par la création du Inria London Programme, programme national de l’institut, et par la mise en place d’une équipe-projet, Genesis, commune à Inria et UCL, qui comprend plus de 40 personnes (dont six permanents).

En savoir plus