Sites Inria

English version

European Research Council 2016

Charlotte Renauld - 23/01/2017

Yanlei Diao lauréate d’une bourse ERC Consolidator pour son projet « Big Fast Data »

Yanlei Diao, professeur à l'École polytechnique et à Télécom ParisTech, et membre de l’équipe Cedar du centre de recherche Inria Saclay – Île-de-France, a été distinguée par une "ERC Consolidator Grant " 2016. Cette bourse européenne récompense l’excellence scientifique de la chercheuse et de son projet, ainsi qu’une vision innovante en termes « d’accélération et d’optimisation du calcul analytique pour données massives ». C’est la première distinction accordée à un enseignant-chercheur titulaire d'une chaire d'excellence financée par l'université Paris-Saclay.

Yanlei Diao, diplômée en 2005 d’un doctorat de l'université de Californie, Berkeley, devient professeur à l'université du Massachusetts Amherst aux États-Unis, où elle développe la recherche et l'enseignement dans le domaine de l’analyse de données massives. Reconnue internationalement pour son expertise dans le traitement des flux de données massives, Yanlei Diao établit aussi de nombreuses collaborations avec des entreprises comme Google, IBM ou Cisco. Le 1er septembre 2015, Yanlei Diao est recrutée conjointement par l'École polytechnique et Télécom ParisTech dans le but de développer une équipe de recherche de classe mondiale dans le domaine des données massives. Titulaire d'une chaire d'excellence à l'université de Paris-Saclay, Yanlei Diao est membre du LIX, le Laboratoire d'informatique de l'École polytechnique (en cotutelle avec le CNRS), de l'équipe DBWeb du laboratoire LTCI de Télécom ParisTech et de l'équipe Cedar du centre de recherche Inria Saclay  – Île-de-France.

L’ERC Consolidator Grant récompense le caractère visionnaire des recherches menées par Yanlei Diao. Dans le domaine des Big Data , les analyses permanentes à faible latence des grands volumes de données, appelées "Big and fast data analysis " dans le cadre de cette bourse, sont d'une importance capitale aujourd'hui. Ces analyses promettent de transférer rapidement les informations et les réflexions vers de nombreuses applications et de favoriser un bouleversement dans divers domaines scientifiques (la génomique par exemple) et sociétaux. Cependant, les systèmes actuels ne permettent pas à la fois le passage à grande échelle des données et la faible latence (temps de réponse) des analyses. Un premier groupe de systèmes (basés sur Hadoop) a réussi le passage à l'échelle mais a souffert d'une latence élevée dans les analyses de données. La seconde génération de systèmes (Spark) a évolué pour s'adapter aux flux de données en temps réel, mais ces derniers ont toujours des difficultés pour garantir un temps de réponse court lorsque la taille des données dépasse celle de la mémoire d'un cluster informatique. Les recherches de Yanlei Diao marquent le développement d'une troisième vague de systèmes de big data susceptibles d'arriver à la fois au passage à l'échelle et à une faible latence dans le cadre d'une large gamme d'analyses complexes de données.

Dans ce sens, les recherches de Yanlei Diao développent de nouveaux fondements algorithmiques pour concevoir sur de nouvelles bases des systèmes de "big fast data" .  Elles font avancer l'état de l'art sur de nombreux fronts. D'abord et avant tout, elles augmentent le potentiel de parallélisme sous toutes ses formes, qu'il s'agisse du parallélisme des données - pour le passage à l'échelle - ou du parallélisme dit "pipeline" - pour diminuer les temps de réponse des traitements. En outre, elles conçoivent de nouvelles solutions algorithmiques pour exploiter au maximum ce parallélisme dans les problèmes analytiques complexes, notamment les analyses des tendances temporelles, les analyses graphiques et les tâches d'apprentissage statistique (machine learning ). 

(Le "pipeline" s’entend comme un processus spécifique de parallélisation des calculs, par flots.)

Yanlei Diao souligne l’efficacité de l’accompagnement dont elle a bénéficié - et notamment l’accompagnement mis en place par l’université Paris-Saclay - pour la préparation du projet et sa présentation devant les membres des panels ERC. Le financement de l'ERC va permettre à Yanlei Diao de s'entourer de gens talentueux afin de développer ce projet ambitieux. Elle compte aussi renforcer ses collaborations notamment en Machine Learning .

Yanlei Diao anticipe des applications dans de nombreux domaines et elle est à la recherche de cas d’étude réels et d’entreprises partenaires en France ; elle compte développer des collaborations dans la gestion de données sur des sujets tels que l'analyse à grande échelle des données web, l’analyse rapide des données du génome, l’analyse des données dans le domaine de la santé, le suivi des objets en temps réel et la détection dans l’Internet des objets. 

L’ERC Consolidator Grant distingue un chercheur ayant de sept à douze ans d’expérience après son doctorat, pour son excellence scientifique et celle de son projet (valeur, caractère novateur, faisabilité, méthodologie innovante). Au total, 314 projets ont été sélectionnés en 2016, dont 43 projets hébergés en France. 

Mots-clés : Inria Saclay – Île-de-France Yanlei DIAO Big data ERC 2016 Europe

Haut de page

Suivez Inria tout au long de son 50e anniversaire et au-delà !