Nathalie Lacaux - 10/02/2016

Matthieu Dorier accessit du Prix de thèse Gilles Kahn 2015, pour ses travaux réalisés au sein de l'équipe Kerdata

L'un des deux accessits du prix de thèse Gilles Kahn 2015, décerné par la SiF et patronné par l'Académie des Sciences, vient d'être attribué à Matthieu Dorier, pour le travail qu'il a réalisé au sein de l'équipe-projet Kerdata au centre Inria Rennes Bretagne Atlantique, lors de son doctorat. Rencontre.

Matthieu, quel a été votre parcours ?

Je suis entré comme normalien à l’École normale supérieure de Cachan/Rennes en 2008. Après un premier stage dans l’équipe PARIS du centre Inria de Rennes en 2009 sous la direction de Luc Bougé, je me suis envolé pour l’université de l’Illinois à Urbana-Champaign (UIUC) en 2010, afin de travailler sur le stockage de données pour les simulations hautes performances. Ce stage, encadré par Marc Snir et Franck Cappello, se déroulait dans le contexte du Joint Inria/UIUC Laboratory for Petascale Computing , une collaboration qui m’a par la suite permis de travailler dans un cadre idéal avec des partenaires internationaux. Devenu Joint Lab for Extreme-Scale Computing (JLESC), ce laboratoire commun comprend aujourd’hui également Argonne National Laboratory , Barcelona Supercomputing Center , Jülich Supercomputing Center , et Riken AICS. J’ai terminé mon année de Master 2 à Rennes par un stage dans l’équipe KerData, dans laquelle j’ai poursuivi en thèse sous la direction de Gabriel Antoniu et Luc Bougé. Ayant effectué un stage et plusieurs visites à Argonne National Laboratory durant ma thèse, j’ai décidé d’y faire mon post-doctorat, sous la supervision de Rob Ross.

Vous venez de recevoir un des deux accessits du Prix de thèse Gilles Kahn de l'Académie des sciences pour votre thèse réalisée au sein de l'équipe KerData. Pourriez-vous nous parler de vos travaux et de ces trois années de doctorat ?

Mes travaux se concentrent sur la gestion de données pour les simulations numériques en calculs haute performance. Les simulations numériques sont devenues un outil essentiel à la science et à l’industrie aujourd’hui ; on utilise de telles simulations pour modéliser le climat, les virus, les processus de fusion nucléaire, et même la naissance et l’évolution de l’univers. Ces simulations demandent une importante puissance de calcul, que l’on trouve dans les millions de processeurs (cœurs) d’un supercalculateur. Malheureusement, ces simulations produisent aussi d’énormes masses de données qu’il est très difficile de stocker, d’analyser, et de visualiser par la suite. Cette partie "stockage et traitement" des données est pourtant cruciale si l’on veut comprendre le phénomène modélisé et en tirer un résultat scientifique.

Mon travail pendant la thèse répond à ce défi : il a consisté à proposer des méthodes permettant à cette partie "stockage et traitement des données" de s’exécuter plus rapidement. J’ai d’abord proposé des solutions permettant de "cacher" l’impact des accès aux données sur les performances des simulations, ce qui permet à ces simulations de mieux passer à l’échelle. J’ai également proposé des méthodes permettant de visualiser les données d’une simulation en allant directement les chercher dans les mémoires du supercalculateur, pendant que la simulation s’exécute. Ce paradigme se nomme "visualisation in situ ". Toutes ces contributions ont été implémentées dans un logiciel nommé Damaris, que j’ai eu la chance de pouvoir tester sur certains des plus puissants supercalculateurs au monde: Kraken, Blue Waters, et Titan. J’ai ensuite travaillé sur la contention engendrée par les accès aux données effectués par des applications concurrentes: les supercalculateurs étant généralement exploités par plusieurs utilisateurs en même temps, il est important de comprendre pourquoi une application peut voir ses performances affectées par une autre application qui s’exécute en parallèle. Enfin j’ai travaillé à la modélisation du comportement des simulations afin d’en prédire les accès aux données.

Comme je le disais, tous ces travaux se sont déroulés dans le cadre de collaborations notamment entre Inria, UIUC et ANL, dans le cadre du JLESC. Ces trois années de doctorat m’ont donc permis de me constituer un important réseau de collaborateurs avec qui je travaille encore aujourd’hui. Cette récompense est donc non seulement une grande fierté pour moi, mais elle est aussi une récompense pour eux et pour les travaux que nous menons ensemble.

Et maintenant, comment voyez-vous la suite de votre carrière?

La recherche académique continue de me passionner. Je suis actuellement en postdoctorat à Argonne National Laboratory. C’est un environnement très enrichissant qui me permet de développer de nouvelles compétences, dont j’aimerais plus tard faire bénéficier la recherche européenne, avec une préférence pour la France !

