Portraits / Personnages-clés

Patrick Valduriez, pionnier et explorateur du Big Data

Date:
Mis à jour le 24/07/2023
Comment structurer, interroger, exploiter des données informatiques toujours plus nombreuses et complexes ? La question est omniprésente dans toute la carrière de Patrick Valduriez qui a travaillé sur les bases de données distribuées, bien avant qu’on ne les rebaptise "Big Data". Portrait d’un chercheur Inria brillant et passionné.
Patrick-Valduriez-juin-2023
© DR

Premier projet professionnel : programmeur

« Je n’étais pas prédestiné à la recherche ». L’affirmation surprendra de la part d’un scientifique de renommée internationale, coauteur de plus de 200 articles dans de grandes revues, directeur de thèse de plus de 50 doctorants et acteur de nombreux transferts industriels. Mais c’est bien ainsi que tout a commencé pour Patrick Valduriez : « Au début de mes études, je ne savais même pas que la recherche en informatique existait ! Je voulais devenir programmeur, pour pouvoir piloter des machines complexes. Et je me suis inscrit dans une école d'informatique à Lille pour en faire mon métier ».

Mais les applications de paye ou de gestion de commandes que le jeune étudiant découvre sont bien trop simples à son goût. Aussi, il enchaîne sur une maîtrise d’informatique à l’Institut de Programmation de l’université Paris VI, puis sur un diplôme d’études approfondies.

C’est là qu’il rencontre le professeur Georges Gardarin, responsable d’équipe à Inria et grand spécialiste des bases de données. « Il m’a accueilli dans son équipe pour mon stage, puis pour ma thèse, puis m’a fait recruter par Inria en 1982. Grâce à lui, je suis entré dans le monde des bases de données distribuées, pour ne plus en sortir. »

Titre

L’événement qui a changé sa carrière

Verbatim

Le premier pas de l’Homme sur la Lune, le 21 juillet 1969 ! J’étais adolescent, je faisais un séjour linguistique à Londres et il y avait des fêtes dans tous les parcs publics pour célébrer l’événement. Moi, je me demandais comment un engin spatial pouvait atteindre une destination si lointaine avec une telle précision. Le mois suivant, en colonies de vacances, un moniteur féru d’informatique m’a expliqué que la programmation pouvait guider des fusées dans l’espace. Une révélation. J’avais trouvé ma voie…

Cinq ans de recherche dans un laboratoire américain

Patrick Valduriez montre vite des dispositions exceptionnelles. À 27 ans, il signe (seul) un premier article scientifique dans la grande conférence internationale en gestion de données ACM SIGMOD. Deux ans plus tard, il est recruté au MCC, un laboratoire de recherche américain créé par Control Data, HP, Motorola, NCR, Unisys et consorts. L’objectif : contrer les ambitions du Japon sur un projet d’ordinateur de cinquième génération qui combine déjà intelligence artificielle, bases de données et machine multiprocesseur. Le jeune chercheur y reste cinq ans, puis revient chez Inria en tant que directeur de recherche.

Une carrière qui prend de l'ampleur

Patrick Valduriez enchaîne alors plus de trois décennies d’innovations, de publications à fort impact, de transferts de technologies vers l’industrie. Il crée et dirige successivement trois équipes Inria : Rodin à Rocquencourt en 1990, Atlas à Nantes en 2002, et Zenith à Montpellier en 2010. Au fil des ans, le terme de Big Data recouvre celui de "bases de données distribuées". Mais le cœur du problème reste le même : « L’enjeu, c’est de conserver cette cohérence apparente et cette simplicité d’accès aux données. Ce qui change, c’est que leur volume explose, provenant de multiples sources, avec une grande complexité et variété – par exemple, texte, image, son – et qu’il faut vérifier leur validité. »

Le transfert, c’est l’aboutissement d’une recherche

Le chercheur innove pour relever ces challenges, en créant : des algorithmes de traitement de données, des algorithmes parallèles pour machines multiprocesseurs, des outils d’analyse de données en temps réel ou d’intégration de données…
Il veille à ce que ses résultats soient transférés à l’industrie, à des partenaires scientifiques, ou sous forme de logiciels libres. « Le transfert, c’est l’aboutissement naturel d’une recherche, sa validation en vraie grandeur. C’est ce qui donne du sens à mon métier. »
Patrick Valduriez dirige par exemple entre 1996 et 2001 les 50 scientifiques de Dyade, un partenariat stratégique porté par Inria et Bull, et contribue activement à la première version du comparateur de prix Kelkoo. À l’époque, c’est une révolution : en quelques secondes, l’outil identifie les sites web qui vendent un produit, agrège leurs données et les présente simplement.

Autre exemple de transfert, le système d’intégration de données CloudMdSQL à la société LeanXcale, dont Patrick Valduriez est directeur scientifique aujourd’hui. Dans une grande entreprise, par exemple, les outils de cette société permettent d’analyser l’information en temps réel provenant de sources de données diverses, modifiées en permanence, et de prendre des décisions rapides.
Le secret de cette carrière exemplaire ?
« Je viens d’un milieu modeste où la valeur travail est très forte et j’avais la niaque, confie l’intéressé. De plus, j’ai trouvé sur ma route les mentors dont j’avais besoin : Georges Gardarin et François Bancilhon en France, David DeWitt et Jim Gray aux États-Unis, tous des stars du domaine. Ou encore mon collègue Tamer Özsu, de l’université de Waterloo (Canada). En 1991, nous avons écrit ‘Principles of distributed database systems’, l’ouvrage de référence sur les bases de données distribuées, réédité trois fois depuis. »

Pl@ntnet, un outil pour comprendre la biodiversité

Pl@ntnet, c’est cette application pour smartphone qui identifie des milliers de plantes à partir de photos prises sur le terrain par ses utilisateurs : randonneurs, agriculteurs, gardes forestiers, chercheurs en botanique, etc. Elle s’appuie sur une très riche base de données de plantes, et a été développée par Alexis Joly et des membres de l’équipe Inria Zenith de Patrick Valduriez. Pl@ntnet est très utilisée dans le monde (plus de 30 millions de téléchargements) et prépare son utilisation dans les zones tropicales, avec une version dédiée à l’Amazonie.

La recherche, toujours, mais entre France et Brésil pour son éméritat

Depuis le 1er avril 2023, Patrick Valduriez est directeur de recherche émérite, statut qui lui permet de contribuer à titre gracieux aux travaux d’Inria tout en étant retraité. Toujours aussi actif, il participe au montage de l’équipe de recherche qui succèdera à Zenith et passe la moitié de son temps au Brésil, où Inria vient de signer un accord stratégique avec le LNCC (Laboratoire national de calcul scientifique) et un réseau d’universités du pays. Cet accord fait suite au partenariat France - Brésil, signé en 2020, qui fédère une vingtaine de projets collaboratifs et 200 chercheurs et doctorants, en France et au Brésil.

Titre

Son regard sur les enjeux futurs du Big Data ?

Verbatim

Le respect de la vie privée, bien sûr. Et aussi le traitement des données avec une consommation d’énergie bien moindre. Il faut être assez intelligents pour faire mieux avec beaucoup moins : c’est une affaire d’éthique autant que de technique.

Prix et distinctions