Analyse de données

Prix “Test of Time” : vingt ans d’impact pour un théorème de topologie des données

Date:

Mis à jour le 12/06/2025

Vingt ans après sa publication, un article co-signé par David Cohen-Steiner, chercheur Inria à Sophia Antipolis, reçoit le prix “Test of Time” lors de la conférence internationale Symposium on Computational Geometry (SoCG’25), qui se tiendra au Japon du 23 au 27 juin 2025. Fruit de travaux menés pendant son post-doctorat à Duke University, ce résultat a jeté les bases théoriques d’une approche aujourd’hui largement répandue : l’utilisation d’outils topologiques pour l’analyse de données.

Quel est le sujet de l’article récompensé ?

Il s’agit d’un travail publié il y a vingt ans, à l’époque de mon post-doc à Duke University dans l'équipe d'Herbert Edelsbrunner. Il s’appuie sur une idée développée quelques années plus tôt dans son laboratoire, autour de la détection de tunnels dans les protéines, grâce à des outils topologiques. Ce qui était encore assez inédit à l’époque, c’était d’appliquer des concepts de topologie algébrique à l’analyse de données. L’article apporte une base mathématique à cette approche : un théorème qui explique pourquoi elle fonctionne.

En quoi consiste ce théorème ?

Ce n'est en soi ni une méthode ni un algorithme. Il ne propose pas un procédé à suivre, mais établit un fait démontré, sur lequel on peut s’appuyer pour prouver d’autres résultats. Ce que dit ce théorème, c'est qu'une certaine construction de nature topologique qu'on peut appliquer à des formes ne change pas beaucoup quand la forme de départ ne change pas beaucoup. C'est ce qui justifie mathématiquement l’utilisation de ces constructions topologiques dans le traitement de données.

Comment a-t-il traversé le temps ?

Il a été repris, généralisé, et utilisé dans des domaines très différents. Certains s’en servent pour développer des méthodes d’analyse de données ; d’autres dans des cadres très éloignés, comme la géométrie symplectique. Son usage dans des branches des mathématiques pures était totalement inattendu à l’origine, mais il s’est révélé être un outil utile pour des problématiques théoriques n'ayant rien à voir avec ses motivations initiales.

Vous en suivez l'impact dans la littérature ?

Pas de manière systématique. Je pourrais utiliser Google Scholar ou d’autres plateformes, mais je ne le fais pas régulièrement. J’en entends parler de temps à autre, ou je découvre des références en lisant d’autres travaux. En vérité, l’article est tellement cité qu’il devient difficile d’en suivre tous les usages.

Ce travail s’inscrit-il dans la continuité de la thèse ?

Oui, en partie. Ma thèse portait sur des questions de géométrie, et en particulier sur la manière de définir des notions de courbure pour des objets représentés de façon imparfaite — des nuages de points, des maillages, des surfaces bruitées. L’idée, c’était de construire des outils stables, qui ne changent pas brutalement quand les données sont un peu perturbées. C’est cette notion de stabilité qui m’a amené à envisager d’autres domaines, comme la topologie, sous cet angle.

Et que représente ce prix ?

C’est évidemment une satisfaction. Voir qu’un travail tient dans la durée, qu’il continue d’être cité, utilisé, détourné dans d’autres contextes… c’est une belle reconnaissance. C'est aussi très positif pour le domaine de recherche puisque cela consacre l'importance qu'il a pris au fil des années, notamment au sein de la communauté de géométrie algorithmique.

Découvrez l'article primé

"Stability of persistence diagrams". SoCG 2005: 263-271, accessible dans deux versions (en anglais seulement)