Sites Inria

English version

Equipe de recherche CELESTE

statistique mathématique et apprentissage

Présentation de l'équipe

La science des données - un vaste domaine comprenant la statistique, l'apprentissage automatique, le traitement du signal, la visualisation des données et les bases de données - fait désormais la une des journaux et a un impact potentiel majeur sur la société, au-delà du rôle important qu'elle a joué en sciences pendant de nombreuses décennies. Au sein de ce domaine, la communauté statistique a une longue expérience de comment déduire des connaissances à partir de données, sur des bases mathématiques solides. Le domaine plus récent de l'apprentissage automatique a également donné lieu à des réalisations majeures, en combinant statistique et optimisation, et en utilisant un point de vue nouveau provenant d'applications où la prédiction est plus importante que la construction de modèles.

Le positionnement de l'équipe-projet CELESTE est à l'interface entre statistique et apprentissage. Nous sommes statisticiens, membres d'un laboratoire de mathématiques, avec une solide formation en mathématiques, et sommes intéressés par les interactions entre théorie, algorithmes et applications. En effet, les applications conduisent aux problèmes théoriques les plus intéressants, tandis que la théorie peut jouer un rôle clé pour (i) comprendre comment et pourquoi les algorithmes statistiques et d'apprentissage efficaces fonctionnent - et donc les améliorer - et (ii) construire de nouveaux algorithmes sur des bases de statistique mathématique.

Axes de recherche

Notre travail consiste à analyser, du point de vue de la statistique mathématique, les algorithmes d'apprentissage statistique couramment utilisés, et à en développer de nouveaux en nous fondant sur notre expertise statistique et mathématique. Nos principaux axes de recherche méthodologiques et théoriques sont:
- la sélection d'estimateurs,
- les relations entre précision statistique et complexité algorithmique,
- la robustesse aux valeurs aberrantes et aux distributions à queues lourdes,
- l'inférence statistique: tests d'hypothèses (multiples) et régions de confiance.

Un ingrédient clé de notre programme de recherche est de maintenir nos résultats théoriques et méthodologiques en lien étroit avec la réalité concrète de la science des données appliquée. En effet, les membres de CELESTE travaillent dans de nombreux domaines applicatifs tels que les maladies tropicales négligées, la pharmacovigilance, l'analyse de données transcriptomiques de grande dimension, l'énergie et l'environnement.

Relations industrielles et internationales

Celeste collabore régulièrement avec le département R&D d'EDF, ainsi qu'avec de nombreuses autres entreprises (via des thèses CIFRE, par exemple).

Celeste a des collaborations académiques avec des chercheurs de nombreuses institutions à travers le monde, dont MPI Tubingen, University of Warwick, Cornell University, Brown University, University of Washington at Seattle, Princeton University et IMPA Rio.

Mots-clés : Statistique mathématique; apprentissage statistique; sélection d'estimateurs; compromis entre précision statistique et temps de calcul; robustesse; tests d'hypothèses

Suivez Inria