Sites Inria

Version française

VALDA Research team

Value from Data

Team presentation

Valda’s focus is on both foundational and systems aspects of complex data management, especially human-centric data. The data we are interested in is typically heterogeneous, massively distributed, rapidly evolving, intensional, and often subjective, possibly erroneous, imprecise, incomplete. In this setting, Valda is in particular concerned with the optimization of complex resources such as computer time and space, communication, monetary, and privacy budgets. The goal is to extract value from data, beyond simple query answering.

Research themes

  1. Fondements de la gestion de données. Les systèmes qui nous intéressent pour, p. ex., manipuler des données hétérogènes et confidentielles, changeant rapidement et distribuées de façon massive, sont par nature sensibles aux erreurs. De plus, à cause du coup de l'accès aux données, il est important d'optimiser les ressources nécessaires à leur manipulation. Cela ne peut être accompli qu'avec des fondements solides de ces systèmes de gestion de données. Ces fondements sont une base pour des spécifications appropriées (règles de confidentialité, propriétés de robustesse, etc.), pour des vérifications formelles et en temps réelles des spécifications, pour la conception de langages de requêtes adaptés (avec une bonne expressivité, un usage limité des ressources), pour la conception de bons index (pour l'évaluation optimisée), etc.

  2. Incertitude et provenance des données. Cet axe de recherche traite de la modélisation et gestion efficace de données accompagnées d'incertitude (distributions de probabilité, incomplétude logique, etc.) et d'informations de provenance (indiquant là d'où les données proviennent). Les outils et fondements pour la gestion d'incertitude et de provenance sont souvent similaires.

  3. Systèmes de gestion d'informations personnelles (Personal Information Management System). Un PIMS est un système qui permet à un utilisateur d'intégrer ses propres données, p. ex., ses méls et d'autres types de messages, son calendrier, ses contacts, ses recherches web, ses réseaux sociaux, ses informations de voyage, ses projets de travail, etc. De telles informations sont souvent réparties sur des services distincts. Le but est de rendre à un utilisateur le contrôle de ses informations, en lui permettant de formuler des requêtes telles que « Quel type d'interaction ai-je eu récemment avec Alice B. ? », « Où ont été mes dix derniers déplacements professionnels, et qui m'a aidé à les préparer ? » Le système doit orchestrer des requêtes vers différents services et intégrer l'information résultante, p. ex., aligner une localisation GPS de l'utilisateur avec une adresse d'un commerce ou un endroit mentionné dans un mél, ou un événement du calendrier avec un événement mentionné dans une recherche Web.

Keywords: Complex data Theory Systems Uncertainty Provenance Personal data