Sites Inria

English version

Equipe de recherche CEDAR

Rich Data Exploration at Cloud Scale

Présentation de l'équipe

Les applications à usage intensif de données de présentent un très grand degré d'hétérogénéité, dû au fait que différentes applications sont mieux servies par différents types de données. Ainsi, les applications de commerce online sont déployées au dessus de bases de données relationnelles, des plateformes de gestion de contenus Web gèrent des documents semi-structurés, les capteurs fournissent des flots de données numériques, les applications scientifiques manipulent des vecteurs, les logs (journaux) des systèmes tels que des serveurs Web ou moniteurs transactionnels produisent du texte structuré etc.; souvent, des données très hétérogènes sont exploitées sous la forme de graphes RDF etc. 

Le rhythme de production et de consommation des données Big Data de nos jours rend l'unification de telles sources de données hétérogènes dans une architecture unique (par les processus  de Extract-Transform-Load ou ETL typiques des entrepôts de données relationnels) infaisable. L'équipe CEDAR s'attèle aux défis posés par cette variété de données produites et consommées à très grande échelle, en s'orientant sur des modèles expressifs et des outils efficaces pour le traitement de telles données. Nos outils sont conçu pour être déployés dans le cloud, afin de passer à l'échelle des très grands volumes de données.

 

Axes de recherche

Nos travaux de recherche s'organisent dans deux grandes catégories, comme suit:

A l'intérieur du cloud, dans des plateformes massivement distribuées de traitement de données, nous nous intéressons à:

1. Plate-formes de stockage de données hétérogènes à très grande échelle

2. Algorithmes efficace pour répondre aux requêtes sur des données sémantiques

 

A l'interface entre le cloud et les utilisateurs, nous visons à définir des nouveaux modes d'intéraction et exploration des données par les utilisateurs, en particulier en équipant les serveurs de bases de données de nouvelles fonctionnalités pour simplifier l'expérience des utilisateurs. On s'intéresse en particulier à:

4. L'interrogation exploratoire des grands graphes sémantiques

5. Réponses représentatives aux requêtes sémantiques

Relations industrielles et internationales

A l'étranger, nous collaborons avec: UCSD (Alin Deutsch), AT&T (D. Srivastava), U. Madison Wisconsin (D. DeWitt) and U. Berkeley (M. Franklin), TU Dresden (S. Rudolph), U. Bolzano (D. Calvanese).

Nos partenaires industriels actuels sont Business & Décision (EOLAS), la PME SemSoft, ou encore le journal Le Monde.

Mots-clés : Big Data Représentation de connaissances Bases de données Cloud Web sémantique Optimisation de requêtes Analyse de données Exploration de données

Suivez Inria tout au long de son 50e anniversaire et au-delà !