Sites Inria

English version

Equipe de recherche ATLAS

Gestion des données complexes dans les systèmes distribués

  • Responsable : Patrick Valduriez
  • Centre(s) de recherche : CRI Rennes - Bretagne Atlantique
  • Domaine : Perception, cognition, interaction
  • Thème : Représentation et traitement des données et des connaissances
  • Partenaire(s) : Université Nantes,CNRS
  • Collaborateur(s) : Laboratoire d'Informatique de Nantes Atlantique (LINA) (UMR6241)

Présentation de l'équipe

La problématique générale de l'équipe-projetATLAS concerne la gestion de données complexes dans les systèmes distribués. L'objectif est de concevoir et de valider des solutions (originales) avec des avantages significatifs en termes de fonctionnalités et de performances. Pour atteindre cet objectif, l'équipe Atlas est organisé en trois thèmes complémentaires. Le thème "modèles et résumés" adresse les problèmes d'abstraction et de gestion des données complexes. Le thème "techniques de gestion de données multimédias" adresse les problèmes d'accès efficace et personnalisé à des données multimédias. Le thème "techniques de gestion de données distribuées" adresse les problèmes de réplication de données distribuées et de traitement de requêtes distribuées sur données complexes.

Axes de recherche

Modèles et résumés

La gestion de données complexes s'inscrit naturellement dans la problématique plus générale de la gestion d'applications et de systèmes complexes. La maturité des SGBD et leur utilisation intensive dans les systèmes d'information ont eu, entre autres, trois conséquences majeures dans les entreprises: la production de bases de données de très grande taille ; la cohabitation de bases de données de plus en plus hétérogènes ; et le besoin d'accéder à ces bases de données (de grande taille, hétérogènes) par de plus en plus d'applications, elles-mêmes hétérogènes. Chacun de ces points soulève des problèmes difficiles qui empirent avec les progrès technologiques. Nous pensons qu'une réponse commune à ces problèmes doit s'appuyer sur une généralisation du principe d'indépendance des données, en l'appliquant d'une part aux instances (ou au contenu) pour des bases de très grande taille et d'autre part aux représentations de données pour des bases de données et des applications hétérogènes. Pour ce faire, nous proposons de mener deux actions de recherche indépendantes, consacrées à la gestion de résumés et à la gestion de modèles, et une action fédératrice sur l'intégration de résumés et de modèles hétérogènes.

Techniques de gestion de données multimédias

La numérisation de l'information multimédia a permis l'apparition de nouveaux équipements (lecteurs de DVD, caméscopes et appareils photographiques numériques, téléphones portables connectés au Web, etc.) et de nouvelles applications (vidéos interactives, albums photographiques numériques, cartes postales électroniques, enseignement à distance, etc.). Cette production croissante de données multimédias numérisées amplifie les problèmes classiques de gestion de données multimédias et en crée de nouveaux tels que la personnalisation de contenu, l'accès à partir d'appareils mobiles, etc. Les problèmes majeurs concernent la modélisation, le stockage et l'indexation physique des données multimédias, et le traitement de requêtes sur ces données. Trois directions de recherche nous intéressent : intégration de données multimédias avec des descripteurs hétérogènes, indexation et recherche à grande échelle et accès à partir de postes mobiles.

Techniques de gestion de données distribuées

Dans un système distribué à grande échelle, les bases de données sont nombreuses, autonomes (sous fort contrôle local), et très hétérogènes en taille et complexité. De plus, les postes clients peuvent être des terminaux mobiles qui travaillent en mode déconnecté et se synchronisent de temps à autre avec les bases de données sur le réseau. La gestion de données dans un tel contexte pose des problèmes de recherche difficiles car les techniques doivent passer à l'échelle tout en supportant les nouveaux besoins liés à l'autonomie et l'hétérogénéité des données, et à la mobilité des terminaux clients. Différents contextes de systèmes distribués se prêtent à l'étude de ces problèmes, en particulier, nternet et les clusters de PC. Afin de conduire à des résultats de portée générale, il nous parait donc essentiel de développer des solutions algorithmiques communes avec un bon niveau d'abstraction du contexte, les implémentations pouvant être plus spécifiques. Pour ce faire, nous supposons une architecture distribuée peer-to-peer (P2P), qui offre la possibilité de passage à grande échelle. Etant donné une telle architecture, les performances de l'accès aux données distribuées sont cruciales. Pour aborder ce problème général, nous menons trois actions de recherche complémentaires sur la réplication des données distribuées, la cohérence et synchronisation des données répliquées, et le traitement de requêtes distribuées.

Relations industrielles et internationales

  • Projet RNTL Leg@net avec Prologue Software, ASPLine et le LIP6.
  • Projet RNTL Domus-Videum avec Thomson Multimédia (Rennes).
  • CTI France Télécom R&D Jminer
  • Collaboration avec Sybase sur l'optimisation de requêtes.
  • Projet CNPQ-INRIA Daad (Distributed computing with Autonomous Applications and Databases) avec les Universités PUC-Rio et UFRJ.
  • Réseau STIC multimédia (Franco-Marocain).
  • Projet Mediasys avec le NII (National Institute of Informatics) du Japon.
  • Projet STIC Génie Logiciel (Franco-Marocain).
  • Participation à l'OMG sur l'ingénierie des modèles.

Suivez Inria tout au long de son 50e anniversaire et au-delà !