Sites Inria

English version

Logiciel

20/05/2011

L’échange et le traitement de données passent à la vitesse supérieure

La technologie QuiXProc, développée par la société Innovimax en collaboration avec l’équipe de recherche MOSTRARE, permet de compiler et de restituer rapidement des données échangées par le web dans le standard XML.

La technologie QuiXProc, développée par la société Innovimax en collaboration avec l’équipe de recherche MOSTRARE, permet de compiler et de restituer rapidement des données échangées par le web dans le standard XML.

Le traitement de données et de documents dans des contextes d'échanges entre serveurs est un enjeu de taille dans les entreprises. En effet, leur activité est désormais centrée sur des échanges de données et tout ralentissement peut avoir des répercussions directes sur l’avancement de leur projet.

Ces ralentissements s’expliquent par la multitude des opérations nécessaires lors des échanges et du traitement des données. Dans les cas les plus simples,  les étapes sont les suivantes : valider que les données respectent le schéma attendu (XML Schema), extraire ensuite une partie des données (XPath et/ou XQuery) et les transformer dans un format cible (XSLT). Bien évidemment, les suites d’opération concernées par QuiXProc sont généralement beaucoup plus complexes. Il est alors nécessaire d’appliquer un processus d’organisation appelé orchestration. Cette orchestration est en l’occurrence décrite par le langage XProc recommandé par le W3C.

Une autre contrainte importante réside dans le temps de traitement et la capacité mémoire des machines. Les traitements peuvent être effectués sur un arbre XML mais cela nécessite le chargement en mémoire et il faut que la mémoire puisse contenir cet arbre. Imaginez, par exemple, la taille en mémoire des millions de données diffusées par la banque mondiale.

L’équipe de recherche Mostrare et Innovimax ont travaillé conjointement, en s’appuyant sur le langage XProc, pour proposer une solution d’implémentation efficace en partant du constat que toutes les données qui doivent être traitées, quelque soit le contexte, sont toujours diffusées dans un flux (appelé aussi streaming). Un flux est la traduction dans un fichier textuel d’un arbre XML. Il est constitué de données et de balises ouvrantes et fermantes qui décrivent la structure de l’arbre XML. QuiXProc propose donc de faire l’orchestration et d’effectuer toutes les opérations directement sur le flux, au lieu de manipuler ses données dans un arbre XML. Cette solution permet d’améliorer la rapidité des échanges et des traitements tout en considérant le volume des données à mémoriser.

Les résultats prometteurs de ce transfert de technologie encouragent l’équipe de recherche Mostrare et Innovimax à poursuivre leurs travaux pour optimiser toujours plus l’efficacité du traitement et des échanges de données.

Mots-clés : Technologie QuiXProc Innovimax Equipe-projet MOSTRARE Logicel Centre de recherche Inria Lille Nord - Europe

Haut de page

Suivez Inria