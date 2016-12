Web sémantique

Nathaly Mermet, Technoscope - 6/11/2012

SemanticPedia & DBpédia : un double évènement

Le 19 novembre prochain sera signée une convention entre le ministère de la Culture et de la Communication, la fondation Wikimedia France et Inria autour de la plateforme SemanticPedia. Au-delà de la convention, ce sera l’occasion d’inaugurer le premier projet de cette plateforme qu’est le chapitre français de DBpédia.

« A travers la convention, l’idée est de lier un acteur majeur de la culture en France - le ministère de la Culture et de la Communication -, avec un grand acteur de la création de contenu sur le Web - Wikimedia - et un acteur de la recherche spécialiste des technologies du Web, notamment du Web de données et du Web sémantique » explique Fabien Gandon, responsable de l’équipe Wimmics et représentant d’Inria au World Wide Web Consortium (W3C) dont Inria est co-fondateur.

L’objectif est de couvrir tout le cycle de vie pour créer, publier et maintenir des données culturelles en français sur lesquelles construire des applications innovantes

La convention entre les trois partenaires, membres fondateurs, définit pour ce faire le cadre de travail de la plateforme et fixe les conditions d’exploitation des projets collaboratifs qui en sont issus. A terme, l’objectif serait que différents services d’Inria soient impliqués ainsi que davantage d’acteurs de la culture, comme les musées.

DBpédia.fr, le premier projet collaboratif de SemanticPedia

S'inscrivant dans l'effort d'internationalisation de l’encyclopédie collaborative Wikipedia, DBpédia en français est le chapitre francophone de DBpédia, dont le but est de maintenir des données structurées extraites de différents chapitres de Wikipedia. « L’encyclopédie Wikipédia, qui fonctionne sur le principe du wiki, offre un contenu librement accessible et modifiable, mais uniquement utilisable par l’individu qui seul peut véritablement lire et comprendre le contenu des pages » souligne Fabien Gandon, pointant que de nombreuses données recelées par ces mêmes pages peuvent s’avérer utiles aux applications informatiques dès lors qu’elles leur deviennent accessibles. C’est à ce manque, ou plus exactement à cette perte de données gigantesque que permet de parer DBpédia... en répondant automatiquement à des requêtes structurées complexes sur les données de Wikipédia et en les reliant à d'autres ensembles de données sur le Web. « Nous ouvrons ainsi ces données et collections à une multitude d’applications d’une richesse et d’une innovation réellement imprévisibles » se réjouit le chercheur.

Une longueur d’avance pour Wimmics

Commune avec l’Université de Nice Sophia Antipolis et le CNRS*, l'équipe de recherche Wimmics est un acteur majeur du développement et de la diffusion des standards du Web sémantique, et assure aussi le rôle de correspondant français de DBpédia.org. Avec le lancement de ce premier projet qui repose sur les standards du Web sémantique, l’équipe Wimmics d'Inria attend une poussée dans la mise en ligne des données sur le Web. « Il s’agit là d’une preuve de concept grandeur nature des résultats de recherche et développement dans le domaine du Web de données et du Web sémantique » affirme Fabien Gandon.

Le cercle vertueux est ainsi créé, selon lui, car l’immense jeu de données réelles aux applications multiples pose de nouveaux problèmes de recherche : à la fois pour le passage à l’échelle des calculs, le maintien de la qualité, la cohérence, la fraîcheur des données, le liage à d’autres données, etc. Autant de problèmes à résoudre qui entraînent de nouveaux travaux de R&D, aboutissant à de nouveaux programmes, démasquant de nouveaux verrous. « C’est tout un écosystème que l’on essaie de mettre en place au-dessus des données culturelles publiées » rappelle t-il. Or toutes ces données afférentes à notre culture, qui se trouvent libérées des documents, permettent de générer d’innombrables applications (par ex. un GPS culturel).

De la gestion de documents, on passe à la gestion de données rendues accessibles à tous, et utilisables pour créer de nouveaux usages, de nouveaux services, de nouveaux marchés...

Au service des consom’acteurs de la culture

De toute évidence, le déploiement de la publication de données, notamment culturelles, sur le Web, multiplie les accès pour les citoyens et consommateurs de culture, fournissant un terreau d’innovation fertile aux prochaines applications qui germeront sur le Web. Corollairement, les mêmes consommateurs, d’horizons de plus en plus variés (étudiants, chercheurs, visiteurs) deviennent acteurs des mises à jour, enrichissements et surtout créent du lien.

* à travers l’UMR I3S