Sites Inria

Web

Françoise Breton, Jérôme Euzenat - 25/09/2012

L’émergence d’un Web des connaissances

open data Creative commons

L’idée d’un Web sémantique qui permettrait une recherche plus précise et pertinente dans l’immense quantité d’informations disponibles sur le Web a été lancée par Tim Berners-Lee en 1998. Sur cette voie, le Web des données, qui applique les outils du Web sémantique, est en pleine expansion grâce, notamment, à l’ouverture des données publiques à la consultation.

Témoignage de Jérôme Euzenat , responsable de l’équipe Exmo

Le Web sémantique est l’idée de créer un Web où la connaissance est représentée formellement, de manière manipulable par une machine, de telle sorte que l’utilisateur puisse obtenir des réponses plus pertinentes à ses requêtes. Autrement dit, l’ordinateur dispose de connaissances précises, comme "Hercule Poirot est un personnage de roman", "Agatha Christie est un auteur" et "Poirot est une création d’Agatha Christie". L’ensemble de ces relations constitue un gigantesque graphe, une sorte de réseau semblable à celui formé par les liens hypertextes du web, qui autorise des raisonnements et des appariements plus pertinents entre requêtes et réponses.

Dès le début des années quatre-vingt-dix,  au sein de l’équipe Sherpa d’Inria, j’utilisais le Web pour rendre accessibles les bases de connaissances que je développais, par exemple pour des biologistes. À l’instar de nos collègues de Karlsruhe et de College Park notamment, nous avions créé des outils collaboratifs qui permettaient aux contributeurs de naviguer, d’éditer, de confronter et d’intégrer des données dans des bases de connaissances sur le web. Le Web sémantique était, en quelque sorte, un prolongement de cette approche et je m’y suis naturellement associé pour participer à son élaboration.

Aujourd’hui, la représentation de connaissance est intégrée dans l’infrastructure du Web ; les pages web peuvent héberger des fragments de graphes représentant leur contenu. Mon équipe a largement contribué au développement de certains des outils permettant d’élaborer ces graphes, y compris indirectement en organisant la communauté du Web sémantique. Je dirige notamment les travaux sur l’alignement d’ontologies, c’est à dire la mise en correspondance des vocabulaires utilisés dans les graphes, par exemple reconnaître qu’un auteur est une personne qui écrit des livres. Cette activité est indispensable aujourd’hui pour assurer l’universalité du Web sémantique.

Première application d’ampleur : le Web des données

Donner des indications sur le sens des documents reste cependant difficile à réaliser et la première application de ces outils a concerné les données plutôt que les documents, en partie grâce au mouvement OpenData qui encourage les gouvernements à mettre leurs données à la disposition du public. Des acteurs privés ont également pris la mesure de ce qu’apportent les technologies sémantiques. Facebook par exemple a développé l’Opendata graph à partir du langage de description RDF , une démarche qui lui procure des moyens efficaces de profilage des utilisateurs et donc la possibilité d’afficher des propositions commerciales mieux ciblées. De même, les moteurs de recherche Google , Yahoo et Bing se sont groupés pour créer schema.org avec le même objectif.

ET DANS 20 ANS ?

Jérôme Euzenat,  responsable de l’équipe Exmo, principal acteur français du domaine avec les équipes Accacia et Orpailleur.

Jérôme Euzenat

« Le nouveau défi est de faire en sorte que tout marche ensemble ! Non seulement que les données soient liées et les ontologies alignées, mais aussi que ces outils soient utilisés pour découvrir l’inconsistance entre sources d’information (données erronées, évolutives, etc.) et gérer cette inconsistance en révisant les ontologies, les alignements ou les liens, afin d’améliorer la qualité des réponses aux requêtes. »

Mots-clés : Web sémantique Web Web des données Jérôme Euzenat INRIA Grenoble - Rhône-Alpes

Haut de page

Suivez Inria