Web sémantique

Joachim Niehren : Interroger les bases de données de façon plus intelligente

Date:
Mis à jour le 15/04/2021
Le Web est devenu de plus en plus sémantique, nous permettant de trouver des informations de manière concise. Une simple recherche par mot clé comme « Mozart » nous permet par exemple de trouver la date de naissance ou la liste des œuvres du musicien, reflétant le progrès dont ont bénéficié les moteurs de recherche depuis ces dix dernières années.
Chercheurs de l'équipe LINKS
© Inria / Photo C. Morel

Ces moteurs présentent des connaissances précises sur les sujets recherchés par requête mots clés, en posant eux-mêmes des requêtes logiques à des bases de connaissances du type de Wikipédia , où sont stockées des informations encyclopédiques de manière digitalisée. Ces bases de connaissances, dont on rêve en intelligence artificielle depuis une trentaine d’années, sont devenue aujourd’hui une réalité. L’évolution rapide du concept et des technologies de type bases de données en bases de connaissances, permet aujourd’hui de stocker et interroger du contenu beaucoup plus vaste et hétérogène. C’est ainsi une grande partie des connaissances de l’humanité qui est de plus en plus concernée, et plus seulement les données tabulaires d’une entreprise par exemple.

Ces bases de connaissances n’ont pu émerger que grâce à l’évolution du rôle de l’usager, devenant contributeur actif du Web. C’est ce que l'on appelle l'aspect "crowd"  du Web, qui désigne la saisie par la foule de connaissances stockées dans ces bases en format RDF.

Nous avons donc affaire à une toute nouvelle génération de bases de données avancées incluant les bases de connaissances qui, contrairement à la situation d’il y a 20 ans, ne nécessitent plus d’ingénieurs experts pour leur utilisation. Ces bases de connaissances, du type de Wikipédia , sont enrichies par tout-un-chacun via  ses propres interfaces Web et peuvent simplement être interrogées via des moteurs de recherches.

Inria, un environnement idéal

Chez Inria, les treize membres de l’équipe-projet Links (dont huit enseignants-chercheurs permanents) dirigés par Joachim Niehren, travaillent dans le domaine des requêtes logiques et développent de nouvelles techniques de recherche et d’extraction d’information à partir de bases de données et de connaissances. Face à la masse de données et connaissances croissante sur le Web, l’enjeu est de taille. « Le défi est de réussir à interroger et croiser un maximum de bases de données et de bases de connaissances simultanément de façon plus intelligente, tout en tenant compte de l’origine des informations, pour trouver les réponses les plus complètes et les plus pertinentes possible. Il faut aussi tenir compte des nouveaux formats de bases de données comme NoSQLGraph ou RDF knowledge bases », précise le chercheur.

Après avoir suivi des études dans les domaines de l’informatique et des mathématiques avec des applications en intelligence artificielle, en particulier sur des langages de programmation et la linguistique informatique, Joachim Niehren a commencé sa carrière de chercheur dans son pays à Sarrebruck en Allemagne. C’est en arrivant à Lille en 2003 qu’il choisit d’orienter ses recherches vers les bases de données pour le Web - dont sont issues les bases de connaissances, mixant des méthodes de représentations des données en intelligence artificielle. Chez Inria, Joachim Niehren trouve des conditions de travail favorables pour mener à bien ses recherches jusqu’à prendre la direction de l’équipe Links en 2012. « Inria est un institut de renommée internationale où nous pouvons travailler en équipe dans un environnement idéal avec nos collègues chercheurs, doctorants et postdoctorants. »

Les limites de l’intelligence artificielle en permanence repoussées

Face aux enjeux que représentent les bases de données pour les entreprises, Links est régulièrement sollicitée par le monde industriel. « Nous devons travailler dans une logique de transfert sur le long terme. Il est donc important pour nous de coopérer avec des industriels sur des sujets d’aujourd’hui tout en continuant à préparer le futur à travers nos travaux de recherche plus fondamentale en parallèle. Inria favorise les contacts avec les entreprises et des rencontres sont régulièrement organisées à Paris pour l’international et national, et à Lille pour le régional. Je suis aussi très fier quand les doctorants que nous formons vont travailler dans des entreprises innovantes de renom ou des sstartups issues du monde de la recherche, et y véhiculent nos idées », ajoute Joachim Niehren. Et dans un domaine aussi passionnant que la recherche en informatique, même si l'on sait comment faire évoluer les fondements des bases de données, il est en revanche compliqué d'anticiper précisément les prochains défis applicatifs à venir. « Les avancées du Web correspondent à des avancées dans le domaine des bases de données mais les limites de l’intelligence artificielle sont en permanence repoussées. Qui aurait pu prévoir les applications d’informatique que nous utilisons aujourd’hui sur le Web ? » Google, Facebook, Wikipédia représentent des exemples d’applications de bases de données d’une importance énorme qu’il était impossible d’imaginer il y a quelques dizaines d’années.

  • L'équipe-projet Links - Linking Dynamic Data