Distinction
SemEval-2010 : compétition remportée par des chercheurs Inria
© SemEval-2010
Laurent Romary et Patrice Lopez ont été classés 1er sur 19 participants dans le cadre de la compétition SemEval-2010, pour la tâche « Extraction automatique de mots-clés dans des articles scientifiques ». Ils ont présenté leurs résultats au cours du workshop SemEval-2010 qui a eu lieu à Uppsala en Suède, le 16 juillet dernier.
SemEval (auparavant Senseval) a pour objectif d’évaluer les systèmes d’analyse sémantique de textes. SemEval-2010 est la 5e édition de ce workshop qui rassemble un nombre toujours croissant de participants et de langues sous la forme de différentes tâches compétitives. Le but de la tâche concernée est d’extraire automatiquement les mots-clés d’articles scientifiques et de les classer selon leur pertinence, au sens où les auteurs ou les lecteurs pourraient les juger. L’extraction automatique de termes techniques et la qualité de l’identification des sujets principaux d’un article scientifique constituent un enjeu important dans un grand nombre d’applications et de domaines. On peut citer les bibliothèques numériques, la recherche d’informations ou bien le résumé automatique de documents.
Laurent Romary et Patrice Lopez ont utilisé une approche basée sur des techniques d’apprentissage automatique exploitant différents critères de distribution de termes, ainsi qu’une analyse de la structure des documents rencontrée dans les publications scientifiques. Ils se sont en outre appuyés sur la plateforme de données terminologiques GRISP qu’ils ont spécifiquement conçue pour les domaines techniques et scientifiques. L’exercice était basé sur un corpus d’environ 300 articles scientifiques fournis par ACM.
Mots-clés : Saclay - Île-de-France SemEval2010 Romary Lopez
En savoir plus
Site web HAL-Inria :
Inria
Inria.fr
Inria Channel

Voir aussi