Sites Inria

English version

Recherche

5/05/2017

Benoît Sagot, responsable de la nouvelle équipe ALMAnaCH

L’équipe-projet ALMAnaCH fait son entrée au sein du centre de recherche de Paris et est dirigée par Benoît Sagot. L'EPI ALMAnaCH fait suite à l'EPI Alpage.

Que signifie Almanach ? Quels sont vos principaux thèmes de recherche ? 

La nouvelle équipe ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities) a pour domaine de recherche le traitement automatique des langues (TAL). Il s’agit d’un domaine très actif, qui participe au nouvel essor de l’IA, et qui requiert des compétences multidisciplinaires, notamment en informatique théorique, en apprentissage automatique et en linguistique théorique et descriptive.

ALMAnaCH fait suite à l’équipe-projet ALPAGE, mais en étend les thèmes de recherche. Elle poursuit les recherches d’ALPAGE sur l’analyse syntaxique et sémantique du langage naturel, y compris sur des données bruitées issues du Web, au moyen de techniques symboliques, statistiques, neuronales et hybrides. Elle a également vocation à continuer ses travaux en développement de ressources linguistiques. L’un des aspects nouveaux de nos travaux sera la modélisation et la prise en compte du contexte, à la fois linguistique (par exemple au cours d’un échange avec un chatbot ) et non linguistique. Nos recherches en linguistique computationnelle (modélisation du langage) sont étendues à la diachronie (modélisation de l’évolution des langues dans le temps). Enfin, les Humanités numériques et computationnelles deviennent un axe important de l’équipe, par exemple par l’adaptation et l’application de techniques de TAL à des corpus historiques, depuis les papyrus antiques jusqu’à des documents à valeur historique datant de quelques dizaines ou centaines d’années. De telles approches, sur des documents qui peuvent être manuscrits ou imprimés, touchent à des problématiques qui vont de la reconnaissance de l’écriture manuscrite jusqu’à l’extraction d’informations et la fouille de textes sur des documents anciens.

Ces nouvelles thématiques sont au cœur de la collaboration entre Inria et l’École pratique des hautes études, dont deux directeurs d’étude (un informaticien et un philologue tous deux spécialistes des Humanités numériques) sont membres de l’équipe.

Est-ce une recherche plutôt fondamentale ou plutôt appliquée ? Y a-t-il des applications ?

Les recherches de l’équipe couvrent tout le spectre allant des questions théoriques (langages formels, algorithmique, mais également linguistique formelle) à des applications industrielles, en passant par des prototypes opérationnels (analyseurs syntaxiques) et des applications académiques (modélisation computationnelle des langues et de leur évolution) et médicales.

Avez-vous des partenariats industriels ou universitaires ?

Nous sommes actuellement impliqués, entre autres, dans cinq projets ANR, quatre projets H2020, un projet franco-américain ANR-NSF, ainsi que dans plusieurs réseaux tels que le LabEx « Empirical Foundations of Linguistics  » et la TGIR Huma-Num. Une start-up Inria spécialisée dans les enquêtes d’opinion auprès des salariés vient d’être créée en partenariat avec l’équipe. Nous avons de nombreux contacts avec des acteurs industriels du TAL et de l’IA, notamment au travers de projets financés ou soumis. Au sein du centre, nous discutons notamment avec les équipes Willow, Sierra et (bientôt) CoML.

Mots-clés : Almanach Langages Automatique Nouvelle équipe Inria de Paris TAL

Haut de page

Suivez Inria tout au long de son 50e anniversaire et au-delà !