ALMANACH

L'équipe-projet ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities) est une équipe pluridisciplinaire en intelligence artificielle (IA) dédiée aux domaines du Traitement Automatique des Langues (TAL) et des Humanités Numériques (HN), se situant à la croisée de l'informatique théorique, de l'apprentissage automatique et de la linguistique. Les recherches de l’équipe couvrent un large éventail de sujets, et notamment les modèles de langue neuronaux, la traduction automatique, la modélisation de dialogues, le développement de ressources linguistiques (corpus monolingues, parallèles et annotés, lexiques, etc.), l'IA interactive, les stratégies d'évaluation, l'extraction d'informations, la reconnaissance optique de caractères et la reconnaissance de texte manuscrit. L’équipe s’intéresse aux données provenant de domaines variés, notamment des contenus produits par les utilisateurs, des données biomédicales, des brevets, ainsi que des documents historiques. Au-delà des données purement textuelles, l’équipe s’intéresse également à des scénarios multimodaux impliquant la parole et les images. Un défi transversal à l'ensemble des recherches de l’équipe est la variation linguistique dans toute sa diversité (en genre, style, niveau de langue, et en variation dialectale et diachronique), à la fois comme un défi pour les systèmes actuels et comme un objet d'étude.

Centre(s) inria

Centre Inria de Paris