Equipe-projet

ALMANACH

Modélisation et analyse linguistique automatique et humanités computationnelles
Modélisation et analyse linguistique automatique et humanités computationnelles

L'équipe ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities) se concentre sur le traitement du langage naturel (NLP), un domaine clé de l'intelligence artificielle (IA) et des humanités numériques (HN), à l'interface entre informatique théorique, apprentissage automatique et linguistique. Le travail de l'équipe couvre une grande variété de sujets liés à la variation linguistique, à la fois dans un sens historique et parmi les états de langue contemporains (développement de systèmes de TAL robustes pour le contenu web bruité et les variétés dialectales de la langue, par exemple). Nos intérêts s'étendent également au pré-entraînement des réseaux neuronaux (par exemple le modèle CamemBERT), à l'interprétabilité des approches neuronales, au développement de ressources linguistiques (par exemple le corpus OSCAR, les corpus arborés, les corpus parallèles, les lexiques, mais également les corpus historiques construits à l'aide d'OCR et d' HTR appliqués aux documents d'archives et autres documents historiques), à l'évaluation et à l'extraction et la récupération d'informations (en particulier à partir de corpus spécialisés et de documents historiques).

Centre(s) inria
Centre Inria de Paris

Membres

Responsable de l'équipe

Meriem Guemair

Assistant(e) de l'équipe