Sites Inria

English version

Equipe de recherche ALMANACH

Automatic Language Modelling and ANAlysis & Computational Humanities

  • Responsable : Benoit Sagot
  • Type : équipe
  • Centre(s) de recherche : Paris
  • Domaine : Perception, Cognition, Interaction
  • Thème : Langue, parole et audio
  • Les "équipes" Inria sont en général des groupes de chercheurs engagés dans la définition d'un projet et d'objectifs partagés, qui donneront lieu à la création d'une équipe-projet. Les équipes-projets ainsi créées peuvent être commune avec des partenaires (universités ou organismes de recherche)

Présentation de l'équipe

L’équipe ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities) a pour domaine de recherche le traitement automatique des langues (TAL), au cœur de l’Intelligence Artificielle et des Humanités Numériques, à la croisée entre informatique théorique, apprentissage automatique et linguistique. L’équipe se concentre notamment sur l’analyse syntaxique et sémantique du langage naturel, y compris sur des données bruitées issues du web, au moyen de techniques symboliques, statistiques, neuronales et hybrides. L’un des enjeux nouveaux est la prise en compte des informations contextuelles, à la fois linguistiques et non-linguistiques, par exemple dans le cadre du développement de chatbots. L’équipe s’investit également dans le domaine des Humanités Numériques et Computationnelles, notamment par l’étude de la variation linguistique, par exemple pour exploiter des documents anciens, modéliser l’évolution des langues, étudier les langues du web ou participer au développement d’outils de simplification de textes pour les rendre plus accessibles à tous.

Axes de recherche

  • Analyse linguistique automatique améliorée par les informations contextuelles
    • Analyse linguistique automatique en contexte à tous les niveaux: morphologie, syntaxe, sémantique
    • Extraction d'informations et de connaissances
    • Chatbots et génération de texte
  • Modélisation computationnelle de la variation linguistique
    • Linguistique théorique synchronique
    • Variation sociolinguistique
    • Variation diachronique
    • Variation en termes d'accessibilité
    • Variation intertextuelle
  • Modélisation et développement de ressources linguistiques
    • Construction, gestion et annotation automatique de corpus textuels
    • Développement de ressources lexicales
    • Développement de corpus annotés

 

Suivez Inria tout au long de son 50e anniversaire et au-delà !