Sites Inria

Equipe de recherche ALPAGE

Analyse linguistique profonde à grande échelle

Présentation de l'équipe

Développement de systèmes d'analyse syntaxique profonde et à grande échelle pour le français : techniques d'analyse syntaxique, descriptions linguistiques profondes (formalismes, lexiques, grammaires) au niveau syntaxique, extension aux niveaux sémantique et discursif.

Axes de recherche

Le domaine du traitement automatique des langues (TAL) est à la croisée de l'informatique, de la linguistique, mais également des mathématiques probabilistes et de la cognition. Il a pour enjeu la compréhension et la génération automatiques des langues humaines, sous forme textuelle ou orale. ALPAGE travaille principalement sur la compréhension automatique de textes en français, tout en travaillant également sur la génération automatique et sur d'autres langues, dont l'anglais. La forte dynamique de l'équipe-projet ALPAGE est liée en partie à la complémentarité de ses membres : de nombreuses avancées importantes en TAL n'ont été possibles que par une étroite collaboration entre informaticiens et linguistes spécialistes du TAL. ALPAGE, qui est une équipe mixte entre le centre de recherche INRIA Paris - Rocquencourt et l'UFR de linguistique de Paris 7, ambitionne de faire avancer de façon significative l'état de l'art en analyse automatique du français. Ceci passe par une meilleure compréhension et une meilleure formalisation des phénomènes linguistiques, y compris les plus complexes, puis leur prise en compte dans des modèles lexicaux et grammaticaux, eux-mêmes mis en oeuvre à l'aide de technologies algorithmiques et logicielles avancées, à la fois symboliques et probabilistes, pour l'analyse lexicale et syntaxique, voire la génération automatique et, à terme, la traduction automatique. Les applications du TAL sont nombreuses et importantes pour ALPAGE, en particulier pour la construction d'outils de correction orthographique, grammaticale et stylistique, de recherche d'informations et de fouille de textes.

Logiciels

Mots-clés : TAL Analyse syntaxique Lexiques Discours