logo inria

RR-3342 - Proposal for a Natural Language Processing Syntactic Backbone

-----------------------
Boullier, Pierre
Rapport de recherche de l'INRIA - Rocquencourt , Equipe : ATOLL
41 pages - Janvier 1998 - Document en anglais
Titre français : Proposition d'un support syntaxique pour le traitement des langues naturelles
-----------------------
Abstract : The purpose of this paper is to present a grammatical formalism that extends context-free grammars and aims at being a convincing challenger as a syntactic base for various tasks, especially in natural language processing. These grammars are powerful, they strictly include mildly context-sensitive languages, while staying computationally tractable, since sentences are parsed in polynomial time. Moreover, this formalism allows a form of modularit- y which may lead to the design of libraries of reusable generic grammatical components. And, last, it can act as a syntactic backbone upon which decoratio- ns from other domains (say feature structures) can be grafted.

Résumé : Cet article présente un formalisme grammatical, plus général que les grammaires non contextuelles, suffisamment convaincant pour servir de base à différentes tâches, particulièrement en traitement de la langue. Ces grammaires sont puissantes, elles incluent strictement les langages modérément contextuels, tout en restant utilisables en pratique¸; leurs phrases sont analysées en temps polynomial. De plus ce formalisme permet une forme de modularité qui peut conduire à la conception de librairies de composants grammaticaux génériques réutilisables. Finalement, il peut être utilisé comme structure syntaxique supportant des décorations à valeur d'en d'autres domaines (par exemple les structures de trait).
-----------------------
Key-Words : GRAMMAR FORMALISMS / CONTEXT-SENSITIVE PARSING / SHARED FORESTS / COMPLEXITY OF PARSING / MODULARITY
Mots-clés : FORMALISMES GRAMMATICAUX / ANALYSE SYNTAXIQUE CONTEXTUELLE / FORÊTS PARTAGÉES / COMPLEXITÉ DE L'ANALYSE / MODULARITÉ
-----------------------