Défi

COLaF

Corpus et Outils pour les Langues de France
Corpus et Outils pour les Langues de France

À travers le projet COLaF (Corpus et Outils pour les Langues de France), Inria a pour objectif de contribuer au développement de corpus et d’outils libres pour le français et les autres langues de France, en étroite collaboration avec des partenaires académiques et institutionnels.

Le périmètre de COLaF inclut à la fois : les données textuelles et les données de parole et de langue des signes.

COLaF vise à couvrir la diversité du français et des langues de France :

  • il a pour ambition de couvrir un échantillon aussi divers que possible: français de France et d’ailleurs, langues régionales, créoles à base française (y compris hors de France), langues autochtones, langues d’immigration, langue des signes française;
  • l’ensemble des axes de variation seront étudiés, au-delà de l’état standard de la langue, et notamment les langues de spécialité, la diachronie, les états non standard (réseaux sociaux, langue d’apprenants, etc.).

 

Équipe(s) impliquée(s)
ALMANACH, MULTISPEECH
En partenariat avec
DFKI Berlin, DFKI Saarbrücken, UMR ISIR ( Institut des
systèmes intelligents et de robotique), UMR PRAXLING (Appréhender les languages en tant que pratique sociale).

Contacts

Slim Ouni

Responsable scientifique

Benoit Sagot

Co-responsable scientifique