Traitement automatique des langues

La consolidation de données et le TAL au soutien de la lutte contre la radicalisation

Date:
Mis à jour le 29/06/2021
Afin de soutenir la lutte contre la radicalisation et ainsi prévenir de potentielles attaques terroristes, le projet européen multipartenaire CounteR a pour objectif de fournir aux forces de l’ordre une plate-forme permettant, grâce à la consolidation de données, de détecter la formation de communautés susceptibles de commettre des actions violentes. Explications.
Photo abstraite sécurité et détection
© Michael Dziedzic

 

Le projet CounteR est issu d'une initiative de Frédérique Segond, directrice de la mission Défense et sécurité d’Inria, créée afin de coordonner les recherches de l’institut applicables à la souveraineté française et européenne. C’est tout naturellement que l’équipe ALMAnaCH d’Inria de Paris, dont les recherches portent sur l’intelligence artificielle combinant Traitement automatique des langues (TAL) et Humanités computationnelles, a rejoint le consortium en tant qu’expert NLP (Natural language processing).

La force du nombre : un projet collaboratif aux partenaires multiples et internationaux

Le projet CounteR bénéficie de la présence de spécialistes en extraction d’informations et en fouille de données, mais également d’experts en psychologie des processus de radicalisation, ou encore des services institutionnels comme le ministère de l’Intérieur en France (consultez la liste des partenaires). Une multitude de partenaires européens donc, justifiée par le caractère fondamentalement multilingue du projet qui nécessite une maîtrise totale de tous les éléments d’une chaîne de traitement allant de l’extraction de données de flux complexes au traitement sémantique multimodal et décisionnel.

Djamé Seddah, responsable du projet pour l’équipe ALMAnaCH d’Inria de Paris, souligne l’importance cruciale des partenaires :

Je ne crois pas qu’une seule équipe soit capable de déployer à elle seule une telle chaîne pour de multiples langues et sources de données dans un laps de temps aussi court.

La dimension européenne du projet tient beaucoup à Djamé Seddah, responsable du projet CounteR pour l’équipe ALMAnaCH. L’Europe a en effet donné à Djamé une totale liberté de mouvement : la possibilité d’effectuer des postdoctorats au Luxembourg et en Irlande aussi simplement que s’ils avaient eu lieu à Bordeaux ou à Nice. L’occasion pour lui de se construire un réseau professionnel qui a perduré bien au-delà du cercle initial de ses collaborations et qui a fortement nourri son parcours scientifique et personnel.

Des technologies de pointe de TAL au service de la contre-radicalisation

En tant que partenaire du projet, Inria a pour objectif de fournir aux services institutionnels des technologies de pointe de TAL dites proof of concepts, afin de détecter et anticiper la formation de zones critiques. Ces technologies seront combinées à des connaissances d’experts en psychologie sur les mécanismes de radicalisation afin d’offrir une solution complète aux forces de l’ordre pour comprendre le "quand", le "où" et le "pourquoi" de ce phénomène grandissant au sein des communautés.

Verbatim

L’exploration de sources de données bruitées et multimodales constitue pour nous une piste à explorer en priorité dans une optique de mise en pratique de nos activités de recherche. 

Auteur

Djamé Seddah

Poste

Responsable du projet pour l’équipe ALMAnaCH d’Inria de Paris

Pour l’équipe ALMAnaCH, l’objectif principal est d’étendre les technologies d’analyse de textes et d’extraction d’informations déjà mises en place afin de les rendre utilisables dans des contextes où les flux d’informations sont non seulement bruités mais aussi multilingues et multimodaux. Les chercheurs ont également l’ambition de rendre leurs technologies utilisables dans des contextes sensibles où la robustesse et la qualité des analyses constituent des paramètres fondamentaux. Les premières séries d’expériences sur des données réelles sont donc très attendues.

L’enjeu, en parallèle, est que cette plate-forme de veille soit utilisée pour ce qu’elle est : CounteR a pour fonction de consolider des données provenant de sources diverses dans une plate-forme d’analyse et d’alerte précoce pour l’exploration de données et la prédiction de risques potentiels. L’objectif est donc de constituer un outil de police communautaire de première ligne, qui examine la communauté et les facteurs de risque connexes, et non de cibler et surveiller de manière arbitraire les individus.

Des possibilités accrues grâce au financement européen

Bénéficier d’un financement européen, et non simplement national, est crucial pour le passage à l’échelle. Être capable de traiter ce type d’informations en temps réel ou presque, à une si large échelle, tout en mettant en œuvre une technologie des plus complexes nécessite des compétences autres et des budgets plus importants.

Verbatim

C’est grâce à l’expérience acquise lors des précédents projets ANR que nous avons menés (Projets Sequoia, Edylex, Passage, SoSweet, ParSiTi, etc.)  au sein d’Inria que nous sommes capable d’assumer des projets d’une telle ampleur. 

Auteur

Djamé Seddah

Poste

Responsable du projet pour l’équipe ALMAnaCH d’Inria de Paris

Le projet CounteR a bénéficié d’un financement européen du programme-cadre précédent, H2020 et de son troisième pilier. Ce pan d’H2020 était dédié aux défis sociétaux identifiés par la Commission européenne comme d’actualité et majeurs pour les États-membres. Le consortium CounteR a ainsi répondu à un appel sur les technologies permettant de lutter efficacement contre le terrorisme notamment (SU-FCT02-2018-2019-2020 — Technologies to enhance the fight against crime and terrorism). 

Un projet de l’ampleur de CounteR ne pouvait être mené que dans le cadre d’une collaboration européenne. En effet, les projets de recherche collaboratifs européens permettent de profiter d’un bon niveau de granularité, d’un certain équilibre entre contraintes administratives liées aux montants des financements et surtout une liberté scientifique presque totale concernant les partenaires. Les bilans d’étapes qui vont rythmer le projet sont particulièrement importants, en cela qu’ils permettent d’ajuster précisément les attentes entre attendus scientifiques et techniques, et réalité des données.