Web sémantique

Traitement automatique de l'argumentation dans les textes en langage naturel

Date:

Mis à jour le 08/07/2025

Il est souvent constaté que les communautés scientifiques manquent de femmes, notamment dans les domaines des mathématiques et de l’informatique. Mais la jeune équipe-projet Marianne, du Centre Inria d’Université Côte d’Azur, montre la voie de la féminisation des sciences dites « dures » avec une équipe principalement composée de chercheuses. En partenariat avec Université Côte d’Azur et le CNRS, les membres de Marianne, pour « Modèles et données pour l'argumentation computationnelle en langage naturel », focalisent leurs travaux sur le traitement automatique de l'argumentation dans les textes en langage naturel.
Shema Disputool  JF Kennedy - Nixon

L'outil DISPUTool permet de comparer les arguments utilisés par les candidats aux élections présidentielles américaines lors des débats télévisés. Ici, Richard M. Nixon et John F. Kennedy en 1960. 

Facilité de travail des historiens

Ce domaine de recherche impliquant la linguistique, l'informatique et le machine learning est appelé traitement automatique du langage naturel ou « Natural Language Processing » (NLP). De nombreux types de publication ont recours à des argumentaires : discours politiques, articles de presse, posts de réseaux sociaux, comptes-rendus médicaux, rapports d'essais cliniques… Et ces publications ont un impact sur la société, parfois même sur la démocratie ou la sécurité, voire la santé. D’où l’importance de les étudier en ayant recours aux techniques du NLP.

Des modèles mathématiques ou statistiques sont utilisés dans des programmes informatiques qui, ensuite, sont entraînés sur de grandes quantités de données dans le but de les rendre capables de réaliser une tâche comme reconnaître un argument dans un discours ou une fake news sur les réseaux sociaux avec un taux de réussite élevé et sans intervention humaine. Serena Villata, directrice de recherche CNRS et responsable de l’équipe-projet Marianne, insiste sur la qualité des données qui doivent être utilisées : « Pour l’application DISPUTool, qui analyse les débats des élections présidentielles américaines de 1960 à 2016, nous avons utilisé les comptes-rendus officiels. Mais il a été nécessaire de les annoter manuellement avant de les utiliser pour entraîner nos modèles. Cela a pris neuf mois ! ». DISPUTool est un outil conçu pour faciliter le travail des historiennes et historiens et des chercheurs et chercheuseq en sciences sociales dans l'analyse du contenu argumentatif des discours politiques.

Détecter et caractériser automatiquement les arguments

Les travaux de recherche de l'équipe Marianne visent trois objectifs principaux. Le premier est la capacité des modèles informatiques à identifier automatiquement tous types d’arguments dans les textes, être en mesure de les classifier et de les caractériser. Il s'agit de repérer des éléments textuels et d'indiquer s’ils illustrent un fait, une assertion sans justification…

Un deuxième objectif est de produire une évaluation automatique de la qualité de ces arguments. Le traitement informatique devrait être capable de détecter les arguments fallacieux dans un débat politique par exemple, c'est-à-dire des affirmations qui ne sont pas vraiment fausses, mais dont la tournure a pour objectif de tromper le public. Ces fonctionnalités peuvent par exemple détecter la haine à travers des arguments abusifs dans un débat ou sur les réseaux sociaux.

Mais détecter et dénoncer ne suffisent pas. De nombreuses études sociologiques montrent que le fait d’affirmer que tel argument est haineux ou fallacieux ne fait pas changer l’opinion de celle ou celui qui le reçoit. D’où le troisième objectif qui est d’arriver à générer automatiquement des contre-arguments, pour combattre la haine en ligne par exemple, pour démystifier un raisonnement fallacieux ou déconstruire de fausses informations. Le tout avec des références fiables, solides.

L’ambition de l’équipe-projet commune Marianne n'est pas de développer un système en particulier mais bien de faire avancer la recherche dans ce domaine pour aller le plus loin possible vers la détection et la caractérisation d’arguments de plus en plus complexes. Des acteurs publics ou privés pourraient ensuite utiliser ces développements sur leur propre plate-forme, comme cela a été fait dans les écoles de Trento en Italie pour prévenir et combattre le cyber harcèlement.

L'éthique au cœur des préoccupations 

Marianne est une équipe dont les travaux font appel à de nombreuses disciplines telles que la sociologie, la linguistique ou encore le droit. Cette dimension pluridisciplinaire est très riche et très importante pour les membres de l’équipe. « Nous sommes très intéressés par les problèmes d’éthique dans le numérique », précise Serena Villata qui a fait partie durant cinq ans du comité National pilote d'éthique du numérique. Elle coordonne le projet ATTENTION, soutenu par l’ANR, dont le but est de contrer la désinformation grâce à des outils IA conformes aux défis éthiques et sociologiques liés à la désinformation.

Marianne a également des liens étroits avec la mission « Défense » d’Inria, dans le cadre de l’étude de la désinformation et des luttes d’influence. Le projet intitulé « Controverses et influence dans la guerre en Ukraine : étude de l'argumentation et de la contre-argumentation par l'utilisation d’un algorithme d’intelligence artificielle », soutenu par l’ANR, étudie les différentes controverses en anglais et en français prenant place dans le contexte de la guerre en Ukraine pour comprendre l’impact de celles-ci dans le conflit lui-même. Elle s’attache à concevoir et mettre en œuvre un algorithme d’intelligence artificielle pour l’analyse automatique de l’argumentation dans ces controverses. Par ailleurs, Marianne est partie prenante dans le projet européen ORBIS qui explore les modèles de démocratie numérique pour élargir la participation des citoyens et leur implication dans la vie démocratique.

Contact

Villata Serena

Responsable de l'équipe-projet Marianne

2004, route des Lucioles BP93 , 06902 Sophia Antipolis