Sites Inria

English version

République numérique

6/02/2017

TransAlgo : évaluer la responsabilité et la transparence des systèmes algorithmiques

Lorsque je recherche un itinéraire sur mon smartphone via mon application favorite, comment savoir si l'algorithme employé ne recourt pas à des critères marchands pour me faire passer par des points d'intérêt commerciaux ?  L’objectif du projet TransAlgo est d’éclairer sur ce type de pratiques lorsqu'elles ne sont pas explicites. Un projet qu’Inria vient de se voir confier par Axelle Lemaire dans le contexte de la Loi pour une république numérique. Comment développer des méthodes qui permettent de vérifier si une décision est prise sur des critères non avouables ? Nozha Boujemaa, à qui ce travail d’envergure a été confié, nous répond.

Comment est né le projet TransAlgo ?

Suite à la Loi pour une République Numérique, Axelle Lemaire a commandé au Conseil Général de l’Économie (CGE) un rapport sur les modalités de régulation des algorithmes de traitement des contenus. Une des recommandations de ce rapport a été la mise en place d’une plateforme scientifique collaborative destinée à favoriser, d’une part, le développement d’outils logiciels et de méthodes de tests d’algorithmes et, d’autre part, la promotion de leur utilisation. Avec un groupe de travail interne (1), nous avons proposé la mise en place d'une plateforme dénommée TransAlgo pour le développement de la transparence et de la responsabilité des systèmes algorithmiques, du fait de la dualité des données et des algorithmes.

Inria s’est vu confier le rôle d’opérateur de TransAlgo, avec le soutien du Conseil national du numérique (CNNum) et de l’Institut Mines Télécom (IMT), et sera chargé de jouer le rôle de catalyseur de la dynamique scientifique avec d'autres partenaires académiques, notamment le CNRS. Outre l'expertise scientifique, Inria apportera l'aide au développement logiciel.

Cette plateforme sera une première en Europe.

Pourquoi se préoccuper de ce sujet ?

Un exemple simple : si une application pour smartphone utilise mes données GPS pour me suggérer un itinéraire, qui vérifie que l'algorithme employé ne recourt pas à des critères marchands pour me faire passer par des points d'intérêt commerciaux ? Après tout, c'est bien ce que fait Google sur son moteur de recherche avec l'achat de liens sponsorisés. Un autre exemple de comportement déloyal est le pricing volatile que vous pouvez constater lorsque le prix de votre billet d'avion augmente au fur et à mesure de vos visites sur un site d'e-commerce. La finalité n'est pas de freiner l'innovation ou les nouveaux modèles d'affaires mais d'accompagner l'innovation par l'information éclairée du consommateur, qu'il soit citoyen (B2C) ou entreprise (B2B), et par la traçabilité d'une prise décision automatisée. La transparence est un atout pour l' « en-capacitation » du consommateur mais aussi un facteur de compétitivité économique.
Une étude récente d'Inria et de la CNIL a ainsi épinglé un acteur économique bien connu. En cause, son application mobile qui outrepassait le consentement de l'utilisateur en communiquant sa position GPS en dépit du refus de ce dernier. En l'occurrence,  les responsables n'étaient pas au courant et ont dû diligenter une enquête interne pour comprendre d'où venait le problème. Le manque de loyauté des programmes n'est pas forcément intentionnel !

Il y aussi les mécanismes de tri dans les moteurs de recherche, les mécanismes de recommandation et de sélection de contenus proposés qui n’apparaissent pas à l’heure actuelle de manière transparente... Tout cela peut avoir des impacts que la plupart des gens ne mesurent pas encore sur l’octroi de prêts bancaires, d’assurance, les situations de recrutement, etc.

De vrais enjeux donc d'information, de neutralité, de loyauté, d’équité, de non-discrimination, de concurrence déloyale, de respect du consentement, de la vie privée, etc. Une chose très importante à comprendre néanmoins est que la plateforme scientifique TransAlgo ne sera en aucun cas en charge du contrôle réglementaire des algorithmes ou de l’utilisation des données. Elle proposera une offre d’études, d’outils et de services à l’ensemble des acteurs concernés.

Inria s’est vu confier le rôle d’opérateur de TransAlgo et sera le catalyseur de la dynamique scientifique avec d'autres partenaires académiques.

Quels sont les enjeux scientifiques de TransAlgo ?

La transparence des systèmes algorithmiques est un vrai défi pour la recherche académique. Cela fait appel à plusieurs compétences disciplinaires et beaucoup de sujets identifiés ne sont pas encore suffisamment explorés par la recherche académique, d'où l'importance de multiplier l'effort de recherche. Il faut développer des algorithmes « Responsable-par-Construction » qui facilitent la mesure de leur transparence, leur explication et la traçabilité de leur raisonnement. Un algorithme est dit « responsable » s’il respecte les lois, et s’il se conforme à certaines règles éthiques.

Un algorithme est transparent si l’on peut facilement vérifier sa « responsabilité », par exemple, s’il ouvre son code, s’il explicite à la fois la provenance des données qu’il a utilisées, et celles qu’il produit, s’il explique ses résultats, ou encore s’il publie des traces de ses calculs. Notons que nous considérerons aussi les situations où le code n'est pas ouvert car il n'y a aucune obligation de divulgation du code.

Comment allez-vous procéder ?

Pour pouvoir s’y atteler, il est nécessaire de définir au préalable ce qu'on appelle un logiciel transparent, neutre, loyal, ou équitable, des notions qui sont plutôt juridiques. Ce travail implique la vérification de la conformité entre ses spécifications et son comportement, autrement dit l'écart entre ce qu'il est supposé faire et ce qu'il fait. Il apportera aussi un éclairage sur sa conformité aux règles éthiques et juridiques. Les méthodes et les outils techniques de la transparence des systèmes algorithmiques sont un sujet complexe et multiforme. Les propriétés que l’on souhaite vérifier, par exemple la non-discrimination ou la loyauté, incluent une part importante de subjectivité, qui dépend des cas d'usage et des contextes. Cela rend leur spécification difficile. Les challenges scientifiques sont nombreux et très peu de travaux de recherche sur le sujet existent.

Dans un premier temps, d'ici le premier semestre 2017, nous allons constituer la plate-forme scientifique dans sa phase « centre de ressources ». Elle compilera les études scientifiques, les livres blancs et autres ressources utiles avec une conceptualisation partagée des différentes notions mentionnées incluant un espace d'échange avec la communauté scientifique. Nous la souhaitons interopérable avec les initiatives étrangères, et notamment américaine. Puis nous lancerons les programmes de recherche à proprement parler à travers des thèses et des post-doctorats. Cela permettra de consolider une communauté scientifique et un corpus d'outils commun autour de ces thèmes. Une de nos partenaires, c'est le Data Transparency Lab , notamment porté par le MIT et la fondation Mozilla dont Inria est membre de son bureau. Enfin, la troisième et dernière phase sera la diffusion des bonnes pratiques, à travers par exemple des cours en ligne (MOOC) à destination des pouvoirs publics, des industriels et du grand public.

Comment être certain d’avoir un ancrage dans le monde réel ?

Le CNNum joindra ses forces avec celles d'Inria dans TransAlgo dans le respect des missions de chacun. Il prendra en charge le recensement et l'objectivisation de la situation actuelle de certaines pratiques des plateformes à travers un dispositif contributif (citoyens et professionnels). Les données des différentes sources de régulation européennes ou internationales viendront enrichir également le centre de ressources.

Pour faire remonter des cas d’usages bien réels, nous avons prévu de collaborer avec des think tank comme la FING (Fondation internet nouvelle génération), ou des associations de consommateurs comme Que-Choisir, en plus de la CERNA (Commission de réflexion sur l'éthique de la recherche en sciences et technologies du numérique d'Allistene).
Nous allons travailler également à partir des remontées d’expression de besoins qui viendront du CNNum, de la Direction Générale de la Concurrence, de la Consommation et de la Répression des Fraudes (DGCCRF), de l’Autorité française de contrôle en matière de protection des données personnelles (CNIL) en mesure de remonter les problèmes les plus observés par le citoyen, les industriels, les autorités de régulation.

[1 ] Daniel Le Métayer, Serge Abiteboul, Claude Castelluccia

Mots-clés : République Numérique TransAlgo Transparence des données Sécurité Algorithmes CNIL CERNA

Haut de page