Sites Inria

English version

Données personnelles

Edward Lichtner - 20/12/2013

Dis-moi comment tu surfes, je te dirai qui tu es

Jérémie Mary © Jérémie Mary

Les algorithmes d'analyse comportementale permettent de « profiler » les internautes de manière de plus en plus précise. La protection de la vie privée sur le Web serait-elle en voie de disparition ?

Depuis quelques années, les données personnelles des internautes s'accumulent dans les bases de données des géants du Web. Il y a celles, déjà très détaillées, que nous offrons librement via nos profils Google, Facebook, Twitter, ou que nous renseignons sur les sites marchands. S'y ajoutent les traces que nous laissons en surfant d'un site à l'autre. « Une fois identifié à son compte Google, un internaute est un véritable livre ouver t » explique Jérémie Mary, maître de conférence à l'Université de Lille et chercheur au sein de l'équipe-projet Sequel du centre Inria Lille – Nord Europe. « Les requêtes formulées sur Google sont mémorisées, dans le but d'améliorer la pertinence des futurs résultats de recherche pour cet individu. De la même manière, les e-mails des comptes GMail passent par un filtre destiné à analyser les goûts d'une personne pour lui proposer ensuite les offres commerciales les mieux ciblées. Facebook et Twitter font de même en enregistrant et analysant Like et retweets. »

L'université de Cambridge au Royaume-Uni a démontré l'année dernière qu'il était possible de déduire assez fidèlement l'orientation sexuelle, politique ou religieuse, tout comme l'âge, la race ou la propension à consommer des stupéfiants, par simple interprétation des Like sur Facebook

Du démarchage à l’espionnage

Si ces pratiques obéissent avant tout à une logique de ciblage publicitaire, les informations compilées dépassent ce que chacun de nous souhaite généralement dévoiler. « L'université de Cambridge au Royaume-Uni a démontré l'année dernière qu'il était possible de déduire assez fidèlement l'orientation sexuelle, politique ou religieuse, tout comme l'âge, la race ou la propension à consommer des stupéfiants, par simple interprétation des Like sur Facebook », rappelle Jérémie Mary. Ces nouvelles méthodes d’analyse algorithmique ouvrent la voie à de possibles dérapages : une réalité que les internautes ne peuvent plus, désormais, feindre d'ignorer. La cryptographie permet déjà de s’en prémunir dans une certaines limite, mais est évidemment impuissante pour les traces de navigation et le profilage à partir d’informations publiques (telles les Like). Des mouvements de réflexion sont engagés sur les moyens de pouvoir faire des statistiques tout en garantissant un maximum d’anonymat. « Nous sommes propriétaires de nos données et devrions avoir le droit d’en restreindre l’usage à notre convenance (durée, conditions d’utilisation, etc.)  », conclut Jérémie Mary.

Vers un web sur mesure

De mars à juin 2012, l'équipe-projet Sequel d'Inria Lille - Nord Europe a collaboré avec Yahoo pour proposer un challenge aux laboratoires de recherche universitaires. L'objectif : analyser les logs de connexion* d'utilisateurs non-identifiés, pour en déduire un profil et  personnaliser la page d'accueil Yahoo News en conséquence. La progression des taux de clics a démontré à quel point la technique était efficace.

De son côté, Facebook s’appuie depuis décembre 2013 sur Yann LeCun, spécialiste mondial de l’intelligence artificielle. Le premier réseau social au monde l’a embauché pour mettre en place des outils de deep learning ou “apprentissage profond”, afin de prédire les activités de ses utilisateurs et leur proposer des informations personnalisées.

* Journal de connexion qui mémorise la suite des pages web affichées par un internaute

Mots-clés : Données personnelles Vie privée Deep learning SEQUEL

Haut de page

Suivez Inria