Sites Inria

Vie privée numérique

Françoise Breton - 19/04/2011

Anonymat sur internet : des identifiants très parlants

Illustration de l'anonymat sur Internet Anonymat sur Internet - © Tyler Olson - Fotolia.com

Le choix d'un identifiant peut avoir un impact sur les démarches marketing qui envahiront vos courriels. C'est ce que suggère un article publié dans la revue du MIT et qui montre pour la première fois que l'identifiant lui-même peut fournir des informations sur son propriétaire. Daniele Perito, jeune doctorant italien dans l'équipe Planète, a contribué à cette recherche, sous la direction de Claude Castelluccia, et a mis au point un outil permettant de tester les identifiants.

Vous avez montré que les identifiants pouvaient être utilisés pour pister les internautes. Pouvez-vous expliquer comment ?

Daniele Perito :  Lors de notre activité d'internautes, nous utilisons des services comme des réseaux sociaux, des blogs ou des sites d'achats en ligne. Pour accéder à presque tous ces sites, il est demandé de s'enregistrer comme membre en choisissant un identifiant, un nom qui est unique sur le site visité et permet de communiquer avec d'autres membres.
Nous avons montré (en étudiant plus de 10 millions d'identifiants sur le net) que les utilisateurs ont tendance à utiliser le même identifiant ou des identifiants très proches sur les différents sites qu'ils fréquentent. Cela veut dire qu'il est facile de faire le lien entre ces différents identifiants et de reconnaître qu'il s'agit d'un même individu. Ainsi, si vous faites un achat sur Ebay, cet achat étant public, il est associé à votre identifiant et le lien peut être fait avec votre adresse électronique. Cette information peut être utilisée par les professionnels du marketing pour vous envoyer par la suite des messages ciblés à partir de vos goûts. Un point important que nous avons mis en évidence est que ce « profilage » par les identifiants est d'autant plus facile que l'identifiant de l'internaute est rare sur la toile car dans ce cas il correspond à un nombre beaucoup plus restreint de personnes.

Vous avez justement réalisé un outil qui permet à tout un chacun de connaître la rareté de son identifiant. Est-ce quelque chose dont il faudrait se soucier systématiquement ?

Daniele Perito : Les utilisateurs ne devraient pas à avoir à changer leurs habitudes. Les résultats que nous avons obtenus pointent du doigt les failles concernant la vie privée au niveau de l'utilisation des identifiants sur les sites web. Ce sont les fournisseurs de services qui doivent modifier leurs applications pour éviter que les spammers puissent utiliser ces identifiants pour faire le profil de leurs visiteurs. Ceci dit, si vous ne voulez pas pouvoir être identifié, par exemple pour protéger des données médicales personnelles, il est préférable de choisir un identifiant radicalement différent de vos autres identifiants.

Qu'est-ce qui vous passionne dans cette thématique de la protection de la vie privée ?

Daniele Perito : Au cours des prochaines années, la tension va s'accroître entre les possibilités offertes par les nouvelles technologies et leurs répercussions possibles sur la vie privée. Il faudra bien trouver une solution intermédiaire qui satisfasse tout le monde. C'est une perspective de recherche très stimulante que je suis content de pouvoir réaliser dans l'équipe Planète. J'apprécie en effet beaucoup le travail à l'institut qui offre une grande liberté dans le choix et la réalisation du travail de recherche.

Vos identifiants vous trahissent-ils ?

L'équipe de recherche Planète a développé un outil qui permet de savoir si les identifiants que nous employons sur le web peuvent être utilisés pour nous tracer et éventuellement découvrir nos vraies identités.

Cet outil estime la fréquence d'apparition d'un identifiant sur le web en calculant son entropie ; un nom étant d'autant plus rare que son entropie est forte. Comme ce calcul est compliqué, les chercheurs décomposent le nom en plusieurs parties, calculent la probabilité de chaque partie puis combinent les résultats obtenus pour obtenir la probabilité d'occurrence de l'ensemble.

Mots-clés : Vie privée Identifiants Anonymat Données personnelles

Haut de page