Même anonymes, les données de votre historique permettent de vous identifier

17 février 2017 à 16h36
0
De plus en plus d'entreprises mettent en avant le fait que les informations qu'elles recueillent sont anonymisées : une obligation vis-à-vis des lois sur la vie privée et un gage pour les internautes de la garantie que leur identité ne sera pas dévoilée. C'est bien beau sur le papier, mais un chercheur de l'université américaine de Princeton ne semble pas du tout convaincu.

Spécialisé depuis des années sur les questions d'anonymisation et de recoupement des données Internet, Arvind Narayanan a prouvé, dans une nouvelle recherche, que le simple historique de navigation permettait de retrouver l'identité de l'utilisateur.


Des données collectées « anonymement »

Sur Internet, les entreprises ont plusieurs manières de collecter des données. Bien évidemment, Google, Facebook et consorts connaissent votre identité : les clauses signées bien souvent sans être lues lorsque vous créez un compte auprès de ces entreprises expliquent en détail la nature des données collectées et l'utilisation, très vaste, que ces entreprises peuvent en faire.

L'autre moyen, légal, c'est la collecte de données de manière anonyme. Elle se fait par le biais de toute une série d'outils comme les cookies, le tracking de liens et autres. Ces données sont anonymes : la loi interdit aux entreprises d'associer les données collectées de cette façon (par exemple simplement en se connectant sur un site Internet qui utilise des cookies) à l'identité d'une personne. Théoriquement, donc, les internautes sont inconnus de ces entreprises et ne sont qu'un code dans un flux de données.

0258000008465364-photo-spy-espion-data-big-bro-ban.jpg


L'historique web suffit à identifier une personne

Arvind Narayanan a voulu voir si ces données sont réellement anonymes. Dans une recherche publiée le 25 janvier 2017, il a développé un algorithme capable de recouper les habitudes de navigation d'internautes qui lui ont soumis anonymement leur historique de navigation. Selon lui, « les historiques de navigation sous pseudonyme (donc anonymisés, ndlr) échouent » dans le fait d'être réellement anonymes.

« Chaque historique de navigation de chaque personne est unique et contient des témoignages de son identité », estime le chercheur de Princeton. Il déclare même qu'avec un historique composé simplement de 30 liens issus de Twitter, il a été en mesure de retrouver le profil Twitter correspondant avec 50 % de réussite.

Lorsque la recherche s'est intéressée aux 374 historiques de navigation envoyés par des volontaires et que le chercheur et ses équipes ont utilisé un algorithme maison (qu'ils estiment pouvoir être affiné), ils ont pu identifier 70 % des personnes ayant participé. De fait, une grande entreprise pouvant développer un algorithme plus puissant et ayant accès à beaucoup plus de données serait facilement à même de créer un système permettant de remonter à l'identité de l'utilisateur, sur la base de simples données anonymes collectées légalement.

Modifié le 01/06/2018 à 15h36
0
0
Partager l'article :

Les actualités récentes les plus commentées

L’ONU tire le signal d’alarme sur la production massive de batteries de voitures électriques
Freebox Pop: retrouvez toutes les annonces présentées ce mardi !
La 5G, une technologie pour
Emmanuel Macron débarque sur... TikTok, pour féliciter les lauréats du bac 2020
Tesla continue de faire dans la pseudo-disruption et commercialise désormais des shorts...
YouTube : préparez-vous à voir davantage de publicités
Les États-Unis songent à interdire TikTok
NVIDIA : les spécifications des RTX 3070 et 3070 Ti en fuite, la RTX 2080 SUPER battue ?
Facebook Messenger et WhatsApp bientôt réunis ?
scroll top