Même anonymes, les données de votre historique permettent de vous identifier

17 février 2017 à 16h36
0
De plus en plus d'entreprises mettent en avant le fait que les informations qu'elles recueillent sont anonymisées : une obligation vis-à-vis des lois sur la vie privée et un gage pour les internautes de la garantie que leur identité ne sera pas dévoilée. C'est bien beau sur le papier, mais un chercheur de l'université américaine de Princeton ne semble pas du tout convaincu.

Spécialisé depuis des années sur les questions d'anonymisation et de recoupement des données Internet, Arvind Narayanan a prouvé, dans une nouvelle recherche, que le simple historique de navigation permettait de retrouver l'identité de l'utilisateur.


Des données collectées « anonymement »

Sur Internet, les entreprises ont plusieurs manières de collecter des données. Bien évidemment, Google, Facebook et consorts connaissent votre identité : les clauses signées bien souvent sans être lues lorsque vous créez un compte auprès de ces entreprises expliquent en détail la nature des données collectées et l'utilisation, très vaste, que ces entreprises peuvent en faire.

L'autre moyen, légal, c'est la collecte de données de manière anonyme. Elle se fait par le biais de toute une série d'outils comme les cookies, le tracking de liens et autres. Ces données sont anonymes : la loi interdit aux entreprises d'associer les données collectées de cette façon (par exemple simplement en se connectant sur un site Internet qui utilise des cookies) à l'identité d'une personne. Théoriquement, donc, les internautes sont inconnus de ces entreprises et ne sont qu'un code dans un flux de données.

0258000008465364-photo-spy-espion-data-big-bro-ban.jpg


L'historique web suffit à identifier une personne

Arvind Narayanan a voulu voir si ces données sont réellement anonymes. Dans une recherche publiée le 25 janvier 2017, il a développé un algorithme capable de recouper les habitudes de navigation d'internautes qui lui ont soumis anonymement leur historique de navigation. Selon lui, « les historiques de navigation sous pseudonyme (donc anonymisés, ndlr) échouent » dans le fait d'être réellement anonymes.

« Chaque historique de navigation de chaque personne est unique et contient des témoignages de son identité », estime le chercheur de Princeton. Il déclare même qu'avec un historique composé simplement de 30 liens issus de Twitter, il a été en mesure de retrouver le profil Twitter correspondant avec 50 % de réussite.

Lorsque la recherche s'est intéressée aux 374 historiques de navigation envoyés par des volontaires et que le chercheur et ses équipes ont utilisé un algorithme maison (qu'ils estiment pouvoir être affiné), ils ont pu identifier 70 % des personnes ayant participé. De fait, une grande entreprise pouvant développer un algorithme plus puissant et ayant accès à beaucoup plus de données serait facilement à même de créer un système permettant de remonter à l'identité de l'utilisateur, sur la base de simples données anonymes collectées légalement.

Modifié le 01/06/2018 à 15h36
0 réponses
0 utilisateurs
Suivre la discussion

Les actualités récentes les plus commentées

Voiture neuves : l’entourloupe de la fausse baisse des émissions de CO2
Depuis la démocratisation des smartphones les gens ont plus d'accident dus à leur téléphone #SansDec
Au cas où vous auriez 11 000€ en trop, le Mac Pro et son écran XDR seront disponibles le 10 décembre
La Banque de France va tester une monnaie numérique nationale en 2020
Certains MacBook Pro récents s'éteignent
Sony : la PS5 sera remplacée plus rapidement que la PS4, une version Pro prévue pour 2023
Cyberharcèlement, usurpation d'identité : une Française vivant aux USA condamnée à de la prison
L'iPhone 11 vous localise régulièrement, Apple s'en explique
L'arrivée du « premier contraceptif masculin » en 2020 ?
BMW profite de la sortie de son SUV pour montrer à Tesla ce qu'est un véhicule blindé

Notre charte communautaire

1. Participez aux discussions

Nous encourageons chacun à exprimer ses idées sur les sujets qui l'intéressent, et à faire profiter l'ensemble de la communauté de son expertise sur un sujet particulier.

2. Partagez vos connaissances

Que vous soyez expert ou amateur passionné, partagez vos connaissances aux autres membres de la communauté pour enrichir le niveau d'expertise des articles.

3. Échangez vos idées

Donnez votre opinion en étayant votre propos et soyez ouverts aux idées des autres membres de la communauté, même si elles sont radicalement différentes des vôtres.

4. Faites preuve de tolérance

Qu'il s'agisse de rédacteurs professionnels ou amateurs, de lecteurs experts ou passionnés, vous devez faire preuve de tolérance et vous placer dans une démarche d'entraide.

5. Restez courtois

Particulièrement lorsque vous exprimez votre désaccord, critiquez les idées, pas les personnes. Évitez à tout prix les insultes, les attaques et autres jugements sur la forme des messages.

6. Publiez des messages utiles

Chaque participation a vocation à enrichir la discussion, aussi les partages d'humeurs personnelles ne doivent pas venir gêner le fil des échanges.

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

8. Respectez le cadre légal

Ne publiez pas de contenus irrespectueux, racistes, homophobes, obscènes ou faisant l'apologie de courants radicaux, qu'ils soient politiques ou religieux. N'utilisez pas plusieurs comptes utilisateurs.

9. Ne faites pas de promotion

Ne profitez pas d'une discussion pour faire la publicité d'un produit, d'un service ou même de votre site web personnel.

10. Ne plagiez pas

Exprimez uniquement vos opinions ou partagez des idées en citant vos sources.

scroll top