Accueil > Analytics > Fuite de données : les informations personnelles de 200 millions d’électeurs américains étaient dans la nature
fuite de données us

Fuite de données : les informations personnelles de 200 millions d’électeurs américains étaient dans la nature

Le 12 juin dernier, la société UpGuard signalait la plus importante fuite de données électorale de l’Histoire. 200 millions d’électeurs américains sont concernés. 

Oops ! I did it again”, le titre de la chanteuse américaine Britney Spears résonne sûrement dans la tête de beaucoup d’entre vous à la lecture de ce titre.

Mais qui est responsable de cette fuite massive de données ? Wikileaks ? Un lanceur d’alertes ? Un groupe obscur de cyber attaquant ? Non, la fuite des données personnelles de quelque 198 millions de citoyens américains (environ 61 % de la population américaine) est le fait d’une firme marketing engagée par le comité national du parti républicain : Deep Root Analytics.

Une erreur humaine provoque cette fuite de données

Comment une telle erreur a-t-elle pu être commise ? Un des membres de ce prestataire a tout simplement chargé les documents internes sur un Cloud public hébergé par Amazon. Comme le dit le personnage incarné par Jacques Villeret dans “Le dîner de cons” : “Ah la boulette !”.

Cette expression sied parfaitement à cette situation ubuesque, surtout quand on apprend le type de données partagées : prénoms, noms, adresse, numéro de téléphone mobile et même analyse prédictive des comportements électoraux des citoyens. Plus précisément, les fichiers contenaient leurs avis sur l’avortement, le port d’armes, le terrorisme, leurs origines ethniques ou encore leurs opinions religieuses.

Il est important de rappeler comment cette “boulette” a été découverte. C’est la société d’analyse de cyber sécurité UpGuard qui a découvert la plus grosse fuite de données de votants de l’histoire : 1,1 Téraoctet d’informations critiques.

Le 12 juin dernier, un analyste de la société, Chris Vickery, a trouvé ces dernières sur un serveur AWS S3 parmi près de 24 TB de fichiers stockés sans protection aucune : ni mot de passe ni chiffrement particulier et accessible depuis une simple commande informatique.

Un data lake compromettant

fuite de données compromettante

La grande majorité des données ne sont pas la propriété de Deep Root Analytics. Il s’agit d’un Data lake, un assemblage d’informations en provenance de multiples sources : un sous forum de Reddit nommé “r/fatpeoplehate, d’American Crossroads, un super comité d’actions politiques cofondé par Karl Rove, un ex-conseiller de la Maison-Blanche auprès de Georges W. Bush.

Évidemment, cette révélation a une nouvelle fois secoué l’actualité politique aux États-Unis, car cette fuite de données révèle une partie de la recette qui a permis à Donald Trump de prendre la tête de la 55e présidence du pays : publicités ciblées, analyse des attitudes électorales, etc.

Si nos lecteurs tout comme les spécialistes du domaine connaissent parfaitement le caractère des données utilisées, ce n’est pas forcément le cas du grand public. Sur Twitter, la relation entre cette information et la suspicion d’intervention des hackers russes, voire du Kremlin dans l’élection de Trump n’a pas tardé à pulluler.

Il n’y pourtant pas de preuves de l’utilisation de ces données par les personnes ci-mentionnées. Comme il s’agit de la fuite de données d’électeurs la plus importante, le problème majeur réside dans le fait que près de 200 millions ont été exposés à de possibles hackers. La société Deep Root est parfaitement consciente et assume de fait l’erreur de paramétrage commise par un de ses employés. Elle a réactivé la sécurité sur son Cloud dès le signalement réalisé le 14 juin 2017 par UpGuard. Malheureusement, le mal est fait.

Comme le dit Shaun Cooley, CTO IoT de Cisco sur objetconnecte.com : “nous avons l’habitude de sécuriser des ordinateurs, de faire face aux comportements parfois hasardeux de certains utilisateurs. Sécuriser des objets est plus facile parce que nous pouvons repérer des anomalies par le biais du machine learning.
Changeons d’abord nos habitudes avant de blâmer les machines.

A lire également

tour de france big data une

Tour de France : il rentre dans l’ère du Machine Learning et du Big Data

Depuis deux ans, le Tour de France est rentré dans l’ère du Big Data grâce …

Send this to friend