google tensorflow privacy protection données ia

Google : un nouvel outil pour protéger les données d’intelligence artificielle

Bastien L. 7 mars 2019 2 minutes de lecture Intelligence artificielle

Google dévoile un nouveau module pour son framework d'intelligence artificielle TensorFlow. Il s'agit de TensorFlow Privacy, qui va permettre de mieux protéger les données des utilisateurs sur lesquels les modèles d'intelligence artificielle sont entraînés.

À n'en point douter, TensorFlow est l'un des outils les plus populaires pour créer des applications de Machine Learning. Il est utilisé par les développeurs du monde entier pour créer des algorithmes de reconnaissance d'image, de texte ou d'audio.

Cependant, Google a promis de respecter certains principes concernant le développement responsable de l'intelligence artificielle. Dans cette optique, l'entreprise dévoile aujourd'hui un nouveau module » Privacy » pour TensorFlow.

Ce nouveau module permettra aux développeurs d'IA de mieux protéger les données de leurs utilisateurs grâce à une technique statistique nommée » confidentialité différentielle « . Pour faire simple, la confidentialité différentielle est une approche mécanique empêchant les modèles IA entraînés sur des données d'utilisateurs d'encoder des informations permettant d'identifier une personne.

Cette technique est couramment employée pour protéger les informations personnelles nécessaires à la création de modèles IA. Ainsi, Apple la propose pour ses propres services IA depuis iOS 10, et Google l'utilise pour plusieurs de ses fonctionnalités IA comme le Smart Reply de Gmail.

Google TensorFlow Privacy protège les données utilisées pour entraîner l'IA

En effet, si Smart Reply permet de répondre automatiquement aux emails, c'est parce que l'IA a été entraînée sur les données collectées auprès d'un milliard d'utilisateurs de Gmail. Ces données comportent évidemment des informations très personnelles puisqu'elles sont extraites des emails envoyés et reçus à l'aide du service. Il est donc indispensable que ces données soient totalement anonymes.

Comme l'explique Ulfar Erlingsson, chercheur chez Google qui travaille dans le domaine de la confidentialité des données depuis plus de 20 ans, la confidentialité différentielle permet d'éliminer le risque que les données soient identifiables avec une » certitude mathématique « .

Grâce à cette technique, les éléments identifiables sont automatiquement supprimés des ensembles de données sans pour autant changer leur sens. Ainsi, avec quelques lignes de code supplémentaires, les développeurs seront en mesure d'améliorer la confidentialité de leurs modèles IA.

Certes, la confidentialité différentielle présente quelques inconvénients. Le fait de masquer les éléments identifiables peut parfois supprimer les données pertinentes, et empêche aussi le système d'apprendre à partir d'un événement qui ne s'est produit qu'une seule fois dans l'ensemble de données.

Cependant, Google espère que le lancement de TensorFlow Privacy en open-source permettra à davantage de développeurs IA autour du monde de commencer à utiliser cette technique, et ainsi de trouver des solutions à ces problèmes.

https://www.youtube.com/watch?v=k5c-vg4rjBw

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

Partager l'article :

Facebook
Twitter
LinkedIn

Google : un nouvel outil pour protéger les données d’intelligence artificielle

Google TensorFlow Privacy protège les données utilisées pour entraîner l'IA

Sur le même sujet

Newsletter

Laisser un commentaire

Google : un nouvel outil pour protéger les données d’intelligence artificielle

Google TensorFlow Privacy protège les données utilisées pour entraîner l'IA

Sur le même sujet

JO Paris 2024 : l’IA prédit les médailles d’or et les records battus

L’armée anglaise teste cette IA qui indique aux soldats quand tirer

L’IA est en train de s’auto-détruire, et l’industrie commence à paniquer

Newsletter

Laisser un commentaire