Le Health Data Hub est une plateforme mise en place par le gouvernement français. Elle vise à permettre aux chercheurs d’accéder aux vastes ensembles de données de santé du SNDS afin d’entraîner des modèles d’intelligence artificielle. Découvrez tout ce que vous devez savoir sur ce Hub, sur les premiers projets de recherche retenus, et sur les risques pour la confidentialité des données…
C’est officiel : le Health Data Hub vient d’être lancé par le gouvernement français par le biais d’un arrêté ministériel publié le 30 novembre 2019. Créée dans le cadre du projet de loi « Organisation et Transformation du système de santé », cette plateforme est basée sur les recommandations du rapport Villani de 2018 sur l’intelligence artificielle.
Elle a pour but de mettre au secteur de la santé d’exploiter le potentiel de l’intelligence artificielle, en mettant à disposition des chercheurs les immenses volumes de données de santé nécessaires au développement de modèles IA.
En effet, l’intelligence artificielle offre de nombreuses promesses pour le secteur de la santé. Elle peut notamment permettre de mieux prédire les crises ou l’évolution des maladies, d’établir des diagnostics plus fiables et plus précis, ou même de découvrir de nouveaux médicaments. Cependant, l’accès aux données est indispensable pour pouvoir entraîner de telles IA.
Ainsi, le Health Data Hub regroupera toutes les données issues des organismes publics de santé français tels que l’Assurance maladie et les hôpitaux. Ces données pourront être utilisées dans le cadre de projets de recherche minutieusement sélectionnés. Pour pouvoir y accéder, les entreprises devront justifier l’intérêt général de leur projet et recevoir le feu vert de la CNIL.
Quels sont les objectifs du Health Data Hub ?
Plusieurs objectifs ont été fixés pour le Health Data Hub. Tout d’abord, la plateforme a pour but de rassembler, d’organiser et de mettre à disposition des chercheurs les données du Système National des Données de Santé lancé en 2016. Ces bases de données déjà existantes seront complétées à l’aide de sources additionnelles telles que les hôpitaux.
La seconde mission de Hub est d’informer les patients, et de promouvoir et de faciliter l’exercice de leur droit. La recherche sera totalement transparente, et les patients auront le droit de s’opposer à l’utilisation de leurs données pseudonymisées en provenance du SNDS.
Il sera par ailleurs nécessaire pour les chercheurs de prouver que leurs projets sont d’intérêt public, en se basant sur les critères mis en place par l’Institut National des Données de Santé. Le nouveau comité CESREES sera chargé de vérifier l’intérêt public de chaque projet proposé.
Quels sont les premiers projets de recherche sélectionnés ?
En avril 2019, un jury nommé par le gouvernement s’est chargé de sélectionner une première vague de 10 projets de recherche pour le Health Data Hub. Ces projets ont été sélectionnés parmi plus de 180 candidatures.
Les heureux élus auront l’opportunité d’entrainer leurs modèles d’intelligence artificielle à l’aide des données stockées sur le Hub. Une fois les modèles entraînés et optimisés, ils pourront être extraits de la plateforme afin d’être utilisés.
L’un des 10 projets retenus est celui de la startup Implicity, nommé « Hydro ». Il aura pour but de croiser les données cardiaques collectées en temps réel par la startup à partir de prothèses cardiaques avec les données d’hospitalisation hébergées sur le Hub afin de créer un modèle IA capable de prédire les crises cardiaques.
De son côté, Deepsarc utilisera le Hub pour identifier les meilleurs schémas thérapeutiques pour le traitement du sarcome. ARAC cherche à mesurer et comprendre les restes à charge réels des patients, et Ordei veut quantifier la proportion de patients touchés par un effet indésirable.
Parmi les autres lauréats, on compte aussi Oscour qui souhaite mobiliser les données d’urgence pour améliorer la surveillance sanitaire ou encore Deep.Piste qui compte évaluer l’apport de l’intelligence artificielle dans le dépistage organisé du cancer du sein. La liste complète des dix lauréats retenus par le jury est disponible à cette adresse.
Parmi les 10 projets retenus par le jury, il convient de préciser que la moitié est proposée par des acteurs publics. La plateforme est encore en cours d’homologation, mais les premiers projets devraient être accueillis au cours du premier semestre 2020.
Confidentialité : faut-il se méfier du Health Data Hub ?
Lorsqu’on parle de données personnelles, la question de la confidentialité doit toujours être posée. Cependant, plusieurs mesures ont été prises pour assurer le respect de la vie privée des patients dont les données sont agrégées sur le Hub.
Tout d’abord, le cadre légal de conditions d’accès à la plateforme est basé à la fois sur la loi française « Informatique et Libertés » qui complète le RGPD et sur le Code de la Santé Public.
De plus, les projets de recherche devront être approuvés par la CNIL qui veille au grain sur la protection des données personnelles des citoyens français. Rappelons par ailleurs que les données du SNDS sont pseudonymisées, et que les chercheurs qui y accèdent ne seront pas autorisés à les copier ou à les extraire du Hub.
La principale inquiétude qui subsiste est liée au fait que les données seront stockées sur des serveurs de Microsoft et non sur ceux d’un fournisseur français comme OVH. Ce choix a été fait, car Microsoft est le premier géant du Cloud certifié hébergeur de données de santé.
Ce n’était pas le cas d’OVH lors du lancement du projet, car la firme française ne répondait pas aux critères de sécurité définis pour ces informations particulièrement sensibles. Cependant, les données seront stockées sur les Data Centers de Microsoft établis en France.
Néanmoins, il convient de rappeler que la loi américaine du Cloud Act autorise le gouvernement des États-Unis à forcer les hébergeurs américains à fournir les données dans le cadre d’une enquête pénale. Cependant, l’article 48 du RGPD interdit le transfert de données de pays européens vers des pays extérieurs. A priori, la sécurité des données de santé n’est donc pas mise en péril par le Health Data Hub…
- Partager l'article :