Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

Données de santé

Другие языки:

Données de santé

Подписчиков: 0, рейтинг: 0

Données de santé

Classification et ressources externes
Codes-Q	QT53

Mise en garde médicale

Les données de santé (DDS) sont toutes les données médicales et/ou relatives aux déterminants généraux de santé, et à la santé d'une personne, d'un groupe de personnes (couple, famille, quartier, ville, région, ethnie, pays, etc.) ou de populations (santé publique, santé au travail, santé reproductive). Cette formulation est généralement utilisée pour la santé humaine plutôt que vétérinaire. Ces données sont utilisées pour le suivi et l'évaluation des systèmes et politiques de santé, pour établir des budgets prévisionnels, faire de la prospective en santé et croiser ces indicateurs avec d'autres (environnement, alimentation, précarité, éducation, usages de psychotropes, alcoolisme, tabagisme, etc.).

En France, un « projet de loi de santé » (porté par Marisol Touraine, présenté le 15 octobre 2014 en Conseil des ministres et qui sera débattu au Parlement en 2015) propose la création d'un « Système national des données de santé » (SNDS) qui devrait unifier les bases de données existantes, et serait géré par la Caisse nationale de l'assurance maladie des travailleurs salariés (CNAMTS) qui devra mettre à disposition du public (en Open Data) les données suivantes (anonymisées, avec une ouverture graduelle des données, en fonction du risque de réidentification des patients) :

Données issues des systèmes d'information hospitaliers;
Données du système d’information de l'assurance maladie ;
Données sur les causes de décès ;
Certaines données de remboursement transmises par les organismes d’assurance maladie complémentaire.

Typologie générale des données de santé

Ces données sont de plusieurs grands types :

les données statistiques relatives aux indicateurs généraux de santé publique, par exemple sur l'état de santé d’une population, la prévalence et l’incidence des maladies, les maladies émergentes ;
les données relatives à des facteurs « extrinsèques » environnementaux non-personnels de santé (ex : variations selon la qualité de l'environnement (qualité de l’eau, de l’air, du sol…), le contexte écopaysager et climatique général ou régional,
Les données de contextualisation de la santé relativement à l'individu (ex. : l’âge, le sexe) et à son insertion psychosociale (ex. : le statut social et la catégorie socioprofessionnelle, la richesse individuelle ou le revenu familial, le niveau d'études, l’indice de masse corporelle, l’alimentation, la consommation d’alcool, consommation d'alcool chez les jeunes en France ou de tabac, les pratiques sexuelles, le fait d'être dans une classe d’intégration scolaire (CLIS) pour un élève, etc.
certains caractères génétiques (les législations varient selon les pays, et peuvent évoluer rapidement. En France, pour les travaux préparatoires de la loi du 6 août 2004« les données génétiques sont considérées comme des données de santé » ;
les données et indicateurs relatifs aux politiques et stratégies de santé publique (ex. : objectifs de dépenses d'assurance maladie, programmes de santé, formation médicale et numérus clausus, etc.), l’offre de soins : établissements et professionnels de santé, classés selon la nature de l’offre (spécialités, équipements, capacités…), l’activité, la distance, la disponibilité, la réputation et d’autres indicateurs de la qualité, les tarifs ; les dépense de santé : consommation de soins et biens médicaux, indemnités journalières, prévention environnementale et alimentaire, formation des professions de santé, recherche dans le domaine de la santé, dépenses de santé liées au handicap et à la dépendance… ou encore les informations sur le financement (plus ou moins solidaire) de la dépense de santé (assurance maladie obligatoire, assurances complémentaires, ménages…) ;
les « données de santé à caractère personnel » (Données « élémentaires » ou « personnelles », « identifiées » et « identifiables » qui sont — en l’absence de définition légale — généralement définies comme toute « donnée » « susceptible de révéler une maladie de la personne » (personne physique ou morale). Ces donnés peuvent inclure les données qu'une personne ajoute elle-même aux applis, aux appareils, ou aux sites qui concernent la santé. Ces méthodes officieuses de la collecte de données a augmenté avec la popularisation des technologies personnelles
En principe, les données recueillies par du personnel de santé ou lors d’une action administrative (industrielle, médicale, judiciaire…) sont confidentielles et ne peuvent être utilisées que pour ce pourquoi elles ont été collectées (la santé du patient, l’action judiciaire… et conformément au droit). Cependant la recherche médicale, pharmaceutique, démographique, etc. a régulièrement besoin d’avoir accès à de telles données. Des dérogations sont donc prévues par la loi, en France principalement encadrées par trois lois (Loi Informatique et Libertés de 1978, Loi sur le secret statistique de 1951, Loi sur les Archives). Sauf cas particuliers encore plus encadrés, elle se fait avec des données anonymisées.

Un projet de règlement européen sur la protection des données élargit cette définition en considérant qu’il s’agit de « toute information relative à la santé physique ou mentale d'une personne, ou à la prestation de services de santé à cette personne ».

Ces données peuvent aussi être classées selon leurs sources (voir exemples plus bas), leur lieu de stockage et conservation, leurs durées obligatoire de conservation, leurs temporalité ou rythme de collecte, leur statut de protection, ce qu'elles décrive (ex. : statistiques d'état, de pression ou de réponse).

Chaque donnée peut être caractérisée par son degré de précision :

données « brutes » (ou dite « granulaire ») : c'est la donnée la plus fine disponible (le grain variant selon le type donnée et le système de collecte) ;
données « extraites » (ex. : échantillon de données brutes, donnée floutée pour une à plusieurs de ses dimensions) ;
données « agrégées » (ex. : statistiques de type indicateurs, tendances, comparaisons, totaux, etc.

La notion de donnée de santé

Elle n'est pas encore tout à fait fixée, mais il y a un consensus en Europe pour la définir largement : ainsi, un document de travail élaboré en 2007 par le G29 (qui regroupe toutes les structures et autorités homologues de la CNIL dans les États membres de l'Union européenne) a proposé de retenir une approche large de la donnée de santé : « une donnée en relation étroite avec l’état de santé de la personne, telle qu’une information sur la consommation d’alcool, de drogues ou de médicaments doit être considérée comme une donnée de santé au sens de la directive ».

La notion de « donnée personnelle » dans le domaine de la santé

La plupart des législations protègent le caractère personnel de certaines données.

Par exemple en France est une donnée personnelle toute « donnée à caractère personnel, toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d'identification ou à un ou plusieurs éléments qui lui sont propres » ; il peut par exemple s’agir des « origines raciales ou ethniques, opinions politiques, philosophiques ou religieuses ou appartenance syndicale des personnes, ou qui sont relatives à leur santé ou à leur vie sexuelle » ou de données portant « sur des faits, des actions, des opinions, etc. qui s’ils étaient divulgués, porteraient préjudice aux intérêts ou à la réputation de la personne concernée ».

Une donnée médicale n’est plus considérée comme « personnelle » quand elle est anonymisée de manière que la ré-identification du patient ne soit plus possible. Cependant cette notion de ré-identification évolue et doit être régulièrement requestionnée alors que progressent les capacités de logiciels de data mining qui permettent éventuellement par le croisement de jeux de données accessibles aux fournisseurs d’accès ou à certains sites de tenter de reconstituer un profil personnel à partir de données éparses mal protégées.

Une directive européenne sur la protection des données (de 1995) et un projet de règlement européen précisent que cette possibilité d’identification doit être appréciée en considérant « les moyens raisonnablement susceptibles d’être utilisés par le responsable du traitement ou par toute autre personne ».

La CNIL et d'autres instances spécialisées dans la protection des données rappellent que « l'absence dans un fichier d’identification directe, par exemple par le nom ou l’adresse de la personne physique ou morale, ne suffit pas à considérer qu’un tel fichier comporte des données anonymes ».

L’entreprise américaine IQVIA qui a noué un partenariat avec 14 000 pharmacies françaises, stocke et traite des données de santé de clients de pharmacies en France. La CNIL qui avait donné un accord, lance une enquête et des contrôles.

La notion de donnée « sensible » dans le domaine de la santé

Sont dites « sensibles » les données « particulièrement susceptibles de permettre une réidentification », soit quatre catégories de données :

dates de soins ;
code postal du domicile ;
mois et année de naissance ;
date de décès (le cas échéant).

En France, et dans le cadre de la E-santé, qui inclut des dossiers médicaux électroniques et des standards d'interopérabilité qui se mettent peu à peu en place, dont en Europe avec par exemple le Projet européen « Smart Open Services for european patients » (ou epSOS), lancé en 2008 pour développer un Patient Summary et une forme d' ePrescription selon des standards transfrontaliers facilitant une éventuelle mobilité des patients d'un pays à l'autre), la CNIL juge qu'elles appellent une protection renforcée, notamment à l'hôpital, et qu'il y a « nécessité d’un identifiant générateur de confiance (...), identifiant de santé spécifique bénéficiant du processus de certification du NIR (...) à partir des traits d’identité contenus dans la carte vitale ». Dans ses réponses à des demandes d'utilisation de données sensibles, la CNIL peut interdire le croisement de ces données, ou n’autoriser qu'un accès partiel (en conservant par exemple le nom de la localité, mais non les autres données identifiantes, qui sont alors « floutées » (le floutage consiste à rendre la donnée irréversiblement moins précise par exemple en remplaçant le jour par le mois, le mois par l’année, le code postal par le n^o de département).

Protection légale des données de santé

En France et en Europe, hors de la sphère médicale où ces données sont couvertes par le secret professionnel (secret médical notamment) et sauf exceptions clairement définies et fortement encadrées, les « données de santé personnelles » font partie de celles que la loi interdit de collecter ou de traiter.

L'une des conditions préalables à l'exception pour une utilisation est l'accord du patient dont les modalités sont plus ou moins précisées selon les pays et les contextes. En France, selon Frédérique Lesaulnier (juriste chargé du secteur de la santé à la CNIL), cet accord doit être « valablement recueilli » (« éclairé et explicite », « Clair et univoque mais pas nécessairement formalisé par écrit ») ; il suggère (en 2011) une harmonisation au moins européenne des modalités de recueil du consentement.

La diffusion involontaire ou malveillante de telles données est jugée contraire à la protection de la vie privée et potentiellement susceptible de menacer les intérêts matériels et les libertés. Elle est punie par la loi (en France : articles 226-13 du Code pénal ; violation du secret professionnel : 1 an d’emprisonnement et 15 000 € d’amende) ; articles 226-16 à 226-24 du Code pénal (fichiers et informatique : 5 ans d’emprisonnement et 300 000 € d’amende).

Ces données sont donc stockées sur des serveurs sécurisés (quand l’hébergeur de ce type de données n'est pas le producteur des données, il doit en France avoir obtenu un agrément préalable pour l’hébergement des données de santé à caractère personnel) et ne devraient transiter dans l’internet que via des voies sécurisées.

En outre, en réponse à la capacité d'Internet à durablement mémoriser certaines informations personnelles, il existe aussi le développement d'un droit à l'oubli.

Conditions d’accès aux données personnelles de santé

Dans quelques cas (en France cadrés par la Loi informatique et libertés) la confidentialité des données peut être partagée avec certains tiers :

pour des raisons d'intérêt public ou dans l'intérêt du patient (dans certains réseaux de soins, via le web médecin, le dossier médical partagé ou le dossier pharmaceutique (qui permet de lutter contre les interactions médicamenteuses dangereuses ou indésirables), dans le cadre de la télémédecine (Avis sur décret du 19 octobre 2010, dans le cadre d'une gestion globale du risque hospitalier, ou de besoins de biométrie à l'Hôpital à fins d'identitovigilance).
pour la recherche, avec des chercheurs ou des organismes de mission de service public, qui peuvent avoir accès à des données personnelles de santé, à certaines conditions (en France, cet accès doit être justifié, limité à un petit nombre de personnes, entouré de garanties appropriées et préalablement autorisé par la CNIL (ou permis par la loi, ou autorisé par les intéressés).

En France, quand un chercheur veut accéder à des données personnelles nécessaires (pour des recherches médicales) il doit d’abord obtenir un avis du Comité consultatif sur le traitement de l’information en matière de recherche dans le domaine de la santé, puis obtenir une autorisation de la CNIL. L’institut des Données de Santé (IDS) est chargé d’accepter ou refuser les demandes d’accès aux données du SNIIRAM, dont le système d’information est réputé particulièrement peu accessible et « à des conditions touffues et contestées ».

L’accès du patient à ses données de santé a été réaffirmé par la loi du 4 mars 2002, et repose sur l'article 40 de la loi Informatique et Libertés.

Conditions de rectification ou de suppression des données personnelles de santé

L'article 40 de la loi Informatique et Libertés permet également - outre le droit de consultation - une possibilité de demande de rectification et de suppression de ses données personnelles. Les données de santé étant des données personnelles, cette possibilité s'applique à elles.

Moyens d’anonymisation des données personnelles de santé

Outre la suppression de variables telles que nom de famille, prénoms, adresse postale, code postal, numéro de téléphone, adresse mail, etc. et leur remplacement par des codes anonymes (lettres, chiffres, signes, couleurs…) des nomenclatures regroupées ou un niveau d’agrégation plus élevé de la donnée (alors livrée à l’échelle administrative supérieure ; du département, de la région ou du pays en France par exemple), ainsi que des techniques de brouillage de données sont utilisées, afin d’empêcher un tiers de réussir à ré-identifier un patient (ou personnel soignant).

Ceci peut avoir des conséquences préjudiciables à certains travaux de recherche (en épidémiologie notamment, par exemple si l'on veut pouvoir détecter des maladies éventuellement liées à la proximité d'une installation polluante, ou si pour les besoins de l'étude les chercheurs doivent pouvoir réinterroger un patient). Dans ces types de cas et à certaines conditions, des autorisations spéciales peuvent être sollicitées (en France à la CNIL ou du Comité du secret statistique).

Une attention particulière doit être accordée à l’anonymisation de fichiers contenant de nombreuses informations relatives à une même personne, par exemple quand des fichiers d’origines diverses sont « appariés », ou quand cette personne a été suivi dans un panels sur un long pas de temps (car il est alors plus facile de la ré-identifier ; ces appariements ou le suivi de panels impliquent en effet que ces personnes aient été clairement identifiées. En 2014, un avis du G29 rappelle aussi à propos de l'anonymisation (au sens de la directive 95/46/CE) que la directive ne s’applique pas aux données anonymes, mais que les données pseudonymisées ne sont pas des données anonymes. L’anonymisation peut dans ces cas être faite par des « tiers de confiance » ou grâce à un cryptage des identifiants via des « algorithmes de hachage d'identifiants » (préalablement approuvés par la CNIL) puis la donnée peut être livrée aux demandeurs.

Les sources de données de santé

Les sources de données de santé sont multiples, ce sont notamment :

les professionnels de santé (notamment via l'analyse des prescriptions médicales, des ventes de médicaments et en France le travail du Réseau Sentinelles) ;
les établissements de santé (via les informations administratives qu'ils fournissent, leurs données d’activité, les études de qualité…) ;
les autorités sanitaires (via leur production d'indicateurs financiers agrégés, le suivi et l'évaluation des politiques publiques, les statistiques de remboursements inter-régimes, etc.) ;
les industriels du secteur médical et pharmaceutique (laboratoires pharmaceutiques, assureurs, fabricant ou importateurs de matériel médical…) ;
la recherche médicale et les chercheurs : Biologie médicale, suivis de cohortes et enquêtes épidémiologiques ou écoépidémiologiques, recherches médicales ou inter-disciplinaires (ex : sociologie de la santé) ;
les patients et associations de patients : retours d'expérience, alerte et de plus en plus apport d'informations produites par des capteurs électroniques et objets connectés analysant l’activité physique, le sommeil, le rythme cardiaque, etc.

Des moteurs de recherche comme Google disposent d’algorithmes qui peuvent donner des indices en temps réel de sujets de santé intéressant la population (avec « effets de buzz » possibles), mais qui semblent par exemple efficaces pour le suivi de la grippe par la fréquence de requêtes pour certains mots clés.

Les plates-formes de prise de rendez-vous en ligne sont les nouveaux acteurs du secteur de la santé gérant les informations sur le parcours de santé d'une grande partie de la population (par exemple en France, Doctolib revendique 39 millions de rendez-vous pour une vaccination contre la Covid-19 au 1er juin 2021, représentant une part de marché de près de 90%). Les plates-formes peuvent également être utilisés comme indicateurs sur les sujets de santé au même titre que les moteurs de recherche permettant d'établir des prévisions et comparer la progression de certaines recherches.

Protection et souveraineté

Le conflit entre les règles américaines (CLOUD Act) et les règles européennes (RGPD) crée un risque de souveraineté sur ces données sensibles. En 2020, les données de santé françaises sont hébergées par Microsoft et le gouvernement français envisage de les rapatrier vers un opérateur de services français ou européen.

En janvier 2022, le plein déploiement du projet de centralisation par une solution Microsoft de plusieurs grandes bases de données médicales(Health Data Hub), à des fins de recherche scientifique est suspendu de fait car la demande d’autorisation auprès de la Commission nationale de l’informatique et des libertés (CNIL) a été retirée.

Fuite de données de santé

Particulièrement sensibles, les données de santé sont convoitées par les pirates informatiques, et régulièrement vendues sur le darknet.


Organisation	Année	Nombre d'individus exposés	Pays	Méthode
21st Century Oncology	2016	2 200 000		hacked
Advocate Medical Group	2017	4 000 000		lost / stolen media
Ankle & Foot Center of Tampa Bay, Inc.	2021	156 000	Etats-Unis	hacked
Anthem Inc.	2015	80 000 000		hacked
Apple Health Medicaid	2021	91 000	Etats-Unis	poor security
Assurance Maladie	2022	510 000	France	piratage
AvMed, Inc.	2009	1 220 000	Etats-Unis	lost / stolen computer
CareFirst BlueCross Blue Shield - Maryland	2015	1 100 000	Etats-Unis	hacked
City and Hackney Teaching Primary Care Trust	2007	160 000	Royaume-Uni	lost / stolen media
Colorado government	2010	105 470	Etats-Unis	lost / stolen computer
Community Health Systems	2014	4,500,000	Etats-Unis	hacked
Centers for Medicare & Medicaid Services	2018	75,000	Etats-Unis	hacked
Dedalus	2021	500,000	France	poor security
Emergency Healthcare Physicians, Ltd.	2010	180,111	Etats-Unis	lost / stolen media
Emoa Mutuelle du Var	2022	80,000	France	mauvaise sécurisation
Emory Healthcare	2012	315,000	Etats-Unis	poor security
Excellus BlueCross BlueShield	2015	10,000,000	Etats-Unis	hacked
Grozio Chirurgija	2017	25,000	Etats-Unis	hacked
Health Net	2009	500,000	Etats-Unis	lost / stolen media
Health Net — IBM	2011	1,900,000	Etats-Unis	lost / stolen media
Health Sciences Authority (Singapour)	2019	808,000	Singapour	poor security
Health Service Executive	2021	inconnu	Irlande	inconnu
International Committee of the Red Cross	2022	515,000	international	inconnu
Inuvik hospital	2016	6,700	Canada	inside job
Japan Pension Service	2015	1,250,000	Japon	hacked
LifeLabs	2019	15,000,000	Etats-Unis	hacked
Lincoln Medical & Mental Health Center	2010	130,495	Etats-Unis	lost / stolen media
US Medicaid	2012	780,000	Etats-Unis	hacked
Medical Informatics Engineering	2015	3,900,000	Etats-Unis	hacked
Memorial Healthcare System	2011	102,153	Etats-Unis	lost / stolen media
Ministère de la Santé de Singapour	2019	14,200	Singapour	poor security/inside job
NEC Networks, LLC	2021	1,600,000	Etats-Unis	hacked
Nemours Foundation	2011	1,055,489	Etats-Unis	lost / stolen media
New York City Health & Hospitals Corp.	2010	1,700,000	Etats-Unis	lost / stolen media
NHS	2011	8,300,000	Etats-Unis	lost / stolen media
Premera	2015	11,000,000	Etats-Unis	hacked
Puerto Rico Department of Health	2010	515,000	Porto Rico	hacked
Quest Diagnostics	2019	11,900,000	Etats-Unis	poor security
Seacoast Radiology, PA	2010	231,400	Etats-Unis	hacked
South Carolina Government	2012	6,400,000	Etats-Unis	inside job
South Shore Hospital, Massachusetts	2010	800,000	Etats-Unis	lost / stolen media
Southern California Medical-Legal Consultants	2011	300,000	Etats-Unis	hacked
Spartanburg Regional Healthcare System	2011	400,000	Etats-Unis	lost / stolen computer
Sutter Medical Center	2011	4,243,434	Etats-Unis	lost / stolen computer
Triple-S Salud, Inc.	2010	398,000	Etats-Unis	lost / stolen media
UCLA Medical Center, Santa Monica	2015	4,500,000	Etats-Unis	hacked
Vastaamo	2020	130,000	Etats-Unis	hacked
Virginia Department of Health	2009	8,257,378	Etats-Unis	hacked
Virginia Prescription Monitoring Program	2009	531,400	Etats-Unis	hacked
National Health Information Center (NCZI) de Slovaquie	2020	391,250	Slovaquie	poor security

Références

Voir aussi

Liens externes

Le secret statistique et la protection des données (sur le site de l'INSEE)
Site officiel du SNDS
Informations relatives à la réutilisation des données publiques (« open data ») (par la CADA)
Présentation du SNIIRAM (prezi)

Bibliographie

Rapports

Rapport sur la gouvernance et l'utilisation des données de santé dit « Rapport Bras » (PDF, 128 pages), écrit par Pierre-Louis Bras (inspecteur général des affaires sociales), avec le concours d’André Lothremis à la ministre des Affaires sociales et de la Santé en 2013 ; daté Septembre 2013
Rapport de la Commission open data en santé Remis à la ministre Marisol Touraine, Le 9 juillet 2014.

Autres documents

Lesaulnier F. (2011) L'informatisation des données de santé et la législation Informatique et Libertées ; CNIL ; Colloque Gouvernance et sécurité des systèmes d'information de santé - Marseille, 7 juin 2011 ; PDF, 23 p
Études sur la donnée de santé par le LIR (2018) - Étude sur la plateforme des données de santé et sur l'usage de la donnée de santé

Documentaire

Elise Lucet, « Cash investigation : Nos données personnelles valent de l'or », sur france.tv, France 2, 2021(consulté le 19 mai 2021)

Portail du droit français
Portail de la sécurité de l’information
Portail de la médecine
Portail de la pharmacie
Portail des données

Données de santé

Typologie générale des données de santé

La notion de donnée de santé

La notion de « donnée personnelle » dans le domaine de la santé

La notion de donnée « sensible » dans le domaine de la santé

Protection légale des données de santé

Conditions d’accès aux données personnelles de santé

Conditions de rectification ou de suppression des données personnelles de santé

Moyens d’anonymisation des données personnelles de santé

Les sources de données de santé

Protection et souveraineté

Fuite de données de santé

Références

Voir aussi

Articles connexes

Liens externes

Bibliographie

Rapports

Autres documents

Documentaire