Les données de santé en partage.

 

Les données de santé en partage.

Un article dans le Monde du 6 octobre 2021 annonçait que le « Breakthrough Prize in Life Sciences » (BPLS) (en français : « prix des avancées capitales dans les sciences de la vie ») était partagé entre trois chercheurs, deux anglais et un français, pour leurs innovations  conduisant à une nouvelle génération de séquençage de l’ADN à haut débit sur un temps réduit.

Le BPLS a été créé en 2012 par les fondateurs de Facebook, Google et 23andMe. On peut s’étonner que des entreprises du numérique investissent dans les sciences de la vie, bien loin de leur cœur de métier, au côté d’une société de biotechnologie. 23andMe, créée en 2006 par Anna Wojcicki, alors épouse de Sergey Brin,  co-fondateur de Google, propose aux particuliers de déceler leurs prédispositions génétiques et/ou identifier des ancêtres ou des parents éloignés par une analyse de leur code génétique. Cette start-up s’est ensuite fait racheter par Alphabet[i], détenue par Google.

Le test ADN 23andMe[ii], facturé une centaine d’Euros en 2021, est rendu possible par les  travaux de chercheurs tels que ceux récompensés par le BPLS. Dix ans ont été nécessaires, dans le cadre du projet Human Genome[iii], pour déchiffrer le premier génome humain, terminé en 2003. Aujourd’hui, 48 à 72 heures suffisent. Le calcul informatique et les algorithmes s’avèrent  tout aussi importants que l’optimisation des technologies biologiques pour le décryptage d’un génome humain, et pour la caractérisation de l’individu sous forme numérique. Les GAFAM,[iv] géants du Web, ont bien compris tous les avantages qu’ils pouvaient escompter d’une telle situation, en s’investissant dans le champ de la santé, présenté comme leur « nouvel eldorado ».

Cet investissement est d’autant plus opportun que la tendance est à croire que les disparités de santé entre les individus s’expliqueraient en bonne partie par leur génome. Tendance au cœur d’un changement de paradigme dans les politiques de santé publique, qui a abouti au programme en 4P « préventif, prédictif, participatif et personnalisé »

Tout le projet de la médecine prédictive et de la médecine personnalisée repose principalement sur l’idée que chaque individu devrait connaître son profil génétique afin de pouvoir prévenir certaines défaillances physiques, voire maximiser son potentiel physique.

Les GAFAM ont, dans ce domaine, l’avantage stratégique de leurs expertises technologiques, couplées à celles en intelligence artificielle (IA), pour se positionner sur des outils pronostiques ou diagnostiques.

Le séquençage du génome humain

« Pour soigner demain de manière adaptée au capital humain de chacun, nous avons besoin de connaître aujourd’hui le génome de chaque individu » déclarait Marisol Touraine, alors ministre des affaires sociales et de la santé, en décembre 2016, au moment du lancement du plan France médecine génomique 2025 (FMG25). Ce plan consiste en un programme de séquençage du génome humain à grande échelle dans le but de diagnostiquer, prévenir et soigner les patients, en constituant des bases de données[v] génomiques sur lesquelles l’ensemble des praticiens de la santé pourraient s’appuyer pour offrir à chacun, en fonction de sa pathologie, le traitement le plus personnalisé qui soit. C’est également une ressource pour la communauté scientifique, pour laquelle ces bases présentent un intérêt non négligeable en recherche, pour la compréhension des mécanismes biologiques ou pour le développement de molécules thérapeutiques et de vaccins.

A cet effet, 12 plateformes académiques sont prévues. Ces plateformes sont des consortiums public-privé de coopération sanitaire, qui regroupent des hôpitaux, des laboratoires de séquençage et des laboratoires d’analyses de données. A ce jour, deux sont lancées, l’une en Ile de France, appelée SeqOIA autour de l’AP-HP (Assistance Publique – Hôpitaux de Paris) et de l’Institut Curie et l’autre à Lyon/ Grenoble, la plateforme Auragen réunissant les Hospices Civils de Lyon, plusieurs Centres hospitaliers universitaires (CHU) de Grenoble, Saint-Etienne et Clermont-Ferrand, les Centres Léon Bérard, et Jean Perrin et l’Institut de cancérologie de la Loire.

Chacune de ces entités a pour objectif de séquencer 18000  génomes par an, à raison de 50 par jour. Toutes les données recueillies vont alimenter les bases de données du Health Data Hub[vi] (HDH), lequel utilise les services de Microsoft Azure Cloud pour le stockage.

Parallèlement, se sont implantées des biotechs qui offrent des services de tests génétiques grand public ou « récréatifs », relatifs essentiellement à la généalogie familiale, en vente directement sur Internet pour n’importe qui, sans l’intermédiaire d’un médecin ni l’obligation d’une prescription médicale.

En France, il est interdit de réaliser un test génétique sans ordonnance, injonction judiciaire ou projet de recherche, réglementation que ces entreprises contournent en effectuant toutes les prescriptions en ligne, Internet autorisant une déterritorialisation permettant de s’en affranchir.

Près de 200 000 personnes dans l’hexagone auraient recours à ces services en ligne chaque année, selon l’Inserm[vii]. Aux États –Unis, où n’existe aucune régulation, 26 millions d’usagers ont été répertoriés par le MIT (Massachusetts Institute of Technology -) en 2020, selon les Echos[viii]. Cet engouement du public pour ces études génétiques ont permis à ces sociétés d’analyse de l’ADN de devenir expertes dans la production, le traitement et l’analyse de volumes considérables de données génétiques, dépassant même les plateformes académiques.

Ces entreprises, dont le nombre ne cesse d’augmenter (une quarantaine aujourd’hui), telles 23andMe, AncestryDNA, MyHeritage, proposent en général à leurs usagers d’accepter de partager les données issues des tests génétiques à des fins de recherche, mais aussi avec des communautés d’usagers constituées en forums sur Internet.  Les données générées pour un individu ne prennent de sens et de valeur que si elles peuvent être croisées avec celles de nombreuses bases de données de santé et de « vie réelle », et de l’ensemble des génomes connus. A travers ces forums, les données génétiques peuvent être reliées aux milliards de données issues, entre autres, des objets connectés ou applications mobiles (le quantified-self[ix]), dont les GAFAM sont, en grande partie, propriétaires.

Les géants du Web, par leur capacité de stockage et de traitement algorithmique, ont ainsi la haute main, à la fois sur les bases de données des biotechs, des objets connectés, mais également sur celles des plateformes académiques. Ces données massives (Big Data) ont, ou peuvent avoir, une valeur diagnostique ou pharmacologique, qui leur confère une haute valeur d’échange sur les plans clinique et scientifique, mais également sur le plan économique. Elles deviennent un capital qu’il est possible de faire fructifier ou de vendre, que les entreprises du numérique comptent bien exploiter à leur profit. Celles-ci ont tous les atouts pour être des partenaires incontournables dans le développement des solutions thérapeutiques innovantes alliant médecine et technologie.

Les partenariats entre les industries pharmaceutiques et les géants du Web

Le grand nombre de partenariats démontrent que les laboratoires pharmaceutiques travaillent de plus en plus main dans la main avec les multinationales de l’informatique et des nouvelles technologies. Exemples : Verily, la branche « science et vie » d’Alphabet, s’est associée aux laboratoires pharmaceutiques Novartis et Sanofi, pour développer des dispositifs destinés aux diabétiques, avec Glaxo-Smith-Kline pour inventer des médicaments « bio-électroniques » ou avec une filiale de Johnson et Johnson pour fabriquer des robots de chirurgie. Calico, une autre division santé d’Alphabet, a conclu un accord avec le laboratoire Abbvie pour créer un centre de recherche et de développement destiné à mettre au point des traitements dans les maladies neurodégénératives et les cancers.

Microsoft, qui se définit comme un prestataire de service pour améliorer la médecine de précision, grâce à son cloud Azure (qui abrite les données du Health Data Hub en France), a signé un partenariat avec Johns Hopkins Medecine, aux États-Unis.

Sanofi, qui collabore avec Verily, a aussi un partenariat avec l’AP-HP, impliqué dans le consortium SeqOIA, et vient de créer avec Orange, Capgemini, et Generali[x] France (l’un des principaux assureurs de l’Hexagone), une société commune « dont l’ambition est d’accélérer le développement de solutions concrètes en matière de santé et leurs mises à disposition sur le marché au bénéfice des patients[xi] ».

Ces partenariats s’établissent, moyennant finances, sur la base d’échanges de bases constituées de données multi-domaines. Exemple : en 2018, GlaxoSmithKline a obtenu une licence exclusive d’accès aux données de 5 millions de clients de 23andMe pour 300 millions de dollars. En 2016, 23andMe a vendu à l’entreprise de biotechnologie Genentech, pour 65 millions de dollars, les informations personnelles et les prélèvements, à des fins de re-séquençage, d’une cohorte de 14 000 personnes, dans le cadre d’une étude de la maladie de Parkinson.

La donnée, notamment celle relative à la santé des individus, est devenue la véritable matière première d’un business juteux, que s’arrache une nébuleuse d’entreprises privées (industries de santé, start-up, biotech, géants du Web), sur un marché mondialisé, confondant le soin et le commerce.

Une ère nouvelle s’ouvre dans le domaine de la santé, avec une diversification des acteurs – tous animés d’une perspective marchande de tirer le meilleur profit des nouvelles thérapeutiques – et un changement de paradigme technologique. Désormais, c’est sur de nouvelles approches médicales, basées sur les Big Data de la santé, permettant d’appréhender les processus vivants dans ce qu’ils ont de plus intime, que porte la concurrence internationale.

La protection des données génétiques

Ces nouvelles approches posent la question de la protection des données personnelles de santé, et plus particulièrement la donnée génétique. Celle-ci fait l’objet de mesures protectrices en Europe (UE), avec le règlement général sur la protection des données[xii] (RGPD), surtout en France, où elle est considérée comme faisant partie du corps humain et, à ce titre, ne peut être commercialisée. Contrairement aux États-Unis où elle semble être considérée comme un bien valorisable économiquement, directement par une entreprise privée ou des particuliers.

Les données génétiques sont des données hautement personnelles et sensibles, parce qu’elles révèlent des informations sur un individu mais aussi sur l’ensemble des personnes qui partagent son ADN, c’est-à-dire sa famille (ascendants et descendants). Ce point est actuellement une des sources principales de questionnement éthique, d’autant plus problématique que l’anonymisation des séquences d’ADN ne garantit pas une protection infaillible de leur caractère privé. Quelques recherches sur Internet suffisent à identifier un donneur anonyme, les tests génétiques apportant des informations précises sur l’identité des personnes.

Des fichiers de caractéristiques génétiques pourraient ainsi être établis, dont la divulgation constituerait une grave atteinte à la vie privée. La classification des individus par catégories ou par communautés, selon des gènes relatifs à la généalogie  ou à l’origine ethnique, peut conduire à des mesures discriminantes, voire racistes, dans la vie sociale et économique, et faire peser le risque d’une remise en cause du respect des droits fondamentaux de la personne, notamment ceux d’égalité en droits et en dignité.

Une dérive vers un profilage existe, chez les assureurs, par exemple, désireux de proposer à leurs assurés une couverture santé établie en fonction des probabilités de maladies prédites par le décryptage de leur génome. Rien n’empêche, en effet, les résultats des tests génétiques produits par SeqOIA, de circuler entre l’AP-HP, Sanofi et l’assureur Generali France.

Le consentement à l’accès et à la conservation de ces données est évidemment nécessaire. Ce principe est-il respecté lorsque 23andMe vend des profils génétiques à GSK ou Pfizer? Ses clients, incités, lors de la commande, à cocher une case « accepte de partager les données » à des fins de recherche, ont-ils connaissance de ces transactions ? Est-ce que le fait de cocher cette case vaut pour un consentement libre et éclairé, à la base de l’ensemble du droit médical et de la bioéthique ?

Les données médicales, y compris le profil génétique, du HDH en France, ne sont pas à l’abri d’une telle dérive. Considérées comme un don de la part des patients pour être utilisées à des fins de recherche, elles sont revendiquées comme un « bien commun »[xiii] devant être accessible à tous afin d’être valorisées économiquement. A ceci près qu’il n’est pas prévu que les 16 à 22 milliards d’euros annuels de profit estimé reviennent dans des caisses communes telles que la Sécurité sociale ou le budget alloué à la recherche, mais resteront bien acquis à ceux qui auront su le mieux se positionner pour les accaparer, puis les faire fructifier.

Par ailleurs, les plateformes académiques sont dépendantes de nombreuses entreprises américaines, pour les appareils de séquençage, les analyses des données et leur stockage. Or toute entreprise américaine a l’obligation, conformément au Cloud Act[xiv] promulgué en 2018, à la demande d’un magistrat, de communiquer à son pays les informations qu’elle détient. Des précédents existent. FamilyTreeDNA a ainsi donné au FBI l’accès à sa base de données de plus d’un million d’utilisateurs, pour que les agents fédéraux puissent les comparer aux échantillons d’ADN provenant de scènes de crime.

Les séquences génomiques produites par le séquenceur NovaSeg 6000 de l’entreprise américaine Illumina, utilisé par la plateforme Auragen à Lyon, et les bases de données du HDH, hébergées par le cloud Azure de Microsoft n’échappent pas à cette règle. Sur simple demande, la police américaine peut accéder aux bases de données et établir un portrait-robot génétique d’un suspect, dans le cadre d’enquêtes judiciaires. Cet accès pourrait aussi bien être mis à profit à des fins de surveillance de masse.

Sans pour autant être totalement interdite, ce qui serait un frein à la recherche et aux avancées cliniques bénéfiques pour les patients, l’utilisation des données de santé, de nos constantes vitales, voire de notre ADN,  doit obéir à l’exigence du consentement libre et informé, au respect de la confidentialité, des droits et des libertés fondamentales de l’être humain. On constate que tout cela est peu respecté, en particulier par les GAFAM, hégémoniques sur le marché du numérique, incités par leur position de toute puissance à outrepasser tous les droits. Une fois les données captées par ces firmes, il semble difficile d’en contrôler les abus d’usage. Pour sortir de cette dépendance, il revient aux citoyens de s’approprier les enjeux numériques de la santé. Il leur faut prendre conscience qu’ils ne sont pas neutres politiquement en termes de libertés publiques, de respect de la vie privée, et de modèle de société.

De même que nous devons contester aux Big pharma le monopole sur les médicaments, nous devons mener une réflexion collective et exiger une politique forte de régulation de la collecte et de l’utilisation des données de santé individuelles pour ne pas laisser les géants du Web et de la finance gouverner nos vies.

Eliane Mandine.

26/02/2022

[i] Alphabet Inc. /ˈælfəbɛt/ est une entreprise américaine basée en Californie, créée en 2015 comme un conglomérat de sociétés précédemment détenues par la société Google.

[ii] 23andMe, désormais cotée au Nasdaq, a racheté en 2021, la société de télésanté Lemonaid, entreprise spécialisée dans la consultation à distance, pour 400 millions de dollars.

[iii] Le projet génome humain (en anglais, Human Genome Project ou HGP) est un programme lancé fin 1988 dont la mission était d’établir le séquençage complet de l’ADN du génome humain.

[iv] GAFAM est l’acronyme des géants du Web — Google, Apple, Facebook, Amazon et Microsoft

[v] La donnée brute est une information sans valeur d’usage, tandis que l’information est une donnée ou un ensemble de données, ayant au moins une valeur d’usage (biologique, médicale, économique). Selon le contexte, le mot donnée indique l’une ou l’autre des significations. Ici, il s’agit d’une information.

[vi] La Plateforme des données de santé (PDS), également appelée « Health Data Hub » (HDH), a été créée par arrêté du 29 novembre 2019 pour faciliter le partage des données de santé, issues de sources très variées afin de favoriser la recherche.

[vii] https://www.inserm.fr/actualite/tests-genetiques-recreatifs-juste-jeu/

[viii] https://www.lesechos.fr/idees-debats/sciences-prospective/tests-genetiques-une-banalisation-a-risque-1166791)

[ix] Le quantified self, ou personal analytics, est une pratique née aux États-Unis qui regroupe les outils, les principes et les méthodes permettant à chacun de mesurer ses données personnelles, de les analyser et de les partager.

[x] Generali France est aujourd’hui le leader de l’assurance-vie sur Internet. Il est, par ailleurs, le premier assureur des sportifs, et détient à 100% Europ assistance (assurances aux voyageurs, incluant la santé)

[xi] Communiqué de presse-Sanofi-25/ 01 /2022

[xii] La mise en œuvre d’une recherche médicale portant sur des patients et incluant le traitement de leurs données génétiques implique de mener une analyse d’impact sur la protection des données pour cette recherche.

[xiii] Rapport de l’Institut Montaigne : (https://www.institutmontaigne.org/ressources/pdfs/publications/e-sante-augmentons-la-dose-rapport.pdf)

[xiv] Le Cloud Act , loi promulguée en 2018, stipule qu’un magistrat américain a la capacité d’ordonner la récupération de données chez un hébergeur s’il s’agit d’une société américaine. Et ce, même si la base de données visée se situe à l’étranger.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *