Delphi-2M : cette IA prédit votre risque pour plus de 1000 maladies

Delphi-2M, inspiré des LLM, analyse les trajectoires de santé individuelles et propose un outil complet pour anticiper la multimorbidité.

Delphi-2M a été créé par des chercheurs du European Molecular Biology Laboratory (EMBL), du German Cancer Research Center (DKFZ) et de l’Université de Copenhague. Cette IA médicale utilise des données anonymisées de près de 2,3 millions de personnes au Royaume-Uni et au Danemark pour fournir ses diagnostics.

Delphi-2M, une IA prédictive

Delphi-2M s’inspire des grands modèles de langage et repose sur une architecture de type transformeur. Son approche est similaire à celle des modèles GPT-2, mais adaptée aux historiques médicaux.

L’IA intègre des facteurs variés comme l’âge, le sexe, l’indice de masse corporelle à tris niveau. Le modèle prend en compte aussi le tabagisme et la consommation d’alcool, afin d’améliorer la précision des analyses.

Delphi-2M encode les diagnostics selon la norme ICD-10, couvrant plus de 1 200 maladies différentes. Elle suit l’évolution de la santé au fil du temps et identifie les risques combinés, lorsqu’une personne présente plusieurs pathologies simultanément. Un module spécifique prédit également la survenue probable d’événements médicaux.

Cette capacité repose sur un entraînement massif à partir des données de 500 000 personnes fournies par UK Biobank. Ces informations incluent diagnostics, auto-déclarations, registres de cancer, hospitalisations et décès.

Grâce à cette base, Delphi-2M offre un outil complet pour la prévision médicale individuelle et la gestion de la multimorbidité.

L’efficacité testée et approuvée

Une validation menée au Danemark sur 1,93 million de dossiers montre des résultats prometteurs. Delphi-2M atteint un score de précision moyen de 0,76 et de 0,97 pour la prédiction de la mortalité. Ses prévisions restent fiables sur dix ans et surpassent souvent les outils médicaux classiques.

À partir des données d’une personne à 60 ans, Delphi-2M peut estimer les risques à 75 ans. Les fumeurs présentent davantage de maladies respiratoires, un indice de masse corporelle élevé accroît les troubles cardiaques. Autre constat, une consommation excessive d’alcool affecte le foie.

Par ailleurs, l’IA détecte également les combinaisons de maladies. Un trouble digestif peut ainsi signaler un risque accru de cancer pancréatique.

Delphi-2M privilégie la transparence. Des outils comme UMAP visualisent les regroupements de maladies. Par exemple, les cancers et les troubles diabétiques forment des clusters distincts. SHAP permet d’expliquer l’impact de chaque facteur : un diagnostic digestif peut multiplier un risque par 19.

L’IA génère des données synthétiques, protégeant la vie privée des patients. Toutes les données sont conservées, sans risque de fuites.

Les limites à connaître

Delphi-2M n’est pas infaillible. La UK Biobank regroupe principalement des participants en bonne santé, ce qui peut sous-estimer certains risques, comme les cancers graves. Les validations danoises confirment une bonne généralisation, mais des variations entre pays subsistent.

Certaines données manquent, comme les hospitalisations pour septicémie, ce qui peut affecter certaines prédictions. L’intégration de données génétiques ou de prescriptions médicales pourrait encore améliorer l’IA. Malgré ces limites, Delphi-2M facilite la planification des dépistages précoces.

