C’est maintenant autour des docteurs de s’inquiéter pour leur travail à cause de Med-Gemini. La précision de ses diagnostics cliniques impressionne beaucoup.
Google et son laboratoire DeepMind réalisent une avancée significative en matière d’implémentation de l’intelligence artificielle dans la médecine. Le mastodonte américain du numérique dévoile Med-Gemini, une suite de grands modèles linguistiques (LLM) spécialisés en médecine. Leurs diagnostics cliniques rivalisent avec ceux de vrais docteurs.
Les médecins croulent sous les dossiers de leurs patients. Ils ne sont plus en mesure de fournir des soins personnalisés et efficaces par manque de temps.
Il existe la possibilité de s’appuyer sur les capacités de traitement de données des modèles d’intelligence artificielle. Ces derniers peuvent effectivement faciliter les diagnostics.
Néanmoins, cette solution technologique ne règle pas tout. La relation médecin-patient reste — basée sur la communication, la confiance et l’empathie — reste primordiale.
Il serait ainsi intéressant d’avoir un outil de diagnostic clinique basé sur l’intelligence artificielle, capable d’intégrer la dimension humaine de la relation médecin-patient. C’est que la nouvelle suite de grands modèles de langage de Google entre en jeu.
Les capacités de Gemini appliquées en médecine
Rappelons que DeepMind a développé pour Google la suite Gemini. Cette dernière rassemble une nouvelle génération de modèles d’IA multimodaux.
Ces LLM peuvent traiter des informations à partir de diverses modalités. Celles-ci incluent notamment le texte, les images, l’audio et les vidéos.
Précisons que ces modèles possèdent de bonnes capacités pour le langage et la conversation. Ils peuvent également raisonner en se basant sur des volumes considérables de données.
Med-Gemini bénéficie de toutes les capacités des modèles Gemini. En revanche, celles-ci ont été affinées pour permettre la réalisation de diagnostics cliniques. Les chercheurs du laboratoire IA de Google détaillent leurs travaux dans cette prépublication sur arXiv.
Entraînement basique avec MedQA
La réalisation d’un diagnostic et la proposition d’un traitement ne dépendent pas seulement des connaissances du médecin. Ce dernier doit également prendre en compte d’autres éléments pertinents.
Ces informations peuvent être les symptômes du patient et ses antécédents. Les résultats d’analyse jouent souvent un rôle crucial.
L’entraînement de Med-Gemini n’a pas différé des autres LLM destinés au secteur médical. DeepMind a utilisé MedQA pour cette phase de développement.
MedQA est une suite de questions à choix multiples, représentatives des sujets de l’examen de licence médicale aux États-Unis. Ces questions servent à tester les connaissances médicales et le raisonnement selon des scénarios divers et variés.
La recherche sur le web pour affiner les diagnostics
Afin de renforcer les capacités de son intelligence artificielle générative médicale, DeepMind a développé deux nouveaux ensembles de données. Ces derniers sont :
- MedQA-R pour le raisonnement
- MedQA-RS pour combiner le raisonnement et la recherche sur le web
Le premier ensemble de données élargit MedQA grâce à la chaîne de pensée. Précisons que cette technique renforce les capacités de raisonnement d’un LLM.
Le second ensemble fournit aux modèles des instructions pour exploiter les résultats de recherche sur le web. L’intelligence artificielle dispose ensuite de davantage de contexte pour donner des réponses plus précises.
Il faut savoir que le diagnostic médical amène souvent à des incertitudes. C’est pour mieux préparer son IA médicale à ce cas de figure que Google a prévu MedQA-RS.
Med-Gemini avec des performances SoTA sur les benchmarks
La nouvelle suite IA de Google a passé des tests sur 14 benchmarks médicaux. Elle a aligné les performances SoTA sur dix benchmarks.
Bien que vieillissant, GPT-4 reste le LLM de référence dans le secteur de l’intelligence artificielle. Rappelons qu’il s’agit actuellement du modèle le plus performant d’OpenAI.
Sur sept benchmarks multimodaux, Med-Gemini surpasse largement GPT-4. Prenons notamment les résultats du test d’image du New England Journal of Medicine.
Le benchmark NEJM demande à un diagnostic sur une liste de dix propositions, en se basant sur des images de cas cliniques complexes. Les performances de l’IA médicale de Google sont meilleures avec une marge moyenne de 44,5 %.
Excellent pour éplucher les DSE
Les chercheurs de DeepMind ont obtenu des résultats très prometteurs en testant les capacités de Med-Gemini à comprendre et à raisonner en s’appuyant sur un gros volume de données médicales — notamment des dossiers de santé électroniques (DSE).
Le test consistait en une tâche de type “aiguille dans une botte de foin” avec MIMIC-III. Précisons que MIMIC-III est une grande base de données sur plus de 40 000 patients en soins intensifs.
La nouvelle IA devait retrouver la mention pertinente d’une condition médicale rare et subtile. Une recherche à réaliser parmi une large collection de notes cliniques. Med-Gemini a bien performé, surpassant la méthode SoTA en rappel, avec 0,76 contre 0,73.
Sa performance témoigne de son potentiel pour réduire la charge cognitive et augmenter les capacités des cliniciens. Pour ces derniers, les tâches de ce genre constituent un réel défi.
Des interactions naturelles avec les patients
Dans un autre test des chercheurs de DeepMind, le nouveau modèle a pu correctement diagnostiquer une lésion cutanée rare. Pour cela, il s’est basé sur deux éléments :
- Une photo
- Les informations fournies par le sujet
Ses capacités de conversation permettent des interactions naturelles avec les patients et les docteurs, mais pas que. Med-Gemini peut également communiquer avec d’autres systèmes d’intelligence artificielle.
Rappelons que des échanges naturels avec des personnes permettent au modèle d’apporter une dimension humaine à la consultation. Cela est indispensable dans la prise en charge des patients.
Néanmoins, les chercheurs reconnaissent devoir mener des travaux supplémentaires. Cette capacité nécessite encore des améliorations considérables.
Bientôt votre consultation avec Med-Gemini ?
Il va sans dire que ce nouveau modèle de Google est un outil très prometteur. Malgré des capacités impressionnantes, son déploiement n’est pas encore à l’ordre du jour.
En effet, Med-Gemini nécessite encore beaucoup de travail. Le modèle doit implémenter des garde-fous en matière de responsabilité, de confidentialité et d’équité. L’équipe de DeepMind procèdera à ces ajouts tout au long de son développement.
D’autre part, elle insiste sur l’importance de la confidentialité et de l’équité. Ces valeurs vont permettre au modèle d’éviter les biais historiques et de perpétrer les inégalités.
Malgré ces défis, le LLM médical de Google reste un outil bénéfique. Il représente un grand pas en avant pour accélérer les découvertes biomédicales. De plus, le modèle peut améliorer la prestation des soins de santé.
- Partager l'article :