Microsoft affirme avoir franchi un cap avec un nouveau système d’IA médicale. Testé sur des cas complexes, l’outil aurait atteint un taux de précision quatre fois supérieur à celui de médecins humains.

Microsoft et son nouvel outil d'IA médicale MAI-DxO promet de grands progrès dans le diagnostic clinique -  - ©LALAKA / Shutterstock
Microsoft et son nouvel outil d'IA médicale MAI-DxO promet de grands progrès dans le diagnostic clinique - - ©LALAKA / Shutterstock
L'info en 3 points
  • L'article explore les dernières innovations technologiques, mettant en avant des gadgets révolutionnaires qui transforment notre quotidien.
  • Il aborde les enjeux de la sécurité numérique, soulignant l'importance de protéger nos données personnelles en ligne.
  • Enfin, l'article discute des tendances futures, prévoyant une intégration accrue de l'intelligence artificielle dans divers secteurs.

Le projet s’appelle MAI-DxO, pour Medical AI Diagnostic Orchestrator. Comme on vous l'expliquait sur Clubic, il fonctionne comme une équipe d’experts virtuels. Chaque modèle IA reçoit une partie du problème, propose une hypothèse, débat avec les autres, puis affine le raisonnement. Microsoft a voulu imiter une concertation entre spécialistes, sans passer par une logique brute.

L’outil a été mis à l’épreuve sur 304 cas médicaux tirés du New England Journal of Medicine. 80 % de diagnostics se sont montrés justes, contre 20 % pour un panel de médecins invités à se prêter au même exercice. L’expérience reste théorique, mais l’écart est assez large pour retenir l’attention.

Mustafa Suleyman, patron de l’IA chez Microsoft, pilote le projet. Passé par Google DeepMind, il a voulu reproduire le raisonnement clinique tel qu’il est pratiqué par les médecins. Symptômes, examens, analyse, puis diagnostic, chaque étape est suivie sans raccourci. Le système fonctionne avec plusieurs modèles d’IA – GPT, Gemini, Claude, Llama, Grok – qui interagissent comme des spécialistes autour d’un même dossier.

Microsoft veut démontrer qu’un raisonnement médical peut se reproduire à grande échelle

Le système avance pas à pas. Il prend en compte les symptômes, propose des examens adaptés, puis confronte les résultats. Chaque modèle IA joue un rôle précis. L’ensemble fonctionne comme une réunion de médecins, où chaque voix apporte une nuance.

Dominic King, l’un des responsables du projet, observe un autre effet intéressant : la sélection d’examens tend vers les options les plus utiles, et souvent les moins coûteuses. Il évoque une réduction moyenne de 20 % sur les frais engagés pour parvenir au bon diagnostic.

L’équipe a volontairement sélectionné des cas réputés difficiles. David Sontag, chercheur au MIT, suit le projet avec attention. Il salue la clarté du raisonnement reproduit par MAI-DxO, même si les médecins du test n’avaient pas accès à leurs outils habituels, ce qui rend la comparaison imparfaite. Selon lui, l’intérêt du travail vient surtout de la rigueur méthodologique.

© Antonio Marca / Shutterstock

Le système attend encore un test grandeur nature, dans un contexte clinique réel

MAI-DxO reste au stade de prototype. Microsoft envisage plusieurs pistes, dont une intégration dans Bing, ou un usage réservé aux équipes médicales. Aucune annonce officielle pour l’instant.

Eric Topol, médecin et chercheur au Scripps Research Institute, a consulté les résultats de l’étude. Il note la difficulté des cas soumis au système, et reconnaît des performances rarement observées dans ce type de test. Pour lui, une évaluation en conditions réelles permettrait de confirmer si ces résultats se confirment à l’hôpital.

D’autres groupes avancent sur le même terrain. Google, notamment, multiplie les collaborations avec des centres de recherche pour tester ses propres modèles. Microsoft a d’ailleurs recruté plusieurs ingénieurs passés par Google pour former son équipe.

L'efficacité du système dépend aussi des données disponibles. Si certains profils manquent dans les corpus médicaux utilisés pour l'entraînement, le diagnostic peut perdre en justesse. De nombreux paramètres extérieurs influencent également le raisonnement clinique : antécédents du patient, conditions matérielles, ou contraintes liées au contexte.

« Ces aspects échappent encore largement aux systèmes automatisés », admet David Sontag. Il propose de passer par une étude clinique complète, avec de vrais patients, pour vérifier si le dispositif peut accompagner le travail des soignants dans un environnement réel. Qui pour se porter volontaire, au sein de notre communauté Clubic ?

Source : Wired (accès payant)