Un changement de paradigme : du "dire d'expert" à l'apprentissage profond

Traditionnellement, l'identification de profils de patients repose sur des algorithmes "experts" : des cliniciens sélectionnent manuellement des variables clés (diagnostics hospitaliers, prescriptions spécifiques) pour définir une pathologie. L'approche innovante de la Drees propose de renverser ce modèle en utilisant des architectures inspirées du traitement automatique du langage naturel (NLP), comme BERT ou Word2Vec.

Dans ce cadre, chaque événement de santé (une boîte de médicament, un acte médical, un diagnostic) est traité comme un "mot" (token) dans la "phrase" que constitue la trajectoire de vie d'un patient. Cette méthode permet d'intégrer la complexité totale du parcours sans sélection préalable, laissant l'apprentissage statistique faire le tri parmi plus de 80 000 événements différents.

Retrouvez cet épisode du podcast Servez-vous : La révolution de l’intelligence artificielle va-t-elle transformer l’accompagnement à domicile ?

Des performances prédictives inégalées

L'étude a comparé plusieurs modèles sur un échantillon allant jusqu'à 50 millions d'individus. Les résultats démontrent une supériorité nette des modèles de langage sur les méthodes classiques :

  • Une précision accrue : Le modèle BEHRT-SNDS surpasse les modèles de référence pour plus de 90 % des cibles étudiées.
  • Prédire l'imprévisible : Le gain de performance est particulièrement marqué pour les pathologies aiguës ou soudaines, comme l'insuffisance rénale aiguë sans facteur de risque, où le gain atteint 5,5 points d'AUC par rapport aux modèles standards.
  • Anticipation des complications : Pour l'endométriose, l'analyse dynamique des trajectoires permet d'anticiper les formes nécessitant une chirurgie avec un gain de près de 10 points d'AUC.

L'explicabilité : comprendre la décision de l'IA

L'un des freins majeurs à l'adoption de l'IA en santé est son aspect "boîte noire". Pour y répondre, l'étude mobilise les valeurs de Shapley-Owen afin de décomposer chaque prédiction de risque.L'analyse révèle que l'IA ne se contente pas de repérer des symptômes évidents. Elle capte des signaux indirects, comme le recours à certains professionnels paramédicaux ou des successions d'actes non spécifiques qui peuvent traduire une errance diagnostique avant la formalisation d'une maladie grave.

Un outil de prévention, mais aussi de nouveaux risques de biais

Si ces modèles ouvrent la voie à une prévention personnalisée via des outils comme "Mon Espace Santé", ils soulèvent des questions éthiques majeures. L'étude souligne que les performances de prédiction sont plus élevées pour les personnes ayant un niveau de vie élevé (+3,8 points d'AUC par rapport aux plus modestes).Ce différentiel s'explique par une meilleure proximité au système de soins, générant des trajectoires plus riches et donc plus "lisibles" pour l'algorithme. À défaut de vigilance, l'utilisation de ces modèles pourrait involontairement creuser les inégalités de santé en ciblant plus efficacement les populations déjà les mieux suivies.

Source : Prédire la suite d'un parcours de soins dans le système national des données de santé, DREES MÉTHODES N° 25, avril 2026.

Du dépistage assisté à la prédiction de parcours : l'exemple rennais

Cette révolution de l’IA ne se limite pas aux modèles théoriques de traitement de données de masse, elle s’incarne déjà dans la pratique clinique locale, comme l’illustre l’initiative des Hôpitaux Privés Rennais (Vivalto Santé). En installant un module d’IA en temps réel dans leur service d’endoscopie, ces équipes renforcent la détection immédiate des lésions coliques les plus discrètes lors des coloscopies. Cette innovation technique sur le terrain complète parfaitement l'approche prédictive du SNDS : alors que les modèles de langage de la Drees permettent d'identifier en amont des profils de patients à risque de cancer colorectal — réduisant ainsi de 30 % la population à cibler pour détecter la moitié des cas — l'IA clinique à Rennes assure, elle, une fiabilité maximale de l’examen une fois le patient orienté. Cette convergence entre la prédiction statistique nationale et l’expertise médicale augmentée en Bretagne témoigne d'une ambition commune : agir précocement pour guérir un cancer qui, détecté à temps, se soigne dans 9 cas sur 10.