Prédiction et intelligence artificielle

La variabilité inter-individuelle en médecine

Une grande variabilité inter-individuelle entrave l’établissement de lois générales utilisables en médecine prédictive. Les traits quantitatifs, la survenue de nombreuses affections sont régies par des règles complexes d’interactions entre des facteurs génétiques et environnementaux. L’observateur perçoit l’existence de facteurs influents mais ne parvient pas à les organiser. En autorisant l’usage d’algorithmes de modélisation relativement complexes, les techniques d’apprentissage statistiques permettent de séparer l’information utile et généralisable de la variabilité naturelle des données.

Intelligence artificielle et modèles de prédiction

CeRePP utilise des algorithmes d’apprentissage statistique (comme la régression logistique, les nomogrammes, les réseaux de neurones, ou les réseaux Bayesiens) ou l’intelligence artificielle explicable pour établir des modèles de prédiction, à partir des données collectées dans sa biobanque et des résultats des analyses moléculaires qu’il réalise.

Dans une première phase d’apprentissage sont soumis aux algorithmes des cas clairement étiquetés (exemple : malades, sains) et toutes les variables d’entrée que l’on pense être pertinentes (exemple : âge, antécédents, poids, dosages biologiques,…), mais dont l’influence n’est pas clairement établie (quel poids donner aux variables d’entrée ?). Les algorithmes se comportent, dans cet exemple, comme un “étudiant en médecine” qui apprendrait à reconnaître des personnes à risque en consultant un nombre suffisant de dossiers. Les règles qu’ils établissent sont complexes et sans doute non linéaires. Pourvu qu’elles soient pertinentes, les variables d’entrée utilisées peuvent être très nombreuses.

Exemple d’un réseau de données organisées par intelligence artificielle

Dans une deuxième phase, dite phase de test, on montre quelques nouveaux cas aux modèles et on mesure leurs performances. Lorsque les modèles arrivent à reconnaître les malades avec une performance satisfaisante, on estime qu’ils ont trouvé une règle liant les variables d’entrée et la décision attendue. On peut ensuite les sauvegarder et les utiliser dans un logiciel de dépistage pour traiter de nouveaux cas, similaires à ceux que l’algorithme aura traités au cours de son apprentissage. Les performances des modèles et les indications des médecins guident le choix dans la recherche du meilleur outil et dans la sélection de nouvelles variables.