La science des données en biomédecine

Ces dernières années, la science des données a pris de l'importance dans de nombreux domaines, notamment en médecine et dans les sciences de la vie. De la prédiction des épidémies aux traitements personnalisés, la science des données transforme la manière dont nous pouvons comprendre, diagnostiquer et traiter la santé humaine.

Retour

Qu’est-ce que la science des données ?

La science des données – ou « Data Science » en anglais – comprend la collecte, l’analyse et l’interprétation de grandes quantités de données afin de révéler des schémas permettant de formuler des hypothèses ou de tirer des conclusions. En tant que science interdisciplinaire, elle combine les mathématiques, les statistiques et l’informatique pour aborder les problèmes selon une perspective plus complexe. Dans le cas de la biomédecine, il peut s’agir, par exemple, de séquences génétiques, de données de mesure ou de composés chimiques, tandis qu’en clinique, il peut s’agir de données de santé comme les valeurs sanguines. En recherche biomédicale, la science des données permet de transformer les vastes quantités d’informations générées dans les laboratoires en connaissances concrètes. Ces résultats peuvent ensuite être utilisés pour générer de nouvelles hypothèses. Dans le contexte des soins de santé, la science des données permet d’utiliser les informations des hôpitaux pour améliorer la prise en charge des patients.

Comment la science des données aide-t-elle ?

Les domaines les plus importants dans lesquels la science des données est utilisée en biomédecine comprennent :

Prévision et prévention des maladies & médecine personnalisée

En analysant les données des patients, les scientifiques peuvent créer des modèles permettant de prédire qui présente un risque pour certaines maladies. Par exemple, certains algorithmes peuvent analyser des dossiers médicaux afin de prédire la probabilité de maladies cardiaques, de diabète ou même de cancer. Prenons le génome : en fonction de la combinaison de certaines variantes de gènes dans le génome d’un individu, il est possible d’estimer le risque de développer une maladie donnée (1). Ce type d’analyse prédictive permet une intervention précoce, ce qui peut sauver des vies et réduire les coûts de santé. Le corps de chaque individu étant unique, un traitement efficace chez un patient peut ne pas l’être chez un autre. La science des données aide à adapter les traitements en fonction de l’analyse des données génétiques, des facteurs de mode de vie et des antécédents médicaux. Cette approche personnalisée est particulièrement importante en oncologie, où certains traitements du cancer sont plus efficaces chez les patients porteurs de marqueurs génétiques spécifiques. Par exemple, en combinant des données génétiques et pharmacologiques, il est possible d’identifier les médicaments les plus prometteurs pour certains patients (2).

Brochure d’information sur les données de santé

Imagerie médicale, diagnostic & infrastructure médicale

Traditionnellement, les radiologues examinent les images médicales manuellement pour détecter des anomalies. Désormais, des outils assistés par l’IA peuvent aider les médecins en détectant automatiquement des signes de maladies sur des radiographies ou des images IRM – parfois avec une précision équivalente, voire supérieure, à celle d’experts humains. Ces outils accélèrent le diagnostic et réduisent le risque d’erreurs (voir aussi l’article sur la médecine et l’IA).

Un exemple d’application directe de la science des données dans la pratique clinique aiguë est le « ICU-Unit-Cockpit » utilisé à l’Hôpital universitaire de Zurich (3). Les données des patients en soins intensifs y sont traitées en temps réel afin de fournir une aide à la décision et des prévisions au personnel de santé sur place.

Recherche et développement pharmaceutique

Le développement d’un nouveau médicament est un processus long et coûteux qui dure souvent plus d’une décennie et coûte des milliards de francs. La science des données accélère ce processus en identifiant des substances actives prometteuses, en prédisant leurs effets et en concevant de meilleurs essais cliniques. Ainsi, de nouvelles thérapies peuvent être mises sur le marché plus rapidement et de manière plus efficace. Par exemple, une base de données contenant des milliards de composés chimiques peut être analysée à l’aide d’algorithmes afin d’identifier les plus appropriés, qui seront ensuite étudiés en laboratoire (4). En fin de compte, la science des données est un outil essentiel pour gérer et analyser les volumes de données générés par les essais cliniques.

Épidémiologie

Lors d’événements comme la pandémie de COVID-19, la science des données a joué un rôle crucial dans le suivi de la propagation du virus, la prévision du nombre de cas et l’orientation des politiques de santé. Grâce à l’analyse des tendances et à la modélisation de la dynamique des maladies, les scientifiques des données aident les autorités sanitaires à réagir plus efficacement aux nouvelles menaces. Une plateforme très importante durant la pandémie de COVID-19, issue en partie d’institutions de recherche suisses, est la base de données et l’outil d’analyse Nextstrain (5). Elle collecte et documente les séquences génétiques des virus à travers le monde, permettant ainsi de suivre leur évolution et leur propagation (Nextstrain.org).

L’Institut Suisse de Bioinformatique mène plusieurs projets visant à utiliser le traitement des données pour améliorer la santé, notamment dans le domaine du diagnostic du cancer ou du suivi des organismes pathogènes à partir de données génomiques :
https://www.sib.swiss/about/flagship-projects#spsp

L’avenir de la médecine – une interaction entre science des données et système de santé

L’intégration de la science des données dans la médecine évolue constamment. À mesure que de plus en plus de systèmes de santé adoptent les technologies numériques, le volume de données continuera d’augmenter. Parallèlement, les avancées en intelligence artificielle, en puissance de calcul et en stockage des données permettront un traitement encore plus rapide et plus exhaustif. L’objectif final est un système de santé dans lequel les diagnostics sont plus précis, les traitements plus personnalisés et les découvertes plus rapides.

Sources

 

1. Lewis CM, Vassos E. Polygenic risk scores: from research tools to clinical instruments. Genome Med. 18. Mai 2020;12(1):44.

2. Sadee W, Wang D, Hartmann K, Toland AE. Pharmacogenomics: Driving Personalized Medicine. Pharmacol Rev. Juli 2023;75(4):789–814.

3. Boss JM, Narula G, Straessle C, Willms J, Azzati J, Brodbeck D, u. a. ICU Cockpit: a platform for collecting multimodal waveform data, AI-based computational disease modeling and real-time decision support in the intensive care unit. J Am Med Inform Assoc JAMIA. 14. Juni 2022;29(7):1286–91.

4. Edfeldt K, Edwards AM, Engkvist O, Günther J, Hartley M, Hulcoop DG, u. a. A data science roadmap for open science organizations engaged in early-stage drug discovery. Nat Commun. 5. Juli 2024;15(1):5640.

5. Hadfield J, Megill C, Bell SM, Huddleston J, Potter B, Callender C, u. a. Nextstrain: real-time tracking of pathogen evolution. Kelso J, Herausgeber. Bioinformatics. 1. Dezember 2018;34(23):4121–3.

(Image: Google DeepMind / Unsplash)