Comment l'apprentissage supervisé peut prédire les perturbations génétiques
Le cancer est l'une des maladies les plus répandues dans le monde. Le cancer est causé par des modifications de l'activité de gènes importants, par exemple leur inhibition ou leur suractivation. Cependant, ces changements d'activité sont difficiles à détecter. Les profils moléculaires des tumeurs peuvent fournir des preuves indirectes de la perturbation des gènes, mais sont techniquement difficiles.
Niko Beerenwinkel et son groupe de recherche ont mis au point une nouvelle méthode mathématique pour analyser les gènes moteurs du cancer et leurs profils de perturbation spécifiques aux patients. Pour ce faire, ils combinent les changements génétiques (mutations) avec les données sur les changements d'activité des gènes (données d'expression génétique) dans un réseau causal. Ces données sont appliquées à tous les patients pour déduire également les troubles non observés. L'équipe a démontré que sa méthode pouvait prédire les gènes moteurs du cancer et leurs profils de perturbation spécifiques aux patients dans des simulations, des écrans de perturbation CRISPR et des échantillons de cancer du sein.
L'identification des gènes moteurs du cancer est importante pour caractériser les cancers et établir des thérapies utiles.