Data Science

Data Science in der Medizin

Der Bedeutung von Personendaten wird im Gesundheitsbereich längst gebührend Stellenwert beigemessen. Mit Hilfe von Computeranalysen werden sie ausgewertet und sollen Erkenntnisse über die optimale Behandlung von Patienten liefern, Einsichten in komplexe Krankheiten bringen oder Voraussagen über den Verlauf einer Erkrankung ermöglichen. Dadurch erhoffen sich Forschende und Mediziner eine Qualitätssteigerung und Effizienzgewinne in der Behandlung von Patienten. Doch wie überall im Umgang mit sensiblen Daten beschäftigt sich auch der Gesundheitsbereich mit Fragen zum Datenschutz und zu den Nutzungsrechten von Daten.

Forschen an biomedizinischen Daten

Vermutlich kennt jeder von uns eine Person, die von Krebs betroffen ist. Doch warum erkranken manche Menschen an Krebs und andere nicht? Kann unser Erbgut dazu beitragen, komplexe Krankheiten wie Krebs oder Diabetes besser zu verstehen, womöglich sogar vorauszusagen? Können nichtgenetische gesundheitsbezogene Daten beim Verständnis von Krankheiten helfen? Eine Antwort auf diese Fragen versucht das Forschungsgebiet der Data Science (Datenwissenschaft) zu geben. Unter Data Science versteht man die Auswertung von und die Methodik für die Arbeit mit riesigen Datenmengen. Dabei werden statistische Methoden und maschinelles Lernen verwendet, um neue Erkenntnisse und Nutzen aus den Daten zu ziehen. Durch den technischen Fortschritt in den Bereichen Life Science und Medizin werden in Spitälern täglich unzählige Personendaten generiert und gespeichert. Dabei handelt es sich um biologisches Material, genetische und nichtgenetische gesundheitsbezogene Daten (Echtzeitwerte wie Blutdruck oder Puls, Blutwerte, MRI-Daten oder Antworten auf Befragungen, Gesundheitszustand, krankheitsspezifische Mortalitätsrate etc.). Patientinnen und Patienten können mittels einer Zustimmungserklärung diese Daten der Forschung zur Verfügung stellen. Das Humanforschungsgesetz regelt dabei, wie mit diesen privaten Daten umgegangen werden muss.

Doch was machen Forschende eigentlich mit diesen Daten? Die Verwendung und Bearbeitung biomedizinischer Daten durch unterschiedliche Informatikanwendungen wird in der Fachliteratur als biomedizinische Informatik bezeichnet. Mit intelligenten Algorithmen können solche Daten immer besser ausgewertet und für die Diagnostik und Behandlung nutzbar gemacht werden. Die vorhandenen medizinischen Daten, die täglich in den Spitälern entstehen, werden dafür mit Hilfe von Computerprogrammen ausgewertet und moduliert mit dem Ziel, die Effizienz und somit die Qualität der Pflege zu steigern. Darüber hinaus finden die Daten aber auch Anwendung in der Grundlagenforschung über Krankheiten und tragen so zu einem besseren Verständnis und letztendlich zu neuen oder verbesserten Behandlungsmethoden bei.

Frühwarnsystem für die Intensivstation

Die Anwendungsbereiche der biomedizinischen Informatik sind weitreichend. Professor Gunnar Rätsch von der ETH Zürich befasst sich beispielsweise in einem Projekt mit der Auswertung von Daten aus Intensivstationen. Sämtliche Daten, die dort bei der täglichen Betreuung und Überwachung von Patienten während der letzten Jahre aufgezeichnet wurden, nutzt er als Grundlage für seine Analysen. Aus den Datensätzen will er mit seiner Forschungsgruppe in Zusammenarbeit mit Klinikern ein Frühwarnsystem entwickeln, um beispielsweise Organversagen vorherzusehen. Dazu nutzt Gunnar Rätsch Algorithmen, die es erlauben, bestehende Muster in diesen Daten zu identifizieren, die einem Organversagen vorausgehen. Ein Mensch könnte in der riesigen Datenmenge keine wiederkehrenden Strukturen erkennen. Der Algorithmus erkennt jedoch über die Analyse einer steigenden Anzahl von Datensätzen und mit geeignetem Training mit der Zeit diese Muster und kann dann die Wahrscheinlichkeit berechnen, mit der ein Patient ein Organversagen erleiden wird. Vorläufige Tests mit dem System scheinen vielversprechend. Allerdings müssen noch die optimalen Schwellenwerte aller Parameter ermittelt werden. Zudem ist weitere Forschungsarbeit nötig, um mit fehlenden Messwerten und variablen Messintervallen umzugehen, damit möglichst alle Ereignisse korrekt vorausgesagt werden können.

Auch in der Krebsforschung finden biomedizinische Personendaten bereits ihren Einsatz. Diese komplexe Erkrankung basiert in der Regel nicht auf einer einzigen Veränderung im Erbgut, sondern auf weitgehend noch unverstandenen Interaktionen zwischen Millionen einzelner Basenpaare. Gunnar Rätsch möchte anhand dieser Daten aufklären, warum manche Patienten auf eine Immuntherapie ansprechen und andere nicht. Dank der Freigabe von Genomdaten für die Forschung haben Wissenschaftler wie Gunnar Rätsch die Möglichkeit, Daten von Krebspatienten und gesunden Patienten zu vergleichen und zu erforschen. Die Daten sind dabei verschlüsselt und nur auf speziell gesicherten Rechnern mit streng reguliertem Zugang verfügbar, um den Datenschutz jederzeit zu gewährleisten.

Die Analyse grosser Mengen an Personendaten ist eine Herausforderung

Big-Data-Forschung in der Medizin steckt noch in den Kinderschuhen. Die besondere Herausforderung bei Big-Data-Projekten ist einerseits die Menge, andererseits die Grösse der Datensätze, die nur mit Hochleistungscomputern zu bewältigen ist. Die Datensätze bewegen sich in der Grössenordnung von einem Petabyte, was ungefähr dem Speicherplatz von 500 handelsüblichen Computern entspricht.

Oftmals sind die Daten aufgrund ihrer Herkunft aus verschiedensten Systemen und Quellen sehr heterogen. Das bedeutet einen enormen zusätzlichen Aufwand, diese zu harmonisieren und so für die Forschung vollumfänglich nutzbar zu machen. Das Fehlen von einzelnen Daten in Messreihen oder unterschiedliche Aufzeichnungsintervalle verschiedener Gesundheitsparameter sind eine zusätzliche Herausforderung für die Forschenden. Häufig sind die Verfahren und Systeme für die Messung und Speicherung von Personendaten in Spitälern historisch gewachsen und unterscheiden sich stark je nach Einrichtung. Um Big-Data-Forschung zu betreiben und gesicherte Erkenntnisse zu gewinnen, ist es unabdinglich, national und letztendlich international interoperable Datensätze für die Forschung zur Verfügung zu haben. Dieser Herausforderung hat sich in der Schweiz das «Swiss Personalized Health Network» (SPHN) angenommen.

Datensicherheit

Sobald Daten gespeichert vorliegen, stellen Hacker ein Risiko dar, da sie Informationen aus den gesammelten Gesundheitsdaten missbrauchen könnten. Datenklau und -verkauf sowie Datenmanipulation, die gerade im Gesundheitsbereich schwerwiegende Folgen haben könnte, sind hierbei ein Thema. Darum werden diese sensitiven Daten auf speziell gesicherten Servern abgelegt. Der Datenschutz steht an oberster Stelle. Der Leitfaden des Bundes für die Bearbeitung von Personendaten im medizinischen Bereich sieht auch klare Vorgaben zur Datensicherheit vor. Unter anderem ist die Zugangskontrolle und wie auf die Daten zugegriffen werden kann klar vorgeschrieben.

Die Forschung ist zudem den medizinischen Ethikregeln unterworfen. Das Humanforschungsgesetz (HFG) legt dabei die ethischen und rechtlichen Grundsätze und Schranken fest, um den Schutz des Menschen in einem hohen Masse zu gewährleisten. Die Ethikregeln geben den Forschenden definierte Leitplanken vor, wie beispielsweise das Nichtschadensprinzip. Finden Forschende in ihren Daten Hinweise auf eine schwere Krankheit, wären sie verpflichtet, diese der betroffenen Person zu melden, falls der Schaden dadurch verhindert werden könnte. Betroffene haben jedoch immer das Recht auf Selbstbestimmung und können daher im Vorfeld festlegen, ob sie in einem solchen Fall diese Information erhalten möchten oder nicht. Dieses Beispiel zeigt die hohe Sensibilität der Daten und die Notwendigkeit für eine streng kontrollierte und klare Regelung mit deren Umgang.

Ausblick

In der Schweiz wird derzeit aktiv am Aufbau verschiedener Plattformen zur Speicherung persönlicher Gesundheitsdaten gearbeitet. Wir müssen letztlich selbst entscheiden, wem wir unsere Daten anvertrauen. Die Datenhoheit liegt danach je nach gewählter Plattform bei den Mitgliedern selbst, oder beim jeweiligen Anbieter. Die Idee bei den verschiedenen Anbietern ist ähnlich: Daten an einem zentralen Ort zu sichern und jedem Einzelnen die Möglichkeit zu geben, seine Daten Ärzten oder der Forschung zugänglich zu machen.

Data-Science-Forschung im Gesundheitsbereich ist derzeit noch nicht ausgelotet und sie birgt viel Potenzial für das Verständnis von Krankheiten, die Verbesserung der Diagnose und die Behandlung von Krankheiten. Langfristig wird erwartet, dass der Einbezug von Big-Data-Forschung und Data Science im Allgemeinen die Medizin nutzbringend verändern wird.

Weiterführende Informationen