Personal Health Train

Personal Health Train

Verteilte Datenanalyse unter Wahrung der Privatsphäre

Hintergrund

Gesundheitsforschung sieht sich bei der Nutzung von gesundheitsbezogenen Daten mit großen Herausforderungen konfrontiert. Zum einen sind Forschungsdaten in vielen Fällen höchst sensibel, zum andern weisen sie oft einen hohen Grad an Heterogenität auf. Darüber hinaus herrscht ein allgemeiner Mangel an Standardisierung und Semantik, was zu einer zusätzlichen Fragmentierung der Forschungsdaten führt und die Datenanalyse erschwert. Trotz der augenscheinlichen Vorteile gemeinsamer Analysen verschiedener Gesundheitsstudien, schränken Datenschutzbedenken und eine mangelnde IT-Infrastruktur eine institutsübergreifende Nachnutzung von Forschungsdaten häufig ein. Das Ziel von NFDI4Health ist, Forschenden und Forschungseinrichtungen die

Bereitstellung und Wiederverwendung von gesundheitsbezogenen Forschungsdaten zu ermöglichen, ohne dass die datenhaltenden Organisationen die Kontrolle über ihre eigenen Daten abgeben müssen. Ein Ansatz dies Umzusetzen ist die föderierte Daten-Analyse mit dem Personal Health Train (PHT). Innerhalb der nationalen Forschungsdateninfrastruktur ergänzt der PHT den Central Search Hub (CSH) und den Local Data Hub (LDH), indem er die Möglichkeit bietet, Analysen auf verteilte und datenschutzfreundliche Weise durchzuführen. Im Gegensatz zur zentralisierten Analyse bringt der PHT den Algorithmus zu den Daten und nicht umgekehrt, so dass die Dateneigentümer die Kontrolle über ihre Daten behalten und die Daten an ihrem Ursprung bleiben.

Konzept

Das PHT-Konzept ist ein innovativer Ansatz zur Förderung datengesteuerter Analyse. Er bietet eine verteilte Analyseinfrastruktur, die Forschende den Zugang zu sensiblen Daten ermöglicht und gleichzeitig verschiedene Datenformate unterstützt. Der PHT basiert auf einer Analogie aus der realen Welt, die einem Eisenbahnsystem mit Zügen, Bahnhöfen und Zugdepots ähnelt. Im PHT-Ökosystem kapselt der Zug eine analytische Aufgabe, die in der Analogie durch die Güter repräsentiert wird. Der Datenanbieter spielt die Rolle einer erreichbaren Station, auf die der Zug zugreift. Die Station führt die Aufgabe aus und verarbeitet die verfügbaren Daten. Der Central Service (CS) dient als Depot und verwaltet die Zug-Daten.

Der Central Service (CS) dient als Depot und verwaltet die Zug-Orchestrierung, die Betriebslogik, die Geschäftslogik und die Datenverwaltung. Dieses Konzept stellt sicher, dass die Algorithmen zu den Daten und nicht die vertraulichen Daten zu den Algorithmen gebracht werden, um die Einhaltung der Datenschutzanforderungen zu gewährleisten. Hierdurch bietet der PHT einen verteilten, flexiblen Ansatz zur Nutzung von Daten in einem Netzwerk von Teilnehmenden, der die FAIR-Prinzipien berücksichtigt. In Deutschland arbeiten verschiedene Implementierungsinitiativen wie PADME oder PHT-meDIC als Teil des internationalen PHT Go FAIR Implementierungsnetzwerks  eng zusammen.

Image

Anwendung innerhalb der NFDI4Health

Um die Effektivität unserer Infrastruktur zu demonstrieren, führen wir 2 Anwendungsfälle in Zusammenarbeit mit der Radiologischen Universitätsklinik Köln (UHC) und Fraunhofer MEVIS durch. Hier wird der PHT eingesetzt, um synthetische Daten auf verteilte Weise zu erzeugen, die später der Datenharmonisierung dienen. Der mit Fraunhofer MEVIS entwickelte Anwendungsfall konzentriert sich auf die Erkennung von Nierentumoren bei Patienten anhand von Computertomographie-Bildern

von 2 verschiedenen Standorten. Mit diesen Daten zielt unser Anwendungsfall darauf ab, das Gesamtergebnis verschiedener Therapieansätze zu untersuchen. In dem mit der radiologischen Abteilung des UHC durchgeführten Anwendungsfall diente der Erkennung von Lungenkrebspatienten, bei denen die Datenharmonisierung aufgrund der vielen verschiedenen Geräte und Protokolle in der Praxis eine Schwierigkeit darstellt.

Image

Unsere Services

Health Study Hub

Der German Central Health Study Hub ermöglicht Wissenschaftler:innen, ihre Projektcharakteristika, Dokumente und Daten im Zusammenhang mit ihrem Forschungsvorhaben in einer FAIRen Weise zu veröffentlichen oder Informationen über vergangene und laufende Studien finden.

Data Train

Das fächerübergreifende Ausbildungsprogramm Data Train, ein Kernelement des NFDI4Health-Ausbildungskonzepts, zielt darauf ab, die nächste Generation von datenkundigen Forscher:innenn in den biomedizinischen Wissenschaften auszubilden.

Personal Health Train

Um datengesteuerte Innovationen in der Medizin zu fördern, haben wir eine verteilte Analyseinfrastruktur entwickelt, die die Forschung an sensiblen Daten ohne vorherige Datenfreigabe ermöglicht und gleichzeitig verschiedene Datenformate unterstützt: den Personal Health Train.

Local Data Hub

Mit dem LDH liefern wir eine Web-Lösung für transparentes und FAIRes DataSharing. Von der Suche im German Central Health Study Hub gelangen Interessenten zu den Projekten in Ihrer lokalen Plattform zum Forschungsdatenmanagement – dem Local Data Hub.

Datenpublikation

NFDI4Health schafft Verfahren für die FAIRe Veröffentlichung von Gesundheitsstudien ohne den Schutz der Daten zu gefährden. NFDI4Health hat einen Metadatenstandard und ein Verfahren für die Veröffentlichung von Gesundheitsstudien und deren Daten entwickelt, um Gesundheitsdaten FAIR zu machen.

Datenharmonisierung

Um Gesundheitsstudien und ihre Daten FAIR (Findable, Accessible, Interoperable and Reusable - auffindbar, zugänglich, interoperabel und wiederverwendbar) zu machen, haben wir Leitlinien und Standards für die Beschreibung von Metadaten und den Datenaustausch entwickelt.

Datenqualitätsbewertung

Es ist paradox: Einerseits hängt eine gute wissenschaftliche Arbeit von einer hohen Datenqualität ab. Auf der anderen Seite wird zwar viel Aufwand in das Design und die Durchführung von Studien gesteckt, nicht aber in die Datenqualitätsbewertungen. Wir helfen, die effiziente Durchführung solcher Bewertungen zu erleichtern.

DataSHIELD

Ausbau von dezentralen Forschungsprojekten mit DataSHIELD: Bisher verhindern Datenschutzbedenken und das Fehlen von spezieller IT-Infrastruktur die Ausweitung von institutsübergreifenden Forschungsprojekten. Das soll DataSHIELD ändern.
Wir benutzen Cookies

Wir verwenden erforderliche Drittinhalte (z.B. Scriptbibliotheken) um die Funktion unserer Seite zu gewährleisten. Wenn Sie dies nicht möchten, besuchen Sie unsere Seite bitte nicht.

Auf unserer Seite betten wir Drittinhalte von anderen Anbietern ein (z.B. Social Plugins, Kartendienste, externe Schriftarten). Wir haben auf die weitere Datenverarbeitung und ein etwaiges Tracking durch den Drittanbieter keinen Einfluss.

Wir setzen in diesem Rahmen auch Dienstleister in Drittländern außerhalb der EU ohne angemessenes Datenschutzniveau ein, was folgende Risiken birgt: Zugriff durch Behörden ohne Information, keine Betroffenenrechte, keine Rechtsmittel, Kontrollverlust.

Mit Ihrer Einstellung willigen Sie in die oben beschriebenen Vorgänge ein. Sie können Ihre Einwilligung mit Wirkung für die Zukunft widerrufen. Mehr Informationen finden Sie in unserer Datenschutzerklärung.