News

Am 20. Und 21. Juni veranstaltete das Bundesministerium für Gesundheit die „Data for Health Conference 2023“. Führende Expert*innen aus den USA und Europa diskutierten hier die Rahmenbedingungen und Möglichkeiten der Nutzung von Gesundheitsdaten.  NFDI4Health nutze die Möglichkeit dem Fachpublikum aus Wissenschaft und Politik zwei innovative Ansätze basierend auf der Code2Data-Technoligie vorzustellen

Vorstellung von Code2Data Technologien auf der „Data for Health Conference 2023“

Föderierte Datenanalyse

Gesundheitsforschung ist zu weiten Teilen auf die Auswertung personenbezogener Gesundheitsdaten angewiesen. Das Teilen und die Möglichkeiten zur Nachnutzung dieser ist jedoch stark eingeschränkt.  So sind Einverständniserklärungen von Probanden oft nicht auf andere Forschungsziele übertragbar oder unterliegen verschiedenen gesetzlichen Regelungen. Zusätzlich gibt es beträchtliche Einschränkungen für Institute, personenbezogene Gesundheitsdaten mit anderen Kooperationspartnern, innerhalb eines Forschungsprojektes, zu teilen.

Innovative Ansätze wie die Code2Data-Technologien sind entstanden, um diesen Herausforderungen zu begegnen. Ziel ist die Schaffung einer kollaborativen Forschungsumgebung. Föderierte Datenanalyse ermöglicht hierbei die Wahrung von Datenschutz und Datensicherheit und stellt sicher, dass datenhaltende Organisationen die Kontrolle über ihre Daten nicht abgeben müssen. Hierzu wir ein sicherer Analyseraum geschaffen, der es ermöglicht Analysecode zu den Daten zu schicken und diese so auszuwerten, ohne das personenbezogene Daten preisgegeben oder übermittelt werden müssen. NFDI4Health stellte auf der Data for Health Conference 2023 zwei Verfahren zur föderierten Datenanalyse in einer Barcamp Session vor.

DataSHIELD und Personal Health Train

Im Bereich der verteilten Datenanalyse bietet DataSHIELD einen technologischen Ansatz. Hierbei stellen die datenhaltenden Organisationen ihre Individualdaten hinter einer Firewall in speziellen Datenbanken (Opal-Server) bereit. Die Daten selbst können hierbei von den Wissenschaftler*innen nicht eingesehen werden, sondern werden über einen mit der Opal-Datenbank verbundenen R-Server analysiert. Über Login-Prozesse können sich die Wissenschaftler*innen mit den Servern verbinden, um dann DataSHIELD Funktionen auszuführen und aggregierte Statistiken zu erhalten.

Als zweite Plattform wurde der Personal Health Train (PHT) vorgestellt. Die PHT stammt aus einer Analogie zur realen Welt: Eisenbahnsystem mit Zügen, Bahnhöfen und Zugdepots. Wie bei DataSHIELD ist Ziel dieses Designparadigmas, den Algorithmus zu den Daten zu bringen, anstatt vertrauliche Daten zum Algorithmus zu bringen, was die Einhaltung von Datenschutzanforderungen ermöglicht.
Jede Komponente des PHT ist mithilfe der Docker-Technologie containerisiert, um die Softwareentwicklung zu erleichtern. Darüber hinaus sind die Komponenten lose gekoppelt, um mögliche Erweiterungen und die Orchestrierung von (REST API) Webdiensten zu ermöglichen.

In der Barcamp Session diskutierten wir über die Vorteile und Grenzen, die mit diesen innovativen Ansätzen verbunden sind. Die Leitfrage unserer Diskussionen war hierbei: Wie kann ein verantwortungsvoller Umgang mit persönlichen Gesundheitsdaten erfolgen?