Datenharmonisierung und Publikation - Verknüpfung der Gesundheitsbereiche durch Standards

Um Gesundheitsstudien und ihre Daten FAIR (Findable, Accessible, Interoperable and Reusable ) zu machen, haben wir eine Publikationsleitline und ein Metadatenschema mit Standards für die Beschreibung und den Austausch von Daten entwickelt.

Image

Die Publikationsleitlinie beschreibt Anforderungen und gibt Empfehlungen für die Veröffentlichung von Forschungsdaten aus gesundheitsbezogenen Studien, mit einem Schwerpunkt auf den von NFDI4Health entwickelten Services. Sie klassifiziert die Arten von Ressourcen, die veröffentlicht werden sollen, wie z. B. Studienbeschreibungen oder Arten von Studiendokumenten oder Datensammlungen, umreißt Lizenzierung für solche Ressourcen sowir für die Verwendung von universellen Identifikatoren. Zusätzlich definiert sie Formatierungs- und Metadatenbeschreibungsanforderungen für die veröffentlichten Ressourcen und ihre Daten.

Für die Metadaten, die die Ressourcen beschreiben, bezieht sich die Publikationsleitlinie auf das maßgeschneiderte NFDI4Health-Metadatenschema, das in unseren Services implementiert ist. Dieses Metadatenschema kombiniert gemeinsame Elemente und ihre kontrollierten Vokabulare, die für alle von NFDI4Health abgedeckten Domänen und Anwendungsfälle relevant sind. Es ist modular aufgebaut und umfasst auch Module, die spezifischer für bestimmte Unterdomänen sind.

Publikationsleitlinie

Eines der Ziele von NFDI4Health ist es, Daten, die in gesundheitsbezogenen Studien gesammelt wurden, FAIR zu machen. Der erste Schritt dazu ist die Veröffentlichung umfassender Informationen über den Kontext und die Zugänglichkeit der Daten und Metadaten. Darüber hinaus enthalten Studiendokumente weitere detaillierte Informationen, die für die korrekte Interpretation der gesammelten Daten erforderlich sind und daher ebenfalls veröffentlicht werden sollten. Die Publikationsleitlinie von NFDI4Health beschreibt die Anforderungen für die Veröffentlichung von Forschungsdaten aus gesundheitsbezogenen Studien des German Central health Study Hub. Wir ermutigen Forschende, die ihre Studien auffindbar machen und entsprechende Forschungsdaten FAIR machen möchten, sich an die Standards von NFDI4Health zu halten.

Image

Metadatenschema

Das NFDI4Health-Metadatenschema dient der Umsetzung der FAIR-Prinzipien (Findable, Accessible, Interoperable und Reusable) für Daten aus der klinischen, epidemiologischen und öffentlichen Gesundheitsforschung. Das Metadatenschema ermöglicht die standardisierte Veröffentlichung von Gesundheitsressourcen zugehörigen Metadaten auf dem German Central Health Study Hub. Obwohl ursprünglich von der NFDI4Health Task Force COVID-19 entwickelt und auf COVID-19-Studien zugeschnitten, begünstigt der allgemeingültige Aufbau des Metadatenschema die Einführung weiterer Ressourcentypen wie Register, Sekundärdatenquellen und verschiedener Studiendokumente. Das Metadatenschema ist auch auf andere Gesundheitsbereiche erweiterbar, da eine modulare Struktur zugrunde liegt, die Basis- und Use-Case bezogene Metadatenelemente in generischen und anwendungsspezifischen Modulen erfasst. Die meisten Elemente wurden primär aus etablierten Modellen adaptiert, einschließlich DataCite, ClinicalTrials.gov, DRKS, Maelstrom und MIABIS.

Das Core Modul des Metadatenschema erfasst Informationen, die üblicherweise von jeder Gesundheitsressource gesammelt werden. Ressourcentyp- und/oder Use-Case-spezifische Module sammeln währenddessen Beschreibungen von Ressourcen bestimmter Typen oder aus bestimmten Gesundheitsbereichen. Bibliografische Informationen wie der Titel der Ressource, Beschreibung und Akronyme sind im Core Module enthalten, zusammen mit Informationen über Mitwirkende und Identifikationsnummern von relevanten Ressourcen, die im Health Study Hub oder anderswo registriert sind. Elemente, welche andere Module bedingen, sowie Herkunftsdetails über die Veröffentlichung der Ressource sind ebenfalls enthalten.

Für Design- und Datenzugangsinformationen bietet das Metadatenschema ein Designmodul, das Merkmale umfasst, die bestimmten Ressourcentypen zugehörig sind. Für Studien und Unterstudien unterscheidet das Modul zwischen interventionellen und nicht-interventionellen Studiendesigns und bietet gewidmete Abschnitte für Aspekte jedes Designtyps. Das Modul liefert auch beschreibende Informationen über die Studienfokus und -population, Informationen über Rekrutierung und Stichprobengröße. Ein Abschnitt mit administrativen Informationen deckt Details über Ethikvotum, Status und Daten der Studie ab, zusammen mit gesonderten Abschnitten für Eignungskriterien und Outcome/Zeitpunkte. Informationen über die Datenfreigabe sind ebenfalls enthalten und falls affirmativ, aktivieren das Modul "Record Linkage”. Aufgrund mehrerer überschneidender Merkmale gelten die meisten Abschnitte des Design Moduls auch für Register und Sekundärdatenquellen.

Das Modul "Nutritional Epidemiology” bietet Informationen, hauptsächlich bezogen auf in relevanten Studien angewendete Instrumente zur Ernährungsbewertung. Das Modul "Chronic Dieseases” fokussiert sich auf Inzidenz und Prävalenz von Erkrankungen und gibt die Quellen an, aus denen die Daten generiert wurden. Das dritte Modul bietet rechtliche, Einwilligungs- und Budgetinformationen, die für die Ermöglichung des Record Linkage erforderlich sind. Module, die klinische Studien und Bildgebungs-/Radiomiksmetadaten bereitstellen, müssen noch implementiert werden. Alle Module umfassen obligatorische, bedingte und optionale Elemente.

Das Schema ist sowohl im Excel-Format als auch auf der Platform ART-DECOR für maschinenlesbaren Output verfügbar. Zudem wurde das MDS auf HL7's FHIR abgebildet. Entsprechend wurden FHIR-Profile erstellt und auf Simplifier veröffentlicht. Um die gemeinsame Nutzung von Metadaten durch datenhaltende Organisationen zu erleichtern, wird das Metadatenschema auch von Local Data Hubs an mehreren NFDI4Health-Partnerstandorten implementiert.

Die aktuelle Version V3_3 des NFDI4Health-Metadatenschemas finden Sie hier.

Image

Unsere Services

Health Study Hub

Der German Central Health Study Hub ermöglicht Wissenschaftler:innen, ihre Projektcharakteristika, Dokumente und Daten im Zusammenhang mit ihrem Forschungsvorhaben in einer FAIRen Weise zu veröffentlichen oder Informationen über vergangene und laufende Studien finden.

Data Train

Das fächerübergreifende Ausbildungsprogramm Data Train, ein Kernelement des NFDI4Health-Ausbildungskonzepts, zielt darauf ab, die nächste Generation von datenkundigen Forscher:innenn in den biomedizinischen Wissenschaften auszubilden.

Personal Health Train

Um datengesteuerte Innovationen in der Medizin zu fördern, haben wir eine verteilte Analyseinfrastruktur entwickelt, die die Forschung an sensiblen Daten ohne vorherige Datenfreigabe ermöglicht und gleichzeitig verschiedene Datenformate unterstützt: den Personal Health Train.

Local Data Hub

Mit dem LDH liefern wir eine Web-Lösung für transparentes und FAIRes DataSharing. Von der Suche im German Central Health Study Hub gelangen Interessenten zu den Projekten in Ihrer lokalen Plattform zum Forschungsdatenmanagement – dem Local Data Hub.

Datenpublikation

NFDI4Health schafft Verfahren für die FAIRe Veröffentlichung von Gesundheitsstudien ohne den Schutz der Daten zu gefährden. NFDI4Health hat einen Metadatenstandard und ein Verfahren für die Veröffentlichung von Gesundheitsstudien und deren Daten entwickelt, um Gesundheitsdaten FAIR zu machen.

Datenharmonisierung

Um Gesundheitsstudien und ihre Daten FAIR (Findable, Accessible, Interoperable and Reusable - auffindbar, zugänglich, interoperabel und wiederverwendbar) zu machen, haben wir Leitlinien und Standards für die Beschreibung von Metadaten und den Datenaustausch entwickelt.

Datenqualitätsbewertung

Es ist paradox: Einerseits hängt eine gute wissenschaftliche Arbeit von einer hohen Datenqualität ab. Auf der anderen Seite wird zwar viel Aufwand in das Design und die Durchführung von Studien gesteckt, nicht aber in die Datenqualitätsbewertungen. Wir helfen, die effiziente Durchführung solcher Bewertungen zu erleichtern.

DataSHIELD

Ausbau von dezentralen Forschungsprojekten mit DataSHIELD: Bisher verhindern Datenschutzbedenken und das Fehlen von spezieller IT-Infrastruktur die Ausweitung von institutsübergreifenden Forschungsprojekten. Das soll DataSHIELD ändern.