T5.3 Use case “Secondary data and record linkage”
Hintergrund
In epidemiologischen Studien werden große Mengen an Informationen über jeden einzelnen Teilnehmenden gesammelt. Dabei kommen teils aufwendige Erhebungsmethoden (z.B. Befragungen) zum Einsatz, die sehr kosten- und zeitintensiv sein können. Mitunter kann es zu Wissens- und Erinnerungslücken bei den Teilnehmenden kommen. Die Nach- und Weiternutzung bereits vorliegender (Forschungs-)Daten, inklusive deren Metadaten, können Sekundäranalysen für individuelle Fragestellungen ermöglichen. Damit können kostenintensive eigene Primärerhebungen vermieden bzw. subjektiv berichtete Fragebogendaten um objektiv gemessene Daten ergänzt werden. Als relevante Ressourcen zur Nachnutzung kommen, neben Krankheitsregistern, Sekundärdatenquellen in Frage, in denen Individualdaten für andere Zwecke als die Forschung gespeichert werden. Zu diesen gehören beispielsweise von Krankenkassen zu Erstattungszwecken erhobene Leistungsdaten.
Veranschaulichung der Forschungsmöglichkeiten mit verknüpften Registern/Sekundärdaten.
Record Linkage, d.h. die Verknüpfung von Primärdaten mit Sekundär-/Registerdatenquellen oder die Verknüpfung verschiedener Sekundär-/Registerdatenquellen miteinander auf individueller Ebene, schafft Synergieeffekte. Das heißt, Record Linkage bietet die effizienteste Möglichkeit für die Gesundheitsforschung, bei der hochinformative, aber noch nicht ausreichend genutzte Daten gemeinsam genutzt und kombiniert werden, um Forschungsfragen zu beantworten, die mit herkömmlichen Ansätzen auf Basis einer einzelnen Datenquelle nicht beantwortet werden können. Auf diese Weise könnten Daten aus klinischen Studien mit medizinischen Versorgungsdaten oder sogar mit anderen sozialen Daten anreichert werden, was einen ganzheitlicheren Ansatz ermöglichen würde, wenn es z. B. um die Analyse der Wirksamkeit und Langzeittoxizität von Arzneimitteln geht. Die Nach- und Weiternutzung derartiger Daten und die Verknüpfung solcher Daten mit anderen Datenquellen für Forschungszwecke steht in Deutschland derzeit noch vor einigen zu lösenden Herausforderungen. Dazu gehören die für Deutschland geltenden strengen Datenschutzbestimmungen, ein fehlender eindeutiger Identifikator (Unique Identifier) und eine limitierte Daten-Interoperabilität wie einheitliche Datenstandards, -formate und Semantiken.
Unsere Ziele | |||||||
---|---|---|---|---|---|---|---|
|
Ergebnisse & laufende Arbeiten
In Zusammenarbeit mit TA2 "Standards for FAIR Data" und TA3 "Services" arbeiten wir an der Entwicklung eines Metadatenschemas und Standards sowohl fürs Datensatzverknüpfungen als auch für Sekundär-/Registerdaten. Dies beinhaltet:
Die Identifizierung vorhandener und fehlender Standards für die "Standardization and interoperability roadmap",
Die Erstellung eine Übersicht geeigneter Standards für ein Record Linkage mit Sekundär-/Registerdaten, d.h. die "Identifikation relevanter Datenformate, Standards und Terminologien für die Interoperabilität" (Lesen Sie mehr über Datenharmonisierung),
Die Integration von Metadatenfelder zu Sekundär-/Registerdaten und des Record Linkage-Moduls in den German Central Health Study Hub und in das dahinterliegende Metadatenschema,
Die Entwicklung eines Implementierungsleitfaden, insbesondere einer Beschreibung des Record Linkage-Moduls, für das Metadatenschema.
Screenshot einer Suche nach Metadaten der Sekundärdatenquelle "GePaRD" auf dem German Central Health Study Hub.
White Paper: Verbesserung des Record Linkage für die Gesundheitsforschung in Deutschland
In Deutschland ist es aktuell schwer, Gesundheitsdaten aus verschiedenen Quellen zu verknüpfen. Das behindert die Gesundheitsversorgung deutlich – auch gerade im Vergleich zu europäischen Nachbarländern. Um dem entgegenzuwirken, hat NFDI4Health mit weiteren Expert:innen, unter anderem aus der Medizininformatik-Initiative und dem Netzwerk Universitätsmedizin, ein White Paper zum Record Linkage erarbeitet. Das White Paper beschreibt die Hindernisse für eine effektive Nutzung von Gesundheitsdaten und liefert praktikable und bürokratiearme Lösungen, die im Einklang mit der Europäischen Datenschutz-Grundverordnung stehen. Das White Paper verfolgt einen interdisziplinären Ansatz Forschende bei ihren Projekten zur Verknüpfung von Datensätzen anzuleiten und zu unterstützen und gibt dem Gesetzgeber die folgenden 4 zentralen Empfehlungen:
Einführung eines eindeutigen Identifikators für Personen (Unique Identifier)
Etablierung von bereichsspezifischen Pseudonymen
Etablierung einer dezentral-föderierten Forschungsdateninfrastruktur mit zentralen Komponenten zur Datenverknüpfung
Aufbau einer zentralen Aufsichts- und Genehmigungsbehörde
Link zum White Paper | Pressemitteilung White Paper | News-Beitrag White Paper
Outreach Aktivitäten
NFDI4Health organisierte mehrere Veranstaltungen, um die Community einzubeziehen und Unterstützung zum Record Linkage anzubieten:
Über 20 Vorträge über den Status quo & unsere politischen Forderungen
Einige Beispiele
Über 20 Vorträge über den Status quo & unsere politischen Forderungen
Mehre Workshops zum White Paper, um Input von Experten zu erhalten
Einige Beispiele
Bereitstellung einer kommentierten Vorlage für ein Informed Consent-Formular
Informed Consent-Formular
Bereitstellung einer kommentierten Vorlage für ein Informed Consent-Formular
Das White Paper, unsere Outreach-Aktivitäten und die kommentierte Vorlage für ein Informed Consent-Formular wurden in Zusammenarbeit mit TA6 “Privacy & Data Access in Concert” entwickelt.
Publikationen
Abaza H, Shutsko A, Golebiewski M, Klopfenstein S, Schmidt CO, Vorisek CN, Brünings-Kuppe C, Clemens V, Darms J, Hanß S, Intemann T, Jannasch F, Kasbohm E, Lindstädt B, Löbe M, Orban E, Perrar I, Peters M, Sax U, Schulze MB, Schupp C, Schwarz F, Schwedhelm C, Strathmann S, Waltemath D, Wünsche H, Zeleke A. The NFDI4Health metadata schema (V3_3). Köln 2023. https://repository.publisso.de/resource/frl%3A6472531
Intemann T, Kaulke K, Kipker D-K, Lettieri V, Stallmann C, Schmidt CO, Geidel L, Bialke M, Hampf C, Stahl D, Lablans M, Rohde F, Franke M, Kraywinkel K, Kieschke J, Bartholomäus S, Näher A-F, Tremper G, Lambarki M, March S, Prasser F, Haber AC, Drepper J, Schlünder I, Kirsten T, Pigeot I, Sax U, Buchner B, Ahrens W & Semler S. White Paper: Verbesserung des Record Linkage für die Gesundheitsforschung in Deutschland. 2023. https://doi.org/10.4126/FRL01-006461895
Intemann T, Lettieri V, Kipker DK, Kuntz A, Ahrens W, Pigeot I, Buchner B, Sax U, Fluck J, Fröhlich H, Geok Ng H, Hahn H, Kirsten T, Lange JJ, Lassen-Schmidt B, Prause G, Richter A, Schmidt C. Informed Consent zum Record Linkage: Best Practice und Mustertexte. Publisso, 2023. https://doi.org/10.4126/FRL01-006399943
Pigeot I, Fröhlich H, Intemann T, Prause G, Wright MN. KI und die Nationale Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten (NFDI4Health). In: Dössel OS, Tobias; Rutert, Britta, editor. Künstliche Intelligenz in der Medizin. Denkanstöße aus der Akademie: Eine Schriftenreihe der Berlin-Brandenburgischen Akademie der Wissenschaften, Nr. 11. Berlin: Berlin-Brandenburgische Akademie der Wissenschaften; 2023. p. 62-74. https://edoc.bbaw.de/frontdoor/index/index/docId/3807
Pigeot I, Intemann T, Kollhorst B, Sax U, Ahrens W. FAIRifizierung von Real World Data für die Gesundheitsforschung: Ein Petitum für modernes Record Linkage. Prävention und Gesundheitsförderung. Präv Gesundheitsf (2022). https://link.springer.com/article/10.1007/s11553-022-00973-x
Ansprechpartner:innen
Prof. Dr. Iris Pigeot
Measure-Lead: T5.3 “Use case Secondary data and record linkage”
E-Mail: pigeot@leibniz-bips.de
Phone: +49 (0)228 73-60351
Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS GmbH
Achterstraße 30
D-28359 Bremen
Prof. Dr. Wolfgang Ahrens
Measure-Lead T5.3 “Use case Secondary data and record linkage”
E-Mail: ahrens@leibniz-bips.de
Phone: +49 (0)421 218-56822
Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS GmbH
Achterstraße 30
D-28359 Bremen