Als Data Dictionary wird in klinischen Studien ein Katalog der Beschreibungen der zu erfassenden Parameter verstanden, d.h. alle Variablennamen mit Datentypen, Formaten und möglichen Antwortoptionen und deren Kodierung. Ohne Data Dictionary ist ein Verständnis von geteilten Datensätzen für Dritte unmöglich. In vielen Projekten wird eine tabellarische Beschreibung der Variablen in Textform veröffentlicht, aber die Beschreibung der einzelnen Spalten ist häufig unkonkret und missverständlich.
Im Rahmen des Workshops wurde ein bereits abgestimmtes, minimales Informationsmodell für Data Dictionaries vorgestellt [1], welches bereits viele verbreitete Formate untersucht und vereinheitlicht hat. Danach wurde in kleineren Gruppen diskutiert, ob das Modell die Anforderungen aus der Praxis hinreichend abdeckt und in welcher Form man das Modell zukünftig umsetzen und nutzen könnte. Die Teilnehmer:innen waren sich einig, dass solche Abstimmungen auch im Hinblick auf europäische Initiativen wie EOSC und EHDS von Bedeutung sind. Die neue EFMI Arbeitsgruppe "FAIR data HRPO" [2] wird sich mit diesem und weiteren Themen beschäftigen.
News
FAIR Data Dictionaries als Beitrag zur besseren Beschreibung von Datensätzen
Unter dem Motto "Caring is Sharing - Exploiting Value in Data for Health and Innovation" trafen sich vom 22. bis 25. Mai Expert:innen aus ganz Europa, um die neusten Entwicklungen zum Thema Datenteilen im Gesundheitsbereich zu besprechen. Im Folgenden berichtet Matthias Löbe, der die NFDI4Health auf der Veranstaltung vertrat, von seinem Beitrag.