News

Uneinheitliche Datenstandards, Datenfehler sowie intransparente Wege der Datenaufbereitung und -darstellung sind wesentliche Stolpersteine in den Gesundheits- und Lebenswissenschaften. Um Handlungsfelder für einen systematischeren und transparenteren Umgang mit Datenqualität zu definieren, kamen vom 17.-18. November 2022 rund 140 Datenwissenschaftlerinnen und Datenwissenschaftler aus Fachgesellschaften, Dateninitiativen und Verbänden zum ersten gemeinsamen hybriden Workshop in Deutschland zu diesem Thema in Berlin zusammen.

Datenqualität muss stärker in den Fokus der Wissenschaft rücken
Expertinnen und Experten aus Fachgesellschaften, Dateninitiativen und Verbänden diskutierten das Thema Datenqualität Expertinnen und Experten aus Fachgesellschaften, Dateninitiativen und Verbänden diskutierten das Thema Datenqualität. (c) TMF

„Datenqualität muss stärker in den Fokus wissenschaftlichen Arbeitens rücken“, fordert der Organisator des Workshops Prof. Dr. Carsten Oliver Schmidt von der Universität Greifswald. „Wir brauchen einen systematischeren und transparenteren Umgang mit Datenqualität und initialen Datenanalysen, um die Gesundheits- und Lebenswissenschaften effizienter und transparenter zu gestalten. Es ist auch ein großes Problem, dass eine systematische und transparente Beschreibung von Datenqualität weder von Mittelgebern, noch von wissenschaftlichen Zeitschriften eingefordert wird. Dadurch besteht auch wenig Druck, Defizite transparent zu machen. Dies senkt die Reproduzierbarkeit von Ergebnissen in den Wissenschaften.“

Datenqualitätsbewertungen müssen ein transparenter Teil wissenschaftlichen Arbeitens werden

Auf dem Workshop unterstrichen die Datenwissenschaftlerinnen und -wissenschaftler deshalb, dass strukturierte Datenqualitätsbewertungen ein bedeutender Teil jeder wissenschaftlichen Studie sein sollten. Die Ergebnisse dieser Bewertungen sollten möglichst nachnutzbar verfügbar und transparent dargestellt werden. Ausrichter der Veranstaltung waren die Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), die Technologie- und Methodenplattform für die vernetzte medizinische Forschung (TMF), die Deutsche Gesellschaft für Epidemiologie (DGEpi), die Deutsche Region der Internationale Biometrische Gesellschaft (IBS-DR), die Deutsche Gesellschaft für Sozialmedizin und Prävention (DGSMP), die internationale Initiative STRengthening Analytical Thinking for Observational Studies (STRATOS) sowie das Konsortium Nationale Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten (NFDI4Health), die den Workshop mit Mitteln der Deutschen Forschungsgemeinschaft förderte.

„Wir als NFDI4Health haben uns entschieden, den Workshop zu fördern, da die Datenqualität eine entscheidende Rolle dabei spielt, ob Forschungsdaten nachnutzbar sind“, erklärt Prof. Dr. Juliane Fluck, Sprecherin der NFDI4Health und Leiterin des Programmbereichs „Wissensmanagement“ bei ZB MED – Informationszentrum Lebenswissenschaften. Sie ergänzt: „Das übergeordnete Ziel von NFDI4Health ist es, die klinische und epidemiologische Forschungsgemeinschaft bestmöglich dabei zu unterstützen, ihre Daten in Übereinstimmung mit Datenschutzbestimmungen und ethischen Grundsätzen mit der Nutzergemeinschaft zu teilen und im Interesse der Verbesserung der Gesundheit der Bevölkerung neue Möglichkeiten der Datenanalyse innerhalb der NFDI zu schaffen.“

Der Umgang mit Datenqualität in den Gesundheitswissenschaften ist durch ein beeindruckendes Paradoxon gekennzeichnet. Einerseits hängt jede belastbare wissenschaftliche Arbeit und Aussage zu drängenden Fragen hinsichtlich Gesundheit, Krankheit, Prävention, Therapie und Krankheitsfolgen von einer hohen Datenqualität ab. Andererseits steht das Thema Datenqualität in der Breite der Gesundheits- und Lebenswissenschaften nicht ausreichend im Fokus. Unzureichende Datenhaltung, fehlende Nutzung von Standards und wenig aussagekräftige Beschreibungen von Datensätzen sind wichtige Gründe dafür, dass viele Datenwissenschaftlerinnen und Datenwissenschaftler einen großen Teil ihrer Zeit darauf verwenden, auswertbare Datenkörper zu schaffen. „Das verschwendet unnötigerweise Ressourcen und schafft Fehlerpotenziale“, konstatiert Dr. Nicole Rübsamen, Sprecherin der AG Epidemiologische Methoden der DGEpi.

„Eine systematische Berichterstattung über Aktivitäten zur Überprüfung und Aufbereitung von Daten im Vorfeld der eigentlichen statistischen Analysen fehlt oder ist oft nicht nachvollziehbar“ sagt Prof. Marianne Hübner von der Michigan State University und Co-Sprecherin der STRATOS Initiative. In Anlehnung an die Leitlinien zum Reporting von Studien in den Gesundheitswissenschaften, koordiniert vom EQUATOR Netzwerk in Oxford, sollten daher etwa Kriterien zur Beschreibung von Datenqualität erstellt werden. Für überprüfte Datensätze könnte dies grundsätzlich in Form strukturierter Berichte erfolgen.

Handlungsoptionen liegen vor, werden aber unzureichend genutzt

Forschung und Lehre berücksichtigen bestehende Handlungsoptionen noch zu wenig. Diese reichen von Datenstandards über Datenqualitätskonzepten bis hin zu Software zur Erleichterung von Datenqualitätsbewertungen. Vor diesem Hintergrund bot der durchgeführte Workshop ein Forum zur Diskussion effizienterer und transparenterer Gestaltungsprozesse. Gleichzeitig verdeutlichte er die Notwendigkeit weiterer Abstimmungen, um ein besser harmonisiertes Vorgehen in der Forschungspraxis zu erreichen. „Die TMF Arbeitsgruppe Datenqualität und Transparenz der TMF e.V. hat es sich deshalb in Kooperation mit weiteren nationalen und internationalen Gesellschaften und Netzwerken zum Ziel gesetzt, Empfehlungen, Standards und Werkzeuge zur Qualitätssicherung und Datenbewertungen weiterzuentwickeln“ so Carsten Oliver Schmidt, der die Arbeitsgruppe leitet.

ÜBER NFDI4HEALTH

NFDI4Health ist Teil der von Bund und Ländern geförderten Nationalen Forschungsdateninfrastruktur (NFDI). NFDI4Health hat zum Ziel, ein umfassendes Inventar deutscher epidemiologischer, Public-Health und klinischer Studiendaten aufzubauen. Die Erfassung und Analyse dieser Daten sind wesentlich zur Entwicklung neuer Therapien, übergreifender Versorgungsansätze und präventiver Maßnahmen. Personenbezogene Gesundheitsdaten verlangen einen besonderen Schutz. Erklärtes Ziel von NFDI4Health ist es daher, Sicherheit und Nutzbarkeit zu vereinen. Das Konsortium setzt sich aus 17 Partnern verschiedener Fachdisziplinen zusammen. Insgesamt 48 namhafte Institutionen aus dem Gesundheitsbereich sind beteiligt.

Die Hauptziele von NFDI4Health sind:

  • die Auffindbarkeit von und den Zugang zu strukturierten Gesundheitsdaten aus klinischen und epidemiologischen Studien, Krankheitsregistern, administrativen Gesundheitsdatenbanken und der öffentlichen Gesundheitsüberwachung in Deutschland zu ermöglichen;
  • Implementierung eines Rahmens für die zentrale Suche und den Zugang zu bestehenden dezentralen Infrastrukturen für epidemiologische und klinische Studiendaten;
  • Erleichterung der gemeinsamen Nutzung von Daten, der Verknüpfung von Datensätzen, der harmonisierten Bewertung der Datenqualität und der geteilten Analyse von personenbezogenen Gesundheitsdaten;
  • Ermöglichung der Entwicklung und des Einsatzes neuer, maschinell verarbeitbarer Zustimmungsmechanismen und innovativer Datenzugangsdienste;
  • Unterstützung der Zusammenarbeit zwischen klinischer Forschung, Epidemiologie und öffentlichem Gesundheitswesen;
  • Förderung der Interoperabilität der derzeit fragmentierten IT-Lösungen in Bezug auf Metadaten-Repositories, Kohortendurchsuchung, Datenqualität und Harmonisierung.

Wissenschaftlicher Ansprechpartner:

Prof. Dr. Carsten Oliver Schmidt, Universitätsmedizin Greifswald, Tel.: +49 3834 867713,

E-Mail: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein.