Annotation Workbench - Verbesserung der Dateninteroperabilität durch semantische Annotation

Die Metadaten Annotation Workbench erleichtert die Kategorisierung von Datenerfassungsinstrumenten in klinischen und epidemiologischen Studien und verbessert dadurch die Auffindbarkeit und Nutzbarkeit der Daten für eine effektive Forschung.

Image

In klinischen und epidemiologischen Studien sind Datenerfassungsinstrumente wie Erhebungsbögen, Datenkataloge und Fragebögen unerlässlich für die Erfassung von Metadaten. Diese Instrumente enthalten komplexe und spezifische Informationen, die für die Forschung von großer Bedeutung sind. Die Kategorisierung, das heißt die Zuordnung einzelner Variablen zu bestimmten Kategorien, ermöglicht es, einen schnelleren Überblick und ein besseres Verständnis der Daten zu gewinnen.

Durch semantische Interoperabilität, die durch präzise und eindeutige Datenbeschreibungen erreicht wird, bleibt die Bedeutung der Daten erhalten.

Die Metadaten Annotation Workbench hilft dabei,

  • die Daten für studienübergreifende Vergleiche interoperabel zu machen,
  • die Daten für eine bessere Auffindbarkeit zu kategorisieren,

und trägt somit zur Wiederverwendbarkeit und Nachnutzung der Daten bei.

Die Metadaten Annotation Workbench unterstützt die Anreicherung von Excel-Sheets mit standardisierten semantischen Codes aus Terminologien und Ontologien. Die Webanwendung nutzt den Terminologiedienst SemLookP, um Zugang zu aktuellem und domänenrelevantem Vokabular zu erhalten und die Qualität sowie Interoperabilität der semantischen Codes sicherzustellen. Sie wird als Webanwendung mit einer benutzerfreundlichen Oberfläche bereitgestellt, die es Forschenden ermöglicht, Datenerfassungsinstrumente in Standardformaten wie Microsoft Excel-Tabellen hochzuladen. Der Annotationsprozess profitiert von den Such- und Visualisierungsfunktionen von SemLookP. Für die NFDI4Health-relevante Maelstrom Research Taxonomy ist eine automatische Annotationsfunktion integriert.

fas fa-info-circle

Was ist semantische Interoperabilität?

Semantische Interoperabilität ermöglicht die automatische und eindeutige Interpretation von Daten. In der Gesundheitsforschung ist semantische Interoperabilität entscheidend für studienübergreifende Vergleiche und Analysen, damit die Bedeutung der Daten erhalten bleibt. Terminologien und Ontologien spielen bei der Erzeugung semantischer Interoperabilität eine Schlüsselrolle, da sie standardisierte Konzepte und Beziehungen für die Annotation bereitstellen.

Beispiele

Annotation mit der Terminologie FoodEx2:

Im oberen Bereich werden die aktuelle Variable und Annotationen angezeigt. In diesem Beispiel wurde die Variable ‚vegetable‘ mit dem Konzept ‚Vegetables and vegetable products‘ annotiert. Unten links befindet sich die SemLookP basierte Suche, unten rechts werden Metadaten zum aktuellen Konzept angezeigt.

Annotation mit der medizinischen Terminologie SNOMED CT:

Im oberen Bereich werden die aktuelle Variable und Annotationen angezeigt. In diesem Beispiel wurde die Variable ‚Do you suffer from an acute or chronic mental illness?‘ mit dem Konzept ‚Chronic disease (disorder)‘ annotiert. Unten links befindet sich die SemLookP basierte Suche, unten rechts werden Metadaten zum aktuellen Konzept angezeigt.