Häufig gestellte Fragen - FAQ

Hier finden sie Antworten zu allgemeine Fragen über Metadaten und HMC. Sollte Sie weiterführende Fragen haben, wenden Sie sich bitte an unser Office oder den für Sie passenden Metadaten-Hub.

Sollten Sie Fragen zur HMC Projektausschreibung haben, finden Sie hier FAQs dazu.

Metadaten sind Daten über Daten.

Metadaten werden immer dann erstellt und verwendet, wenn es um die Dokumentation von wissenschaftlicher Tätigkeit und den daraus entstehenden Daten geht. Sie enthalten die Informationen die das Auffinden, die Abrufbarkeit, die Nachvollziehbarkeit sowie die Nachnutzung von Daten im Sinne der FAIR-Prinzipien ermöglichen.

Eine detailliertere Definition des Begriffes Metadaten und anderer relevanter Begriffe finden Sie im Glossar.

Forschungsdaten sind oft komplex. Ohne zusätzliche Informationen zum Kontext bleiben sie unverständlich, was eine Zusammenarbeit erschwert.

Genau hier können Metadaten helfen: Durch das Anfügen von Kontextinformation, wie z.B. dem verwendeten Versuchsaufbau, wird ein Datensatz allgemein verständlich und leichter wiederzuverwenden. Metadaten machen einen Datensatz zitierbar und können die Provenienz von Daten dokumentieren.

Metadaten erhöhen folglich die Sichtbarkeit von Forschungsdaten und die Reputation des Autors.

Eine der größten Hürden für das Erfassen von Metadaten - deren einfache Verfügbarkeit - lässt sich am Zeitpunkt der Erfassung festmachen.

Der Aufwand Metadaten nachträglich zu erheben und einem Datensatz anzufügen ist oft erheblich, daher sollte die Erhebung von Metadaten schon möglichst während der Erhebung der Daten selber geschehen

Hier sind Informationen direkt verfügbar und können auf oft einfache Weise automatisch oder semi-automatisch erfasst und mitgespeichert werden. Das Wissen des Forschers bezüglich der Erhebung, Bearbeitung und Analyse von Forschungsdaten kann hier strukturiert festgehalten werden und geht so nicht verloren.

Die Frage, welche Metadaten die „richtigen“ für einen bestimmten Datensatz sind, hängt vom wissenschaftlichen Kontext und den Daten selbst ab. Die folgenden Themenfelder sind sehr wichtig und sollten bedacht werden:

Vokabularien: Zur Beschreibung eines Datensatzes sollte ein bestehendes, anerkanntes und kontrolliertes Vokabular genutzt werden. Das stellt sicher, dass die erstellte Beschreibung allgemein verständlich und mit anderen Datensätzen interoperabel bleibt.

PID: Die Vergabe von persistenten Identifikatoren (engl. persisten identifier, PIDs), wie z.B. DOIs für Forschungsdaten, kann es ermöglichen Daten dauerhaft auffindbar und zitierfähig zu machen. Damit steigen die Reputation und Sichtbarkeit des Autors. PIDs können ein Baustein sein, Metadaten maschinenlesbar zu machen.

Repositorien: Um Daten zu veröffentlichen, muss ein passendes Repositorium identifiziert werden. Anforderungen und Bedarfe an die Qualitätskontrolle der eingespeisten Daten und/oder die Vorhaltezeit von Daten können fachgebietsspezifisch sehr unterschiedlich sein. Re3Data oder die Datenbanken von NIH und NHS können gute Startpunkte sein, um ein passendes Repositorium zu finden.

Lizenzierung: Eine Lizenzierung der Daten über eine Open-Content-Lizenz ermöglicht die maßgeschneiderte Vergabe von Rechten an nachfolgende Nutzende. Hierzu können z.B. die von Open Data Commons für offene Daten und offene Datenbanken entwickelten Lizenzen für Forschungsdaten verwendet werden.

Datenschutz: Bevor Daten veröffentlicht werden, ist zwingend zu prüfen, ob die Daten Geschäftsgeheimnisse enthalten oder ob eine Veröffentlichung mit den Persönlichkeitsrechten Dritter in Konflikt steht. Außerdem können Förderbescheide, Arbeits- oder Dienstleistungsverträge Bestimmungen enthalten, die eine Veröffentlichung der Daten nicht oder nur unter bestimmten Bedingungen zulassen. Informationen hierzu sollten Sie bei dem für Ihr Forschungsinstitut zuständigen Datenschutzbeauftragen erfragen oder in den für Ihr Institut geltenden Data Policies recherchieren. Eine Übersicht der institutionellen Policies finden Sie hier.

Spezifische Anwendung von Metadaten Best-Practices können je nach Fach und Anwendungshintergrund sehr unterschiedlich sein und in Ihrer Größe vom Kleinprojekt bis zu einem institutionellen Kontext reichen.

HMC betreut unterschiedlichste Use-Cases und kann Ihnen somit Fallbeispiele liefern, die in vielen Aspekten Ähnlichkeit mit Ihrer Situation haben und so als Orientierung dienen können. Weitere Informationen finden Sie in den Informationsseiten der Metadaten-Hubs.

Als Metadaten sollten alle Informationen erfasst werden, die die Interpretierbarkeit und Nachvollziehbarkeit Ihrer Daten sicherstellen.

Um die speziell für Ihr Projekt wichtigen Metadaten zu identifizieren, kann es helfen einen Datenmanagementplan (DMP) aufzustellen. Hierzu gibt es vielfältige Unterstützung.

Ein „minimaler Satz“ an Metadaten sollte folgende Fragen beantworten können:

  • Wer hat die Daten gesammelt bzw. erhoben?

  • Wann und wo wurden die Daten erhoben?

  • Warum/wozu wurden die Daten erhoben?

  • Welche Art von Daten wurden gesammelt?

  • Wie wurden die Daten erhoben?

  • Wie sind die Daten gespeichert (Format & Struktur)?

  • Wurden die Daten analysiert/ verarbeitet (RAW vs. analysierte Daten)?

  • Wurden, und wenn ja, wie wurden die Daten bearbeitet & analysiert (Roh- vs. analysierte Daten, Filter, Selektion, etc.)?

  • Wurde die Qualität der Daten überprüft/sichergestellt?

  • Wie kann auf die Daten zugegriffen werden?

HMC und die Metadaten-Hubs unterstützen Sie gerne bei weiteren Fragen. Wir möchten Ihnen helfen zu einem „optimalen Satz“ an Metadaten zu gelangen.

Bei Fragen zu Metadaten können Sie sich gerne an HMC wenden. Wir arbeiten für und mit den Forschenden und Datenmanagenden der Helmholtz-Gesellschaft. Generell ist unsere Arbeit in nationale und internationale Initiativen eingebettet und wir arbeiten auch mit HGF-externen Interessierten zusammen.

Die „Nationale Forschungsdateninfrastruktur“ (NFDI) besteht aus fachspezifischen Konsortien, die auf dem Gebiet des Forschungsdatenmanagements in Deutschland arbeiten.

Die „European Open Science Cloud“ (EOSC) ist eine Initiative der Europäischen Kommission zur Bereitstellung einer Open-Science-Infrastruktur für Europa.

HMC arbeitet eng sowohl mit NFDI und EOSC sowie anderen Initiativen zusammen um sicherzustellen, dass unsere Arbeit der globalen Forschungsgemeinschaft zugutekommt.

Re3Data kann Ihnen helfen, fachspezifische Repositorien zu identifizieren in denen Datensätze aufbewahrt werden.

Das Portal DataCite kann genutzt werden, um DOI referenzierte Datensätze zu finden.

Datenbanken, die fachbereichsagnostisch Daten aufbewahren, können auch direkt durchsucht werden - z.B. Zenodo, Data Dryad oder Figshare.

Für Fragen, spezifisch für Ihren Fachbereich, nehmen Sie Kontakt mit ihrem Metadaten-Hub auf