Forschungsdatenmanagement (FDM)

Für den wissenschaftlichen Forschungsprozess ist der Umgang mit Daten wesentlich. In unterschiedlichster Form werden Daten in der Forschung erzeugt, bearbeitet und verwendet. Im Zuge der Digitalisierung nimmt mit der wachsenden Datenmenge und den Möglichkeiten der Nachnutzung auch die Bedeutung zu, die dem Management von Forschungsdaten zukommt.

Was sind Forschungsdaten?

Als Forschungsdaten können alle Daten bezeichnet werden, die im Rahmen wissenschaftlicher Forschungstätigkeiten entstehen. Aus dem vielfältigen Spektrum an wissenschaftlichen Verfahren, Disziplinen und Erkenntnisinteressen ergibt sich eine große Bandbreite an unterschiedlichen, heute zumeist digitalen Forschungsdaten. In der Forschung werden Daten etwa als Messdaten, Laborwerte, Surveydaten, Interviews, Texte oder audiovisuelle Dokumente erzeugt, bearbeitet und verwendet. Selbst Testverfahren, wie Simulationen oder Fragebögen, lassen sich hierunter fassen.

Forschungsdaten veröffentlichen!

Die HAW Hamburg hat mit REPOSIT (https://reposit.haw-hamburg.de/) ein institutionelles Repositorium für die Veröffentlichung und langfristige Speicherung von Forschungsdaten. Alle Datensätze erhalten in REPOSIT persistente Identifier (DOI, Handle) und werden mit Metadaten angereichert. Bei der Publikation Ihrer Daten sollten sie die Nachnutzung über die Vergabe einer Lizenz regeln. Hierfür können Sie in REPOSIT zwischen verschiedenen Lizenzen wie etwa Creative Commons oder GNU General Public License auswählen. Da sich die Datenpublikation im Betamodus befindet, benötigen Sie aktuell noch eine individuelle Freischaltung. Kontaktieren Sie uns hierfür gerne unter openscience (at) haw-hamburg (dot) de. Die maximale Uploadgröße beträgt standardmäßig 512 MB pro Datei. Auch größere Dateien sind auf Anfrage grundsätzlich möglich.

Für den unmittelbaren Austausch innerhalb wissenschaftlicher Communities bieten sich für die Veröffentlichung von Daten zudem fachspezifische Repositorien an. Eine umfangreiche Auswahl anerkannter Repositorien wie z. B. Pangaea für die Earth & Environmental Science finden Sie im Registry of Research Data Repositories (re3data.org) nach Fachgebieten, Lizenzen, Zugangspolicy sowie zahlreichen weiteren Kategorien aufgeschlüsselt.

Darüber hinaus haben sich weltweit mehrere große sogenannte generische Repositorien etabliert, die allen Fachrichtungen und Forschenden offen stehen. Zu den bekanntesten gehören Harvard Dataverse, das vom CERN betriebene Zenodo, die aus einem EU Horizon 2020 Projekt gegründete europäische Plattform B2Share, OSF Home als Teil des umfassendes Open Science Framework und Dryad. Diese Repositorien bieten freie Lizenzen, persistente Identifikatoren wie DOI für die veröffentlichten Daten, die Beschreibung der Daten mittels Metadaten, eine Versionierung der Daten, teils über 50 GB Speicherplatz und viele weitere Funktionen kostenfrei an.

Wozu Forschungsdatenmanagement?

Ziel des Forschungsdatenmanagements ist es, Methoden, Verfahren und Strategien zu entwickeln, die einen systematischen Umgang mit Forschungsdaten gewährleisten und ihre nachhaltige Nutzbarkeit sicherstellen. Von der Datenerstellung bis zur Datennachnutzung unterstützt das Forschungsdatenmanagement Ihre wissenschaftliche Forschung entlang des Datenlebenszyklus – sowohl bei der Planung, Erstellung und Aufbereitung von Daten sowie der Datenanalyse als auch hinsichtlich Fragen der Archivierung, Sicherung, Publikation, des Teilens und der Nachnutzung von Daten.

Das Forschungsdatenmanagement unterstützt bei:

  • der prinzipiellen Organisation des Forschungsprozesses – eine vorausschauende Planung des Umgangs mit Daten in Forschungsprojekten ist essentieller Bestandteil der wissenschaftlichen Praxis
  • der Erfüllung von Vorgaben von Forschungsförderern – für zahlreiche Förderer ist ein belastbares Forschungsdatenmanagement Voraussetzung für eine Förderung
  • der Nachnutzbarkeit von Daten – mit Hilfe von Metadaten und Lizenzen wird die Nachnutzung von Daten durch anderen Forschende ermöglicht
  • der Transparenz und Nachvollziehbarkeit von Forschungsprozessen – die Dokumentation von Daten und Analyseschritten macht Forschung nachvollziehbar und stellt die Grundlage für die Reproduzierbarkeit von Ergebnissen dar
  • der Sichtbarmachung von Forschung und neuen Kooperationsmöglichkeiten – insbesondere veröffentlichte Daten können ihren Forschungsprojekten zusätzliche Sichtbarkeit verschaffen und Kooperationen initiieren
  • Zitierbarkeit von Daten – über die Veröffentlichung Ihrer Daten als eigenständige Publikation oder Supplement und die Vergabe von persistenten Identifikatoren wie DOI sind Ihre Forschungsdaten zitierfähig und dauerhaft referenzierbar.

FAIR – Forschung nachhaltig gestalten!

Mit den vier grundsätzlichen FAIR Data Principles hat FORCE11, ein internationaler Zusammenschluss von Personen aus der wissenschaftlichen Forschung, aus Bibliotheken, Archiven, Verlagen und der Forschungsförderung, wesentliche Anforderungen an Forschungsdaten formuliert, die eine nachhaltige Verwendung ermöglichen. Auch die DFG weist in ihren „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ explizit darauf hin, dass der Zugang zu Forschungsdaten gemäß der FAIR-Prinzipien erfolgen sollte. Diese vier Anforderungen an Forschungsdaten sind:

  • Findable: Persistente und global eindeutige Identifikatoren (wie z. B. DOI) sowie umfangreiche Metadaten sorgen für optimale Auffindbarkeit und Zitierfähigkeit von Forschungsdaten.
  • Accessible: Der Zugang zu Forschungsdaten und Metadaten sollte einfach und unter Verwendung eines offenen, freien sowie maschinenlesbaren Protokolls möglich sein.
  • Interoperable: Um Forschungsdaten langfristig maschinell lesbar verknüpfen zu können, müssen Daten vergleichbar sein und Metadaten auf kontrollierten Vokabularen, Klassifikationen etc. basieren.
  • Reusable: Forschungsdaten und Metadaten sollten optimal beschrieben, dokumentiert und rechtlich sicher lizenziert sein, um die Nachnutzung zu gewährleisten.

Die vollständigen FAIR-Prinzipien wurden 2016 in Scientific Data veröffentlicht.

Datenmanagementpläne

Datenmanagementpläne (DMP) sind ein wichtiges Hilfsmittel im Rahmen des Forschungsdatenmanagements. Sie dokumentieren den Umgang mit Forschungsdaten im Rahmen von Forschungsprojekten und sollten idealerweise vor Beginn des eigentlichen Forschungsprozesses erstellt werden. Nicht zuletzt durch die verpflichtenden Angaben zum Umgang mit Forschungsdaten bei Forschungsförderern wie der DFG oder der EU finden DMP zunehmend Verbreitung.

Für DMP gibt es zahlreiche Vorlagen und Fragenkataloge zur Erstellung, die Wissenschaftler*innen strukturiert durch die relevanten Themen des Datenmanagements leiten. Typische Fragen sind:

  • Welche Daten werden erhoben und verwendet?
  • Welche Software wird zur Datensammlung bzw. -generierung eingesetzt?
  • Wo werden die Daten während des Forschungsprozess gespeichert?
  • Wie werden die Daten geschützt?
  • In welchen Formaten (z. B. CSV, PDF etc.) werden die Daten archiviert?
  • Welche Metadaten werden vergeben, damit Ihre Daten identifizierbar sind?
  • Wie werden die rechtlichen Anforderungen an den Schutz personenbezogener Daten realisiert?
  • Wo und für welchen Zeitraum werden die Daten archiviert?
  • Wie soll die Nachnutzung geregelt, welche Lizenzen sind geplant?

Hilfestellungen und Muster für Datenmanagementpläne