Eine vor kurzem durchgeführte Studie zeigte, dass 80% der Daten zwanzig Jahre nachdem die Ergebnisse in einer Zeitschrift veröffentlicht wurden für immer verloren sind (Vines et al. 2013). Gut aufbereitete Datensätze sind Schätze, die auch Jahrzehnte nach der Erstellung zu innovativer Forschung führen können.

Um sicherzustellen, dass Daten langfristig für die Forschung relevant bleiben,  hat sich die Anwendung der FAIR-Prinzipien (Daten sollen auffindbar, zugänglich, interoperabel und wiederverwendbar sein) als Best Practice etabliert. Die Notwendigkeit eines darauf basierenden Datenmanagements wird von vielen Förderorganisationen (z. B. EU, DFG, BMBF, NSF usw.) erkannt. Eingereichte Projektanträge sollen entsprechend Datenmanagementpläne enthalten und einen offenen Zugang zu den Daten ermöglichen.

Das GFZ hat 2016  als erstes Helmholtz-Zentrum  Grundsätze zum Umgang mit Forschungsdaten  verabschiedet. Obwohl eine Reihe von wissenschaftlichen Gruppen am GFZ bereits ihr Datenmanagement im Sinn der FAIR-Prinzipien und Richtlinien betreiben, bleibt die Umsetzung dieser Richtlinien in vielen Forschungseinheiten des GFZ und darüber hinaus eine Herausforderung.

Das vom Bundesministerium für Bildung und Forschung (BMBF) geförderte Projekt Geo Data Node soll diese Herausforderungen angehen und die weitere Anwendung der Grundsätze in den nächsten zwei Jahren fördern. Durch den Austausch mit ähnlichen Initiativen wird das Projekt über das GFZ hinaus wirken.

Das Projekt stützt sich auf Synergien der Zusammenarbeit von wissenschaftlichen Gruppen mit fortgeschrittenen Datenmanagementpraktiken am GFZ und der Abteilung Bibliotheks- und Informationsdienste (LIS). GEOFON und der Geophysikalische Instrumentenpool Potsdam (GIPP) verwenden hochstandardisierte Daten und dienen als Datenarchive. Von dieser Erfahrungen sollen im Rahmen des Projekts auch  andere Forschungsgruppen am GFZ profitieren. Gleichzeitig sollen Angebote für bereits etabliertes Datenmanagement verbessert werden.

Das Projekt soll sich in zwei Hauptsträngen entwickeln: Das erste Arbeitspaket konzentriert sich auf Fallstudien für verschiedene Themenbereiche und berücksichtigt dabei sowohl wissenschaftliche Gruppen, die bereits einen hohen Standardisierungsgrad beim Umgang mit Forschungsdaten erreicht haben, als auch sogenannte "Long Tail"-Daten. Das zweite Arbeitspaket konzentriert sich beispielsweise auf die Entwicklung von Datenmanagementplanvorlagen für die Geowissenschaften, den Austausch zwischen den verschiedenen Disziplinen am GFZ und Outreach-Aktivitäten, um die Kommunikation  und Interaktion auch auf nationaler und internationaler Ebene sicherzustellen.

Bibliotheks- und Informationsdienste (LIS)

LIS betreibt u.a.  GFZ Data Services - ein Domain-Daten-Repository - und bietet WissenschaftlerInnen Unterstützung bei der Veröffentlichung ihrer Daten. Innerhalb des Geo-Node-Projekts

  • wird LIS die Veröffentlichung von Daten für alle Forschungsthemen des GFZ fördern und ausbauen.
  • Darüber hinaus wird  LIS die Anwendung anderer Identifikatoren wie der International Geo Sample Number (IGSN) ausbauen.
  • Vorlagen für Datenmanagementpläne werden evaluiert und auf die Bedürfnisse der geowissenschaftlichen Community zugeschnitten.
  • Übertragbare Aspekte des Datenmanagement-Know-hows von GEOFON und GIPP sollen zunächst am GFZ, aber auch extern weitergegeben werden.
  • Die Projektleitung von GDN liegt bei LIS.

GEOFON

Das GEOFON-Team wird zu folgenden Aufgaben beitragen:

  • Entwicklung von Data Management Templates die seismische Datensätze, verschiedene Anwendungsfälle umfassend, und für Archivierung bestimmt (Permanente Netzwerke: eigenes, GFZ und Drittanbieter; temporäre Netzwerke: Instrumente von GIPP, eigene Instrumente innerhalb des GFZ und Drittanbieter; verschiedene Datenzugriffsregeln: offen, embargoed, eingeschränkt)
  • Entwicklung von Vorlagen für Scientific Technical Reports, um die Datensätze im Archiv zu ergänzen
  • Überprüfung der Beziehungen zwischen vorhandenen Persistent Identifiers für eine bessere Relation aller Ressourcen in Bezug auf einen Datensatz.
  • Unterstützung von GIPP bei der Zuweisung von Persistent Identifiers und gemeinsamer API, die die Erstellung von seismischen Metadaten erleichtert.

GIPP

Der "Geophysikalische Instrumentenpool Potsdam (GIPP)" liefert seismische und elektromagnetische Instrumente und Sensoren für Verbundprojekte mit Universitäten und anderen Forschungseinrichtungen. Im Rahmen des Instrumentenverleihs verpflichten sich die Nutzer, dem GIPP eine Kopie aller gemessenen Daten zur Verfügung zu stellen. Diese Rohdaten und zugehörigen Metadaten werden als zusammengestellte Datensätze in einem Datenarchiv gespeichert, das vom GIPP betrieben und verwaltet wird. Zusätzlich wird den zusammengesetzten Datensätzen eine persistente Kennung (Persistent Identifier, DOI) zur Verfügung gestellt, die Verweise auf Datenpublikationen ermöglicht und zugänglich macht.

Im Rahmen dieses Projekts wird sich das GIPP folgendermaßen beteiligen:

  • Entwicklung von Data Management Templates für die verschiedenen Komponenten des GIPP-Archivs
  • Integration von Datensätzen in ein möglichst einheitliches Format
  • Entwicklung von Vorlagen für Scientific Technical Reports, um die Archivierung und Veröffentlichung von mit GIPP-Instrumenten erfassten Datensätzen sowie die Generierung oder Extraktion der Metadaten zu erleichtern
  • Unterstützung von GEOFON durch z.B. Echtzeit-Gerätekalibrierung der Geräte zur Erstellung der GEOFON-Daten (über Persistent Identifiers für die Instrumente)
  • Zusammenarbeit mit  LIS, um die Veröffentlichung möglichst vieler Datensätze des GIPP-Archivs zu ermöglichen.