Data Management Plan (DMP) - Leitlinien für Forschende

1. Vorwort

Zu den Grundsätzen guter wissenschaftlicher Praxis gehört es, Forschungsresultate möglichst offen zu verwalten und öffentlich zugänglich zu machen. Der SNF unterstützt diesen Grundsatz in seinem Beitragsreglement (PDF):"[…] Die Beitragsempfängerinnen und Beitragsempfänger sind verpflichtet, [...] die mit Mitteln des SNF erzielten Forschungsresultate der Öffentlichkeit in geeigneter Weise zugänglich zu machen […]"(Artikel 47). In seinen forschungspolitischen Positionen zu Open Research Data legt der SNF dar, welche Erwartungen er diesbezüglich an seine Beitragsempfängerinnen und Beitragsempfänger stellt. Zur Umsetzung dieser Grundsätze bevorzugt der SNF einen Bottom-Up-Ansatz. Dies fördert die Etablierung von Leitlinien für eine empfehlenswerte Praxis und erlaubt es jeder wissenschaftliche Gemeinschaft, ihre eigenen Standards zu definieren und mit ausreichender Flexibilität anzuwenden. Wie Daten am besten verwaltet und veröffentlicht werden, hängt besonders von dem jeweiligen Forschungsgebiet ab.

Der Data Management Plan (DMP) dient der Planung des Lebenszyklus von Forschungsdaten. Er ist langfristig angelegt und legt dar, wie die Daten produziert, erhoben, dokumentiert, veröffentlicht und archiviert werden sollten. Der SNF stellt ein Template für die Erstellung des DMP zur Verfügung. Der DMP für ein Forschungsprojekt kann sich auf fachspezifische Praktiken und Standards beziehen und kann sich deshalb in seinem Inhalt unterscheiden.

Alle Daten, welche während Forschungsarbeiten generiert und gesammelt werden und einer Publikation zugrunde liegen, müssen zugänglich gemacht werden, sofern dem keine rechtlichen, ethischen, immaterialgüterrechtlichen oder andere wichtige Gründe entgegenstehen. Diese Daten sind schnellstmöglich, jedoch spätestens zusammen mit den entsprechenden wissenschaftlichen Publikationen, zu veröffentlichen und in wissenschaftlich anerkannten Datenrepositorien, welche die FAIR Prinzipien erfüllen, zu archivieren (AR, 11.8). Je nach Fachgebiet und Art der Studie können die Daten in ihrer ursprünglichen oder in einer verarbeiteten Form publiziert werden. Die Datensätze sind dabei stets mit den dazugehörigen Metadaten zu dokumentieren, damit andere Forschende erkennen können, wie die Daten erhoben wurden und unter welchen Bedingungen bzw. in welcher Form sie weiterverwendet werden können. Wenn die Weiterverwendung der Daten spezifische Tools voraussetzt, ist dies ebenfalls zu dokumentierten; die benötigten Tools müssen nach Möglichkeit zur Verfügung gestellt werden. In jedem Fall müssen die bereitgestellten Daten und Dokumentationen (Metadaten, Code, usw.) die Wiederverwendung der Daten sicherstellen. Dies gilt auch für Software. Können diese Anforderungen nicht erfüllt werden, sind die Forscherinnen und Forscher gebeten die Gründe im DMP zu erläutern.

Datenaustausch – Best Practice

Damit Datensätze leichter auffindbar sowie besser zugänglich, weiterverwendbar und zitierbar sind, muss die Veröffentlichung der Forschungsdaten einer klar definierten und umfassend anwendbaren besten Praxis folgen. Die FAIR Daten Prinzipien1  definieren einige Merkmale, die publizierte Datensätze aufweisen sollten, um auffindbar ("findable"), zugänglich ("accessible"), kompatibel ("interoperable") und wiederverwendbar ("reusable") zu sein (siehe Explanation of the FAIR Data Principles (PDF), Dokument auf Englisch). Der SNF erwartet von den Forschenden, dass sie ihre Daten im Sinne der FAIR Daten Prinzipien in öffentlich zugänglichen, digitalen Datenbanken veröffentlichen. Hierbei ist hervorzuheben, dass die FAIR Daten Prinzipien die Forschenden nicht verpflichten, alle ihre Daten ohne jede Beschränkung zu veröffentlichen. Vielmehr sollen einheitliche Verfahren dafür sorgen, dass die Forschungsdaten von Menschen und Computersystemen leichter gefunden, ausgewertet und unter klar definierten Bedingungen genutzt werden können. Die FAIR Prinzipien für Forschungsdaten wurden zunehmend von mehreren Forschungförderorganisationen übernommen (z.B. Horizon EuropeExternal Link Icon, NIHExternal Link Icon, FWFExternal Link Icon, Swedish Research CouncilExternal Link Icon).

1Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18External Link Icon(2016)

2. Der Data Management Plan des SNF

Zur Umsetzung seiner Grundsatzerklärung zu Open Research Data verlangt der SNF für bewilligte Gesuche Angaben zum Lebenszyklus der Daten. Um den Datenmanagementstandards der jeweiligen Forschungsdisziplinen Rechnung zu tragen, hat der SNF nur Mindestanforderungen bezüglich Strukturierung und Inhalt der verlangten Informationen formuliert.

2.1. So reichen Sie einen DMP ein

Bei geförderten Gesuchen erhalten Beitragsempfangende einen Hinweis auf der Plattform mySNF den DMP einzureichen. Der DMP muss in der gleichen Sprache wie der Forschungsplan verfasst werden. Die Einreichung eines DMP ist eine Bedingung für die Beitragsfreigabe.

Der Inhalt eines DMP erstreckt sich auf vier Bereiche: (1) Datenerhebung und -dokumentation, (2) ethische, rechtliche und Sicherheitsfragen, (3) Datenspeicherung und -erhalt sowie (4) Austausch und Weiterverwendung der Daten. Beim Ausfüllen des Formulars werden die Forschenden durch Unterfragen und Online-Hilfetexte geleitet (siehe Details (PDF)). Die "prüfenswerten Fragen" sind als Hilfe gedacht. Beitragsempfangende geben einen DMP ein, der den Bedürfnissen ihres Projektes sowie den Anforderungen ihrer Forschungsgemeinschaft entspricht und nachvollziehbar ist. Fehlende oder ungenaue Angaben müssen spätestens vor der Auszahlung der zweiten Tranche ergänzt/revidiert werden. Eine endgültige und aktualisierte Version des DMP muss bis zum Beitragsende eingereicht werden.

Bei einigen Forschungsprojekten werden keine Daten produziert oder weiterverwendet. Gesuchstellende müssen in diesem Fall nicht das gesamte DMP-Formular ausfüllen. Sie müssen jedoch erklären, warum sie davon ausgehen, dass im Rahmen ihres Forschungsprojekts keine Daten produziert oder weiterverwendet werden.

Manche Daten können nicht öffentlich zugänglich gemacht werden, weil dem rechtliche, ethische oder urheberrechtliche Gründe, Vertraulichkeitsklauseln o. ä. entgegenstehen. In diesem Fall müssen die Gesuchstellenden die jeweiligen Einschränkungen erläutern.

Falls die Finanzierung des Beitrags im Rahmen von einem (i) Lead Agency oder Weave Abkommen, in welchem die Partnerorganisation als Lead Agency fungiert, (ii) ERA-NET call oder (iii) European Partnership erfolgt, soll der DMP alle Forschungsdaten umfassen, welche im Schweizer Teil des Projekts beobachtet, generiert oder wiederverwendet werden und muss den Vorgaben der SNF Open Research Data Policy entsprechen.

2.2. So wird der DMP beurteilt

Die Einreichung des DMP ist eine Bedingung für die Beitragsfreigabe. Die Geschäftsstelle des SNF prüft den DMP. Fehlende oder ungenaue Angaben müssen spätestens vor der Auszahlung der zweiten Tranche ergänzt/revidiert werden. In einem solchen Fall wird den Beitragsempfangenden auf der SNF-Plattform ein Auftrag zur Überarbeitung der entsprechenden Abschnitte des DMP erteilt.

2.3. Verwaltung während des Lebenszyklus

Der DMP kann während der gesamten Projektlaufdauer bearbeitet und sein Inhalt der Entwicklung des Projekts angepasst werden.

In jedem Fall sind die Forschenden aufgefordert, den DMP bei Abschluss ihrer Forschungsarbeit zu aktualisieren. Der SNF erwartet in dieser finalen Version, dass die Verwaltung der Daten, welche im Rahmen der Projektlaufzeit erhoben, generiert oder beobachtet wurden, abschliessend beschrieben wird. Diese aktualisierte Version wird zusammen mit dem wissenschaftlichen Schlussbericht geprüft. Die Geschäftsstelle des SNF behält sich vor, zusätzliche Informationen und/oder Ergänzungen zum Inhalt des endgültigen DMP zu verlangen.

3. Beispiele für Data Management Pläne

DMPs sind sehr individuell. Sie unterscheiden sich hinsichtlich Art und Aufbau. Diese Diversität verdeutlichen die Beispiele des Digital Curation CentreExternal Link Icon (UK).

4. Anrechenbare Kosten

Der SNF ist sich bewusst, dass die Zugänglichmachung von Forschungsdaten Ressourcen benötigt. Deshalb können Forschende bei der Gesuchstellung Kosten zur Aufbereitung der Forschungsdaten für die Ablage und die Ablage selbst in Datenarchiven beantragen, sofern die Datenarchive die FAIR-Data-Kriterien erfüllen und nicht kommerziell ausgerichtet sind (AR 2.13). Der SNF beteiligt sich an diesen Archivierungskosten jedoch nur auf der Basis einer einmaligen Zahlung zum Zeitpunkt der Ablage der Daten. Der SNF übernimmt keine Folgekosten. Für diese Aktivitäten kann der SNF Forschende mit bis zu 10'000 Franken unterstützen. Die Kosten sind bereits bei der Gesuchstellung zu berücksichtigen. Sie können nicht durch einen Zusatzbeitrag erstattet werden.

5. Beispiele für nicht kommerzielle Datenarchive, die den FAIR Daten Prinzipien entsprechen

Dass die FAIR Daten Prinzipien in jeder Hinsicht anzuwenden sind, ist eine ehrgeizige Anforderung. Auch ist es nicht leicht, das "perfekte" Datenarchiv mit allen für FAIR Daten notwendigen Merkmalen zu finden. Um den Wechsel zu "FAIRen Forschungsdaten" zu erleichtern, hat der SNF bestimmte Mindestanforderungen definiert, die Datenbanken erfüllen müssen, damit sie den FAIR Daten Prinzipien entsprechen (Checklisten siehe unten).

Vier Datenarchive, die Datensätze aus unterschiedlichen Forschungsdisziplinen aufnehmen und die Anforderungen des SNF erfüllen sind hier (PDF) (Dokument auf Englisch) aufgelistet. Natürlich können Daten auch in anderen (fachspezifischen) Datenarchiven abgelegt werden. Falls Forschende dies wünschen, können sie wie nachfolgend beschrieben vorgehen. So ist gewährleistet, dass das gewählte Datenarchiv die Anforderungen des SNF erfüllt.

5.1. Checkliste, um Datenbanken zu finden, welche die FAIR Daten Prinzipien erfüllen

Prüfen Sie, ob die Datenbank mit den FAIR Daten Prinzipien vereinbar ist. Das ist der Fall, wenn Sie jede der nachfolgenden Fragen mit "ja" beantworten können (siehe Beispiele (PDF), Dokument auf Englisch).

  • Sind die Datensätze (oder idealerweise die einzelnen Dateien eines Datensatzes) mit eindeutigen und dauerhaften Identifikatoren (bspw. DOI) versehen?
  • Erlaubt die Datenbank das Heraufladen intrinsischer Metadaten (bspw. Name des Autors, Inhalt des Datensatzes, dazugehörige Publikation) und von Metadaten, die der Registrierende definiert (bspw. Bezeichnungen von Variablen)?
  • Ist es ersichtlich, mit welcher Lizenz (bspw. CC0, CC BY) die Daten auf dem Datenarchiv verfügbar sein werden? Oder kann der Benutzer eine Lizenz heraufladen oder auswählen?
  • Sind Quelleninformationen und Metadaten immer öffentlich verfügbar (selbst bei eingeschränkt zugänglichen Datensätzen)?
  • Liefert das Datenarchiv eine Eingabemaske, die ein bestimmtes Format für die intrinsischen Metadaten vorschreibt (um die maschinelle Lesbarkeit/Kompatibilität zu gewährleisten)?
  • Verfügt die Datenbank über einen Plan für die langfristige Erhaltung der archivierten Daten?

5.2. Checkliste, um nicht kommerzielle Datenbanken zu finden

Die meisten Datenbanken sind auf www.re3data.orgExternal Link Icon (englischsprachige Website) gelistet.

  • Prüfen Sie auf der Registerkarte "Institutions", ob eine kommerzielle Organisation allgemein ("general") oder technisch ("technical") verantwortlich ist. (Kategorien: "Type of institution" und "Type(s) of responsibility").
  • Trifft das nicht zu, erachtet der SNF die Datenbank als nicht kommerziell (Tritt eine kommerzielle Organisation als Geldgeber "funding" oder Sponsor "sponsoring" auf, ist das in Ordnung.)
  • Trifft Punkt 1 zu, betrachtet der SNF die Datenbank als kommerziell (siehe Details (PDF))

Ist das Datenarchiv nicht auf www.re3data.orgExternal Link Icon verzeichnet, klären Sie diesen Punkt durch direkte Kontaktaufnahme mit den zuständigen Personen. Ausserdem sollten Sie die Datenbank zur Aufnahme in das Verzeichnis www.re3data.org vorschlagenExternal Link Icon.