Abschnittsübersicht

  • Bearbeitungsdauer: 15 Minuten, 36 Sekunden

    • 1.1 Einführung & Lernziele

      Diese Selbstlerneinheit soll Ihnen einen Eindruck davon vermitteln, wie der Umgang mit Forschungsdaten von Ihnen als Forscher*in am besten gehandhabt wird und welche Vorteile ein gut strukturiertes und organisiertes Forschungsdatenmanagement (FDM) für Sie haben kann.

      Nach Abschluss dieses Kapitels können Sie…

      • …die Begriffe "Forschungsdaten" und "Forschungsdatenmanagement" einordnen und definieren.
      • …die Vorteile eines gut strukturierten FDMs wertschätzen.
      • …die weiteren Inhalte der Selbstlerneinheit überblicken und haben eine Vorstellung davon, welche Aspekte für Sie am relevantesten sind.

    • 1.2 Was sind Forschungsdaten und was ist Forschungsdatenmanagement?

      Gemäß der „Leitlinien zum Umgang mit Forschungsdaten“, die 2015 von der DFG veröffentlicht wurden, zählen zu Forschungsdaten „u. a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Surveydaten, Objekte aus Sammlungen oder Proben, die in der wissenschaftlichen Arbeit entstehen, entwickelt oder ausgewertet werden. Methodische Testverfahren, wie Fragebögen, Software und Simulationen können ebenfalls zentrale Ergebnisse wissenschaftlicher Forschung darstellen und sollten daher ebenfalls unter den Begriff Forschungsdaten gefasst werden.“

      Der Umfang an Forschungsdaten erstreckt sich also von den typischen mit Daten agierenden Wissenschaftsdisziplinen wie den Naturwissenschaften und Sozial- sowie Wirtschaftswissenschaften über beispielsweise linguistische Sprachdaten bis hin zu Bildbeschreibungen aus den Kunstwissenschaften usw. (s. Abb. 1.1 & Abb. 1.2)

      Forschungsdaten aus der Chemie
      Abb. 1.1: Forschungsdaten aus der Chemie

      Forschungsdaten aus den Wirtschaftswissenschaften
      Abb. 1.2: Forschungsdaten aus den Wirtschaftswissenschaften

      Der Kosmos an Forschungsdaten in der Wissenschaft ist auch aufgrund sich neu entwickelnder Forschungsmethoden noch nicht vollständig zu überblicken und der Umgang mit diesen birgt oft schon von Disziplin zu Disziplin unterschiedliche Herausforderungen (z. B. Umgang mit personenbezogenen Daten in sozialwissenschaftlichen Umfragen), die von den Forschenden ein strukturiertes, der guten wissenschaftlichen Praxis entsprechendes Forschungsdatenmanagement abverlangen. Der Schwerpunkt liegt dabei vor allem auf dem Umgang mit digitalen Forschungsdaten. Die besondere Herausforderung besteht dabei darin, dass aufgrund der Digitalisierung und Automatisierung von Arbeitsprozessen immer größere und heterogene Datenmengen entstehen, deren sinnvolle und koordinierte Handhabung sehr aufwändig ist. Diese Heterogenität zeichnet sich einerseits durch vielfach unterschiedlich genutzte Dateiformate (.txt, .docx, .pdf, .ods usw.) und andererseits durch unterschiedliche Darstellungsformen mit verschiedenen Abstraktionsebenen (Grafiken, 3D-Modelle, Simulationen, Umfragedaten usw.) aus.

      Konventionelle wissenschaftliche Verfahren gewährleisten oft noch keine ausreichende Nutzung der großen Datenmengen. Weiterhin gibt es für den Umgang mit (digitalen) Forschungsdaten bisher nur wenige übergeordnete Standards. Die Handhabung ist vor allem durch individuelle oder fachspezifische Praktiken geprägt. Datenverlust oder die Nichtnachvollziehbarkeit von Daten sind gerade nach Projektbeendigung keine Seltenheit. Forschungsdaten können dann bspw. aufgrund fehlender Dokumentation der Arbeitsschritte oder veralteter Formate für weitere Forschungszwecke nur eingeschränkt nachgenutzt oder reproduziert werden (vgl. Büttner, Hobohm und Müller 2011: 13 ff.).

      Genau an dieser Problematik setzt Forschungsdatenmanagement an und soll dem Umgang mit Forschungsdaten zukunftsfähige Chancen bieten. Forschungsdatenmanagement, kurz FDM, umfasst den gesamten Umgang mit Forschungsdaten von der Planung, der Erhebung über Verarbeitung und Qualitätssicherung bis hin zur Aufbewahrung und Zugänglichmachung bzw. Publikation. Alle Schritte des FDM sollten dokumentiert werden und sich dabei an den aktuellen fachspezifischen Standards und Gepflogenheiten der einzelnen Wissenschaftsdisziplinen orientieren. Viele wissenschaftliche Einrichtungen haben mittlerweile eine Forschungsdaten-Leitlinie veröffentlicht, die den Umgang mit Forschungsdaten in einem ersten Schritt regeln soll. Auch die Frankfurt UAS hat eine solche Forschungsdaten-Policy verabschiedet.

    • 1.3 Vorteile eines guten Forschungsdatenmanagements

      Doch welche Vorteile ergeben sich für Sie eigentlich durch ein gutes Forschungsdatenmanagement? Abbildung 1.3 schlüsselt in einem ersten Schritt die verschiedenen Ziele, die durch FDM verfolgt werden können, für verschiedene Dimensionen auf.

      Ziele des Forschungsdatenmanagements
      Abb. 1.3: Ziele des FDM für verschiedene Dimensionen

      Die Ziele werden durch unterschiedliche Dimensionen (interner/externer Kontext; aktive/seltene Nutzung der Daten) beeinflusst. Forschungsdatenmanagement soll die Forschenden in Umgang und Nachvollziehbarkeit ihrer Daten selbst unterstützen (die zwei linken Quadranten) sowie den Ansprüchen der Öffentlichkeit genügen (die zwei rechten Quadranten). Weiterhin soll es dafür sorgen, dass generierte Daten aktiv zur weiteren Forschung genutzt werden können (obere Quadranten), sowie zur langfristigen Qualitätssicherung in Form einer Dokumentation des Forschungsprozesses (untere Quadranten) (vgl. Broschard und Wellenkamp 2019: Abschnitt Vorteile von Forschungsdatenmanagement). 

      Forschungsdatenmanagement soll durch geeignete Dokumentation des Forschungsprozesses zur langfristigen Nachvollziehbarkeit und Reproduzierbarkeit der Daten führen und Datenverlust minimieren. Die Transparenz der Datenerhebung und -verarbeitung wird so gefördert und eine Validierung der Forschungsergebnisse z. B. im Falle von Anschuldigungen wird des Weiteren erleichtert. Auf lange Sicht gesehen, werden bei erfolgreichem Forschungsdatenmanagement Zeit und Ressourcen gespart. Gründe dafür sind beispielsweise eine bessere Zusammenarbeit (z. B. durch gemeinsame Standards, Nutzung gemeinsamer Plattformen usw.), die Vermeidung von Fehlern und eine Absicherung gegen Datenverlust.

      Neben diesen praktischen Vorteilen während der Forschung bringt eine Publikation gut dokumentierte und nachnutzbarer Datensätze eine Steigerung der Sichtbarkeit und Reputation für Sie als Forscher mit sich, da zunehmend nicht nur wissenschaftliche Fachartikel, sondern auch Datenpublikationen mit immer weiter steigender Tendenz gewürdigt werden.

    • 1.4 Forschungsdaten und die gute wissenschaftliche Praxis

      Die „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ der DFG (häufig als DFG-Kodex bezeichnet) bilden für die Wissenschaft eine gemeinsame Basis, indem sie Anforderungen an Wissenschaftlichkeit und das gemeinsame wissenschaftliche Arbeiten stellen. Dazu gehören auch Anforderungen an die Arbeit mit Forschungsdaten. Der DFG-Kodex besteht aus insgesamt neunzehn Leitlinien, wobei sich die ersten sechs Leitlinien mit wissenschaftlichen Prinzipien, die Leitlinien 7 bis 17 mit dem eigentlichen Forschungsprozess und die letzten beiden Leitlinien mit der Nichtbeachtung der guten wissenschaftlichen Praxis beschäftigen.

      Teil der Ausführungen an dieser Stelle sind vor allem die Leitlinien, die einen direkten Bezug zu Forschungsdaten haben. In Leitlinie 7, „Phasenübergreifende Qualitätssicherung“, heißt es in Bezug auf Forschungsdaten:

      „Die Herkunft von im Forschungsprozess verwendeten Daten, Organismen, Materialien und Software wird kenntlich gemacht und die Nachnutzung belegt; die Originalquellen werden zitiert. Art und Umfang von im Forschungsprozess entstehenden Forschungsdaten werden beschrieben. Der Umgang mit ihnen wird, entsprechend den Vorgaben im betroffenen Fach, ausgestaltet. Der Quellcode von öffentlich zugänglicher Software muss persistent, zitierbar und dokumentiert sein. Dass Ergebnisse beziehungsweise Erkenntnisse durch andere Wissenschaftlerinnen und Wissenschaftler repliziert beziehungsweise bestätigt werden können (beispielsweise mittels einer ausführlichen Beschreibung von Materialien und Methoden), ist – abhängig von dem betroffenen Fachgebiet – essenzieller Bestandteil der Qualitätssicherung.“ (DFG 2019, 14f, Hervorhebungen durch den Autor)

      Forschungsdaten und darin eingeschlossen auch der dazugehörigen Forschungssoftware wird im Rahmen der guten wissenschaftlichen Praxis ein hoher Wert im Hinblick auf die Qualitätssicherung von Forschung zugeschrieben. Achten Sie daher darauf, dass Sie alle Arbeitsschritte so dokumentieren, dass andere Wissenschaftler eine Möglichkeit haben, Ihre Ergebnisse zu überprüfen. Dazu gehört es auch, fremde (Daten)quellen anzugeben, mit denen Sie Ihre eigenen Daten vielleicht erweitert haben.

      Leitlinie 10, „Rechtliche und ethische Rahmenbedingungen, Nutzungsrechte“, weist neben dem verantwortungsvollen Umgang mit Forschungsdaten u. a. daraufhin, dass zu den rechtlichen Rahmenbedingungen eines Forschungsvorhabens auch „dokumentierte Vereinbarungen über die Nutzungsrechte an aus ihm hervorgehenden Forschungsdaten und

      Forschungsergebnissen“ zählen. (DFG 2019, 16) Für Sie als Forschende heißt das, diese Vereinbarungen einzuholen und die Nutzungsrechte in den Metadatenbeschreibungen der Daten für Nachnutzende offenzulegen.

      In Leitlinie 12, „Dokumentation“, fordert die DFG, dass „alle für das Zustandekommen eines Forschungsergebnisses relevanten Informationen so nachvollziehbar [dokumentiert werden], wie dies im betroffenen Fachgebiet erforderlich und angemessen ist, um das Ergebnis überprüfen und bewerten zu können.“ (DFG 2019, 17f) Um diese Nachvollziehbarkeit zu gewährleisten, ist es u. a. notwendig, dass Informationen über verwendete und über im Projektzeitraum entstehende Forschungsdaten gegeben werden, die für Dritte in einer verständlichen Form offen dargelegt sind.

      Leitlinie 13, „Herstellung von öffentlichem Zugang zu Forschungsergebnissen“, fordert den Weg der Forschung hin zu Open Access, auch in Bezug auf die verwendeten Forschungsdaten. „Aus Gründen der Nachvollziehbarkeit, Anschlussfähigkeit der Forschung und Nachnutzbarkeit hinterlegen Wissenschaftlerinnen und Wissenschaftler, wann immer möglich, die der Publikation zugrundeliegenden Forschungsdaten und zentralen Materialien – den FAIR-Prinzipien („Findable, Accessible, Interoperable, Re-Usable“) folgend – zugänglich in anerkannten Archiven und Repositorien.“ (DFG 2019, 19) Die DFG weist allerdings auch ausdrücklich darauf hin, dass es in manchen Fällen auch sein kann, dass eine Open Access-Publikation der Daten nicht möglich ist (z. B. im Falle von Patentrechten Dritter). Es sollte mit Blick auf Open Access daher immer folgender Grundsatz gelten: So offen wie möglich, so geschlossen wie nötig.

      Die letzte Leitlinie, die einen Bezug zu Forschungsdaten aufweist, ist Leitlinie 17, „Archivierung“. Diese fordert, dass bei der Veröffentlichung der Forschungsergebnisse, die der Publikation zugrundeliegenden Forschungsdaten „in der Regel für einen Zeitraum von zehn Jahren zugänglich und nachvollziehbar in der Einrichtung, wo sie entstanden sind, oder in standortübergreifenden Repositorien aufbewahrt“ werden. (DFG 2019, 22) Informieren Sie sich bereits vor Beginn eines Forschungsprojekts beim Forschungsdatenreferat der [Name der Hochschule] nach Möglichkeiten zur Archivierung. Vor allem, wenn es sich um ein Projekt mit sehr hohem Datenaufkommen handelt, können ggf. Gelder mitbeantragt werden, um die nötige Speicherinfrastruktur für die Archivierung sicherzustellen.

      Falls Sie weitere Informationen zur guten wissenschaftlichen Praxis benötigen, lohnt sich der Besuch der Webseite Ombudsman für die Wissenschaft, einem „von der DFG eingesetzten Gremium, das allen Wissenschaftlerinnen und Wissenschaftlern in Deutschland bei Fragen und Konflikten im Bereich guter wissenschaftlicher Praxis (GWP) bzw. wissenschaftlicher Integrität zur Seite steht.“ Hier finden Sie weitere Literatur, die sich speziell mit dem Umgang mit Forschungsdaten nach guter wissenschaftlicher Praxis beschäftigt. Unter dieser Adresse finden Sie Verweise auf internationale Literatur zu sogenannten Codes of Conduct in der Wissenschaft. Dieser Artikel beschäftigt sich mit der Frage nach Kooperationen und der Gewährung eines Datenzugangs nach Abschluss eines Drittmittelprojekts, wenn sich die Forschenden womöglich nicht mehr an der Institution befinden, an der sie diese Daten erhoben haben.

      Die Leitlinien der Frankfurt UAS zur Sicherung guter wissenschaftlicher Praxis decken sich im Wesentlichen mit den von der DFG verfassten Leitlinien.

    • 1.5 Aufbau dieser Selbstlerneinheit zum FDM

      Ziel eines guten Forschungsdatenmanagements ist es, die Forschungsdaten für eine möglichst lange Zeit, also weit über die Projektdauer hinaus, verfügbar und für andere nachnutzbar zu halten. Daher wird im Kontext von Forschungsdatenmanagement auch häufig von der Lebensdauer der Daten und damit verbunden von einem Forschungsdatenlebenszyklus gesprochen. Was es damit auf sich hat und welche Aufgaben im FDM anfallen können wird anhand des Forschungsdatenlebenszyklus verdeutlicht, der in Kapitel 2 behandelt wird.

      Ist es dann endlich soweit und Sie möchten ein eigenes Projekt in Angriff nehmen, ist es aufgrund der Anforderungen der großen Forschungsförderer (insb. DFG, BMBF und EU) mittlerweile häufig notwendig, dass Sie als Forschende einen Datenmanagementplan erstellen, der den Umgang der Forschungsdaten während der gesamten Projektlaufzeit umfassend beschreibt. Kapitel 3 wird Ihnen aufzeigen, wie so ein Datenmanagementplan aussehen kann und was Sie beachten sollten.

      Geht es dann tatsächlich an die Erhebung und Verarbeitung der Daten und wollen Sie die Daten für nachträgliche Forschung nutzbar machen, sollten Sie die Forschungsdaten mit Metadaten versehen, die auch Nicht-Beteiligten des Projekts ein umfassendes Verständnis der Daten liefern. Wollen Sie die Daten für eine große fachspezifische Community verfügbar machen, sollte auch die Nutzung von sogenannten Metadatenstandards einbezogen werden. Kapitel 4 wird Ihnen einen Überblick über den Nutzen von Metadaten und Metadatenstandards gewähren.

      Kapitel 5 behandelt die FAIR-Prinzipien, die einen Qualitätsstandard formulieren, um Daten auffindbar, zugänglich, interoperabel und wiederverwendbar zu machen. Auch wenn diese Entwicklung noch vergleichsweise jung ist, müssen Forschungsdaten sich mehr und mehr an diesen Kriterien messen lassen. Neben den eher technisch geprägten FAIR-Prinzipien werden auch die CARE-Prinzipien vorgestellt, welche wiederum die ethischen Anforderungen eines professionellen Umgangs mit Forschungsdaten beinhalten.

      Damit Ihre Daten für andere Forschende eine nützliche Ressource darstellen, müssen sie einen gewissen qualitativen Standard erreichen. Welche Möglichkeiten Sie haben, die Qualität Ihrer Daten zu erhöhen und auf was Sie dabei achten sollten, wird Ihnen in Kapitel 6 vorgestellt.

      Kapitel 7 gibt Ihnen Hilfestellungen dazu, wie Sie Ihre Daten während des Forschungsprojekts besser organisieren können. Dazu zählt einerseits die Nutzung eines Versionierungskonzepts, um sowohl alte als auch neue Daten direkt erkennen und miteinander vergleichen zu können, andererseits aber auch das Erstellen von bestimmten Ordnerstrukturen oder die Verwendung einer einheitlichen Benennung von Dateien und Forschungsdaten.

      Nach der Erhebung von Daten folgt in der Regel die Speicherung dieser Daten auf einem Datenträger, damit Sie diese später wieder abrufen und nutzen können. Außerdem sollten die Daten gemäß guter wissenschaftlicher Praxis nach Abschluss der Forschung irgendwo so aufbewahrt werden, dass andere Forschende Zugriff haben und die Daten nachnutzen können. Auf was Sie dabei achten sollten und welche Unterstützung Ihnen die Frankfurt UAS bietet, ist Thema von Kapitel 8.

      Oft hängen mit der Verarbeitung von Forschungsdaten und der nachträglichen Veröffentlichung auch rechtliche Fragen zusammen. Kapitel 9 gibt einen Überblick darüber, welche rechtlichen Besonderheiten Sie beim Umgang mit Forschungsdaten beachten müssen und wie sie damit umgehen können. Die Ausführungen dieses Kapitels sind allerdings rein informativer Natur und haben keine Rechtsverbindlichkeit. Bei akuten rechtlichen Fragen hinsichtlich der Erhebung oder Veröffentlichung von Daten sollten Sie daher zusätzlich immer noch die Rechtsberatung und/oder den Datenschutzbeauftragten der Frankfurt UAS (dsb@fra-uas.de) miteinbeziehen.

    • Testen Sie Ihr Wissen über die Inhalte dieses Kapitels!

    • Hier sind noch einmal die wichtigsten Fakten zum Kapitel zusammengefasst.