Auf dem Weg zu einer FAIRen Datensphäre – als Fundament für Data Science Anwendungen
Die Bereiche Forschungsdaten, Digitalisierung und Data Science bilden einen wichtigen Baustein der Arbeit der Mitglieder der U Bremen Research Alliance: Durch neue Technologien und im Zuge des Einsatzes digitaler Möglichkeiten werden in der Wissenschaft immer größere Datenmengen erhoben, automatisch generiert und kontinuierlich gespeichert.
Dabei fallen immense und in vielerlei Hinsicht heterogene Datenmengen an, die die Grundlage für die interdisziplinäre Schlüsseldisziplin „Data Science“ bilden. Mithilfe von zukunftsweisenden Data Science-Verfahren können auch komplexe und hochdimensionale Datenbestände wertschöpfend genutzt werden. Konkret extrahieren ausgefeilte und wissenschaftlich validierte Methoden, Algorithmen und Systeme, Muster und verwertbare Erkenntnisse aus den Daten, die unter Einbeziehung domänenspezifischer Expertise Schlussfolgerungen und fundierte Entscheidungen hervorbringen. Damit Forschungsdaten aber nachhaltig, disziplinübergreifend und verlustfrei genutzt werden können, müssen sie FAIR sein, d.h. auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable) und wiederverwendbar (Re-usable). Grundvoraussetzungen sind a) die detaillierte Dokumentation der Forschungsdaten selbst sowie aller Vorgänge ihrer Erhebung (Provenance), b) die Sicherung der Datenqualität und c) eine Datenablage gemäß den „FAIR-Prinzipien“.
Die Etablierung eines kooperativen und disziplinübergreifenden Forschungsdatenmanagements ist der Schlüssel für die optimale Wertschöpfung aus multidisziplinären Daten. Damit kann eine deutliche Steigerung des wissenschaftlichen Erkenntnisgewinns und des gesellschaftlichen Nutzens der Wissenschaft einhergehen (siehe White Paper der UBRA).
FAIRe Daten
Forschungsdatenmanagement gemäß der "FAIR-Prinzipien" sowie eine „Open Data-Kultur“ bilden die Basis für die Schlüsseldisziplin Data Science.
"FAIR" steht für:
Findable
auffindbare Daten
Accessible
zugängliche Daten
Interoperable
interoperable Daten
Reusable
wiederverwendbare Daten
Verantwortungsvoll forschen: Ethik, Recht und Critical Thinking beim Umgang mit Daten
Bei der Etablierung eines kooperativen und disziplinübergreifenden Forschungsdatenmanagements gilt es, neben technischen Lösungen, insbesondere bei personenbezogenen Daten, ethische und juristische Aspekte wie Anonymisierung und die informierte Einwilligung zum Data Sharing zu beachten, die in der wissenschaftlichen Gemeinschaft zurzeit umfassend debattiert werden.
In dem Zusammenhang ist auch ein kritisches Bewusstsein – "Critical Thinking" – von Bedeutung, um angemessen und verantwortungsbewusst über die Aufbereitung, Weitergabe und Verwendung von Daten entscheiden zu können.