Open Source in der Forschung
Unter dem Motto Open Research Software widmet sich die Helmholtz-Gemeinschaft dem offenen Zugang zu wissenschaftlicher Software.
Heinz Pampel vom Helmholtz Open Science Office befasst sich in einer dreiteiligen Artikelreihe mit dem Thema Open Science. Im dritten Teil: Open Source in der Forschung.
Mit der voranschreitenden Digitalisierung von Forschung und Lehre steigt die Zahl an Software-Lösungen, die an wissenschaftlichen Einrichtungen entstehen. Ob zur Analyse großer Datenmengen, zur Steuerung von wissenschaftlichen Geräten oder zur Visualisierung von wissenschaftlichen Ergebnissen – Forschungssoftware ist heute ein zentrales Element im wissenschaftlichen Erkenntnisprozess.
Damit Open Science funktioniert, wissenschaftliche Ergebnisse also offen verfügbar und reproduzierbar sind, müssen in vielen Fachgebieten auch die Programmcodes offen zugänglich sein. Dieser Herausforderung widmet sich Helmholtz unter dem Begriff Open Research Software. Bereits 2007 wurd ein Positionspapier erarbeitet. Seit 2020 agiert das Helmholtz Forum Forschungssoftware als Netzwerk zu dem Thema.
In diesem Verbund arbeiten Vertreter:innen aus Wissenschaft und Informationsinfrastruktur an der Förderung von Open Research Software. Partner ist das Software Services Cluster der Plattform Helmholtz Federated IT Services (HIFIS). HIFIS unterstützt Forscher:innen im Umgang mit Software unter dem Motto „Helmholtz IT for Science“. Zum Angebot zählen zum Beispiel Kurse wie „Let's make your script ready for publication“ und Einzelberatungen, aber auch digitale Infrastrukturen wie der HIFIS Transfer Service (HTS). Dieser sorgt für den reibungslosen Austausch großer Datensätze zwischen den Helmholtz-Zentren.
Ein nachhaltiger Umgang mit wissenschaftlicher Software wird auch von Förderorganisationen eingefordert. S0 behandelt die Deutsche Forschungsgemeinschaft (DFG) das Themenfeld in ihren „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ umfassend. Diesen Kodex verankern derzeit alle Hochschulen und außeruniversitären Forschungseinrichtung in Deutschland. Eine der Anforderungen an die digitale Wissenschaftspraxis dort lautet: „Bei der Entwicklung von Forschungssoftware wird der Quellcode dokumentiert.“ Auch die Europäische Kommission verlangt in ihrem neuen Rahmenprogramm Horizon Europe nicht nur den offenen Zugang zu wissenschaftlichen Publikationen und Forschungsdaten, sondern auch die Bereitstellung der verwendeten Tools, die zur Nachnutzung von veröffentlichten Forschungsdaten nötig sind.
Doch mit der Bereitstellung der Software allein ist es meist nicht getan. Notwendig sind auch neue Publikationsstrategien. Sie müssen einerseits die Qualitätssicherung des Codes garantieren und andererseits auch die Zitation der Software erlauben – erst dann ist sichergestellt, dass die Programmierer:innen adäquate Anerkennung im wissenschaftlichen Reputationssystem finden.
Vor diesem Hintergrund beginnen Forschungseinrichtungen digitale Infrastrukturen aufzubauen, sogenannte Repositorien, auf denen wissenschaftliche Software offen publiziert werden kann. So zum Beispiel am CERN in Genf: Dort wurde das Open-Access-Repositorium Zenodo implementiert. In Zusammenarbeit mit der Entwicklungsplattform GitLab stellt Zenodo wissenschaftliche Programmcodes als referenzierbares Produkt der wissenschaftlichen Arbeit dauerhaft zur Verfügung. Dazu wird die Software mit einem Digital Object Identifier (DOI) adressiert und kann so in der Publikationsliste geführt werden – dadurch wird ein breiter Blick auf Forschungsleistung ermöglicht. Ähnliche Strategien verfolgen auch die Helmholtz-Zentren. Ihr Ziel ist es, Programmcodes als Produkt wissenschaftlicher Arbeit anzuerkennen, damit die wichtige Arbeit der Entwickler:innen von Forschungssoftware sichtbar wird.
Um die Qualität der Software sicherzustellen, tauschen sich die Forscher:innen über dedizierte Software-Journale aus, etwa über die Open-Access-Zeitschrift Journal of Open Source Software. Die Gutachter:innen dieser Zeitschrift prüfen einen Code und dessen Dokumentation. Sind alle Kriterien erfüllt, wird die Dokumentation als sogenanntes Software-Paper veröffentlicht. Dieser Artikel referenziert dann die publizierte Software auf einem Repositorium. Um ein Forschungsergebnis entsteht so ein Wissensraum, der im Sinne der Open-Science-Idee nicht nur Daten und Interpretationen vernetzt, sondern auch verwendete Methoden und Werkzeuge.
Aktuell beschäftigt sich eine wachsende Zahl von Helmholtz-Zentren mit der Verankerung von Leitlinien zum Thema Forschungssoftware. Dazu wurden bereits 2017 Empfehlungen zur Implementierung von Leit- und Richtlinien zum Umgang mit wissenschaftlicher Software an den Helmholtz-Zentren erarbeitet. Eine Muster-Richtlinie für den nachhaltigen Umgang mit Forschungssoftware sowie eine Checkliste bietet den Zentren eine Orientierung bei der Entwicklung solcher Policies.
In Kooperationen mit anderen Wissenschaftsorganisationen in Deutschland wurde 2018 außerdem eine „Handreichung zum Umgang mit Forschungssoftware“ sowie 2019 ein Positionspapier erarbeitet.
In Zusammenarbeit mit sechs europäischen Forschungsorganisationen hat Helmholtz im G6-Netzwerk im Dezember letzten Jahres die Bedeutung der Forschungssoftware in dem „G6 statement on Open Science“ als Schlüssel für die moderne Forschung prominent betont. So heißt es dort: „Die G6-Mitglieder sind sich daher einig, dass Forschungssoftware denselben Grundsätzen und strengen Anforderungen genügen muss, die Forscher an ihre Veröffentlichungen, Daten, Proben, Geräte und Infrastrukturen stellen.“
Im Verein der Research Software Engineers in Deutschland (de-RSE) vernetzen sich zudem die Entwickler:innen von Wissenschafts-Software. Der Verein hat jüngst mit dem campusSOURCE Förderverein und dem Helmholtz Open Science Office, den „campusSOURCE Award 2022“ zur Förderung von Softwareentwicklung in der Forschung vergeben. Mehrere der Gewinner kommen aus Helmholtz. Der erste Preis geht an eine Gruppe von Helmholtz Munich, die mit „cookietemple“ die Softwareentwicklung fördert. Der zweite und dritte Preis geht an das DLR, u. a. für den Standard „Citation File Format (CFF)“ zur Zitierung von Forschungssoftware.
Die Weichen für die Realisierung von Open Research Software sind gesetzt. Durch die immer stärkere Digitalisierung der Forschung wird es sich schnell zum Megathema von Open Science entwickeln.
Veranstaltungshinweis
Am 07. April 2022 veranstaltet das Helmholtz Forum Forschungssoftware, das gemeinsam von der Task Group Forschungssoftware des Arbeitskreis Open Science und das HIFIS Software Cluster getragen wird, ein weiteres Helmholtz Open Science Forum zum Thema Forschungssoftware. Die Veranstaltung richtet sich an interessierte Mitarbeiter:innen aus Helmholtz. Programm und Anmeldung.
Heinz Pampel, Helmholtz Open Science Office