SciForge

Publikation und Zitierbarkeit wissenschaftlicher Software mit persistenten Identifikatoren

Wissenschaftlicher Fortschritt hängt zunehmend von der Nutzung und Entwicklung von Software und der Kombination verschiedener Softwarekomponenten ab. Wissenschaftliche Software, sowie die für ihre Nutzung verwendete Hardware, entwickeln sich schnell weiter. So kann die Arbeit mit komplexen Daten durch die Nutzung unterschiedlicher Versionen und differierender Konfigurationen von Software, Betriebssystem und Hardware zu signifikant anderen Ergebnissen führen. Dies steht im Konflikt mit dem Prinzip der Reproduzierbarkeit in den Naturwissenschaften. Lückenhafte Dokumentation und unklare Qualität erschweren zusätzlich Verständnis, Wiederverwendung und Reproduzierbarkeit der durch Software erzeugten Ergebnisse. Außerdem sind bisher verfügbare Repositories für Software und Softwarecode auf die Bedürfnisse der Industrie und der Free and Open Source Software (FOSS) Gemeinschaft ausgerichtet, welche die Anforderungen der wissenschaftlichen Gemeinschaft für die nachhaltige Verwendung von Software in der Forschung nicht vollständig erfüllen.

Darüber hinaus wird Softwareentwicklung bisher nicht hinreichend als wissenschaftliche Leistung wahrgenommen und anerkannt, vergleichbar mit der Situation bei Forschungsdaten vor einigen Jahren. Allerdings nimmt wissenschaftliche Software einen immer prominenter werdenden Platz in der Forschung ein, vor allem in den Naturwissenschaften ist Software zu einem unverzichtbaren Gut geworden. Die in der Forschung entwickelte Software reicht in seiner Komplexität von Skripten für die Datenverarbeitung, über Programme mit zunehmender Komplexität, bis hin zu umfangreichen Programmpaketen und Systemabbildern, z.B. für den Einsatz in Cloud-Infrastrukturen. Software, ihre Qualität und ihre Verwendung beeinflussen maßgeblich die Qualität der erzielten Forschungsergebnisse und deren Nachvollziehbarkeit.

Deshalb wird in der wissenschaftlichen Gemeinschaft diskutiert, wie die damit verbundenen Probleme gelöst werden können, um Lösungen zu finden und umzusetzen, welche die Bedürfnisse von Wissenschaftlern in Bezug auf Software, die im wissenschaftlichen Kontext verwendet wird, befriedigt. Wie auch für Forschungsdaten geschehen, müssen Antworten auf eine Vielzahl von damit verbundenen Fragen und ein gemeinsames Verständnis im Umgang mit wissenschaftlicher Software mittels definierter Prozesse gemeinsam entwickelt werden. Unter anderem müssen diese Prozesse Fragen zu folgenden Aspekte adressieren: Qualitätssicherung, Versionierung und Dokumentation, Nachvollziehbarkeit, Reproduzierbarkeit und Wiederverwendbarkeit, Archivierung und Verwendung von persistenten Identifikatoren, Metriken zur Evaluierung und Validierung, Messung von Produktivität und Einfluss, sowie Verbreitung und Anerkennung der wissenschaftliche Leistung. Darüber hinaus, müssen der freie Zugang (Open Access), die Nutzung sowie das Zusammenspiel von Softwarepublikationen mit Datenpublikationen und traditionellen Publikationen (Papers) berücksichtigt werden.

Als Beitrag zur aktuellen Diskussion zu Veröffentlichung von wissenschaftlicher Software, soll das von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekt SciForge, sich mit diesen Fragen befassen und zur Lösung der adressierten Probleme beitragen. Ein Netzwerk von Wissenschaftlern aus verschiedenen Forschungsbereichen soll dazu prägnant und gezielt zu diesem Thema adressiert werden und Beiträge bei der Entwicklung des Konzepts zur Einführung definierter Prozesse und einer Referenz-Plattform leisten. Um die Anerkennung der wissenschaftlichen Leistung durch Software zu stärken und die Sichtbarkeit zu erhöhen, arbeitet das GFZ in dem Projekt SciForge an einem Konzept zur Veröffentlichung wissenschaftlicher Software. Publikation und Zitierbarkeit wissenschaftlicher Software soll, ähnlich wie bei Daten-Publikationen, wissenschaftliche Kriterien erfüllen und mittels definierter Prozesse und unter Nutzung persistenter Identifikatoren (DOI) erfolgen.

Der Name SciForge setzt sich aus den Begriffen Science und Forge zusammen und ist an den Namen SourceForge angelehnt. Die 1999 gegründete Plattform SourceForge.net ist die weltweit größte offene Plattform für Entwickler von FOSS, und war der erste Anbieter, der Tools zur zentralen Steuerung und Verwaltung der Softwareentwicklung als kostenlosen Service bietet. Mit mehr als 230.000 FOSS-Projekten, mehr als drei Millionen Downloads täglich, der Hilfe von Experten und seiner globaler Reichweite, hat sich SourceForge.net zu einem der weltweit größten und zuverlässigsten Repositories von FOSS etabliert und nachfolgende Plattformen wie GitHub inspiriert.

Laufzeit des Projekts: 1. Januar - 31. Dezember 2014