Wussten Sie, dass die Daten der MassBank jetzt buchstäblich tausend Jahre lang auf Eis gelegt werden?
Anfang Februar letzten Jahres (genau am 02.02.2020!) machte GitHub einen Schnappschuss aller Projekt-Repositorien, packte alles als QR-Code auf eine haltbare Folie und deponierte sie in einer alten Kohlenmine in Svalbard, Norwegen. Noch nie von diesem Ort gehört? Es ist auch als Spitzbergen bekannt, wurde vor hundert Jahren zur entmilitarisierten Zone erklärt, hat Permafrost, beherbergt den globalen Saatguttresor und jetzt auch 21 Terabyte an quelloffenen und offenen Daten. Ein kurzes Video (2:27 min) von diesem Vorhaben finden Sie auf YouTube.
MassBank EU, die am UFZ (Leipzig) gehostet wird, ist ein öffentliches Repositorium von Massenspektraldaten für die wissenschaftliche Community . MassBank-Daten sind nützlich für die Annotation von chemischen Verbindungen, die durch Massenspektrometrie nachgewiesen wurden. Die MassBank-Datensätze werden im Versionskontrollsystem „git“ auf GitHub verwaltet, wobei alle Spektraldaten und die entsprechenden Metadaten in einem menschenlesbaren Datensatzformat vorliegen. Solche Versionskontrollsysteme werden von Programmierern bereits seit Jahrzehnten zur Organisation des Software-Quellcodes verwendet und finden zunehmend auch bei der Verwaltung von Forschungsdaten Anwendung. Die Zusammenarbeit zwischen GitHub und Zenodo ermöglicht es, MassBank-Releases auf Zenodo mit einem Digital Object Identifier zu archivieren, z.B., . arbeiten wir im Rahmen der NFDI4Chem an der Vereinfachung der Datenübermittlung und einer besseren Integration mit den anderen NFDI4Chem-Diensten.
P.S.: Andere Entwicklungen in NFDI4Chem, die über GitHub verfügbar sind, wie z.B. das Chemotion ELN, werden natürlich auch auf Eis gelegt!