Mit seinem Archive-Programm will Github den gehosteten Code bis zu 10000 Jahre lang archivieren. Der Grund: Hardware lebt häufig länger als die Software.
Egal ob Festplatten, SSDs, CDs oder Tapes – sie alle eint laut dem Codehoster Github ein Problem: Sie überleben im besten Fall einige Jahrzehnte. Das sehe bei einiger Hardware anders aus, die deutlich länger leben könne. Damit der Code nicht verloren geht, hat sich Github für sein Github Archive Program mit verschiedenen Archivierungs-Organisationen und -Institutionen zusammengetan, darunter die Long Now Foundation, das Internet Archive, die Software Heritage Foundation und das Arctic World Archive.
Die Hoffnung: Unter dem Code von heute gibt es nützliche Konstrukte, die im Laufe der Jahrzehnte und Jahrhunderte wieder verloren gehen. Historisch betrachtet ist das nicht abwegig: Viel Wissen über Rezepte, Architekturprinzipien oder Medizin aus den vergangenen Jahrhunderten lässt sich heute nicht mehr oder nur sehr mühselig rekonstruieren.
Von Heiß bis Kalt
Github verfolgt beim Archivieren einen Ansatz mit unterschiedlichen zeitlichen Schichten: es gibt Archive in den Ausprägungen Hot, Warm und Cold. Als Hot bezeichnet Github die jüngsten Archive auf Github selbst, GH-Torrent und GH Archive. Mittelfristig landet das Archiv von Github regelmäßig im Internet Archive und bei der Software Heritage Foundation.
Einen sehr viel längeren Zeitplan gibt es für die “kalten Archive”, wobei der Begriff “Cold” wörtlich zu nehmen ist: So soll die Bodleian Library der Universität Oxford die 10 000 Github-Repositories mit den meisten Sternen und den wichtigsten Abhängigkeiten in einem arktischen Code-Tresor verwahren.
Im Februar 2020 will Github zudem einen Snapshot jedes öffentlichen Repositories aufnehmen und diesen Code im Github Arctic Code Vault lagern. Dabei kommt die Technologie eines Unternehmens namens Piql zum Einsatz, die die Informationen auf Film schreibt. Unter festgelegten Umweltbedingungen soll das Filmmaterial mindestens 500 Jahre lang halten. Verstaut wird es fernab von katastrophenanfälligen Gegenden, auf Spitzbergen in einer stillgelegten Kohlemine.
Nicht zuletzt tut sich Github mit Project Silicia zusammen, einem Archivierungsprojekt des Mutterunternehmens Microsoft. Das will die Daten mit einem Femtosekunden-Laser auf Glasscheiben aus Quarz schreiben. Das Projekt peilt dabei eine Haltbarkeit von über 10 000 Jahren an.




