Enterprise-Filesysteme unter Linux im Vergleich
Platzverwalter
von Jens-Christoph Brendel
Erschienen im Linux-Magazin
2008/10
Wenig hat sich so verändert wie die Welt der Filesysteme: In 20 Jahren wuchs der Platz, den sie verwalten, auf das Dreitausendfache und mehr. Dank neuer Features halten sie dieses Tempo mit.
"Da Files unabhängig von den laufenden Prozessen beziehungsweise dem Betriebssystem existieren, müssen sie in Verzeichnissen in vereinbarter Form auf dem Datenträger registriert sein. Dazu existiert ein Fileverzeichnis auf jedem Datenträger." Das ließe sich ohne Weiteres unterschreiben. Stutzig wird man allerdings bei den Beispielen, die der Autor des Zitats dann heranzieht: "Das kann vollständig auf einem gesonderten Bereich des Datenträgers erfolgen (OS/ES, CP/M) oder in einem Wurzelverzeichnis und im Filesystem selbst (VMS, RSX-11, Unix, MS-DOS)."
CP/M? Richtig, das Zitat stammt aus einem gut 20 Jahre alten Wälzer über Betriebssysteme [1]. Danach scheint sich jedenfalls an der Funktion der Filesysteme in den letzten zwei Jahrzehnten nichts Besonderes geändert zu haben. Lohnt es sich überhaupt noch, immer wieder Artikel darüber zu schreiben?
Einen Fingerzeig auf die Antwort liefert ein Blick auf die Medien, von denen damals die Rede war: Der SCSI-Standard hatte eben das Licht der Welt erblickt (1986). Im Erscheinungsjahr des Buches definierte die Universität Berkeley erstmals den Begriff Raid. Für Heimcomputer waren Musikkassetten oder 5,25-Zoll-Floppies als Massenspeicher gang und gäbe. Der Profi arbeitete schon mit Festplatten, aber die fassten ein paar Dutzend, maximal wenige Hundert Megabyte und waren so teuer, dass eine heutige Terabyte-Disk zu den damaligen Preisen (5,2 Dollar/MByte) mehr als 3,6 Millionen Euro kosten müsste.
Größenexplosion
Tatsächlich kostet sie um die 150 Euro, tatsächlich ist sie vieltausendmal größer als zu der Zeit, aus der das Zitat stammt, und im Moment verdoppelt sich ihre Kapazität tatsächlich jedes Jahr. Diese Größenexplosion muss sich natürlich auf die Filesysteme auswirken, die diesen Platz verwalten: Zum einen müssen sie mit weit größeren Volumina klarkommen (Abbildung 1), was im einfachsten Fall heißt, mehr Bits für die Blockadressen bereitstellen. Aber das ist nicht alles: Die Entwickler von Ext 4 haben etwa errechnet, dass ein Filesystemcheck auf einem 64-Bit-Filesystem maximaler Größe 119 Jahre laufen würde. Unpraktisch.
Auch eine moderate Beschleunigung brächte keinen Ausweg, stattdessen sind ganz andere Lösungen gefragt, um die Kapazitäten heutiger Festplatten zu beherrschen. Als Zielvorgaben stehen deshalb im Pflichtenheft der Filsesystem-Programmierer unter anderem:
- Fehlertoleranz und Selbstheilungsfähigkeiten
-
Bessere Performance durch intelligente Block-Allozierung und
geringere Fragmentierung im Betrieb (beispielsweise dank Extents)
-
Höhere Kapazitäten und bessere Skalierung der
Gesamtgröße, aber gleichzeitig auch der Maximalzahl möglicher Files und Verzeichniseinträge
-
Mehr Datensicherheit durch Transaktionen, Redundanz und/oder
Prüfsummen, damit es gar nicht erst zu einem Fehler kommen kann, der zu beheben wäre
-
Integration von Volumemanager-Funktionen wie etwa von
Snapshot-Mechanismen oder Raid-Konfigurationen in das Filesystem
Ein Filesystem, dass alle diese und noch etliche zukunftweisende Funktionen mehr bereits jetzt realisiert, ist ZFS [2] unter Solaris. In Linux wird es jedoch vermutlich nicht so bald Einzug halten, was an lizenzrechtlichen, aber auch technischen Problemen liegt. Umso mehr lohnt ein Blick auf den Stand der Dinge bei Filesystemen, die alternativ unter Linux verfügbar sind und sich für den professionellen Einsatz eignen.

|
Abbildung 1: Neue Technologien ermöglichten bisher immer wieder eine höhere Aufzeichnungsdichte und damit höhere Kapazitäten von Festplatten. Mit Patterned Media und Heat-assisted Recording sind bereits die nächsten Techniken am Start, die wiederum größere Platten erlauben. (Bild © Quelle: Hitachi)
|
Ext 3 und Ext 4
Ext 3 [3], entstanden aus einer Erweiterung des Vorgängers Ext 2 um Journaling-Funktionen, ist sicherlich das derzeit meistverwendete Filesystem unter Linux. Allerdings fehlen der inzwischen schon angegrauten Entwicklung nicht nur fortgeschrittene Funktionen wie Online-Defragmentierung, Prüfsummen, transparente Komprimierung oder Verschlüsselung, es hat mit nur 16 TByte auch ein Größenlimit, an das heutige Filesysteme in der Tat stoßen. Das Journal speichert die Metadatenblöcke außerdem - anders als XFS, JFS oder Reiser-FS - nicht komprimiert, sondern 1:1, was nicht gerade platzsparend ist.
Folgerichtig programmieren Entwickler seit 2006 am Nachfolger Ext 4 [4], der viele dieser Beschränkungen aufheben soll. Allerdings existiert bis heute erst eine Betaversion, die sich ausdrücklich nicht für den Produktivbetrieb eignet, vor allem weil sie noch mit internen Formaten experimentiert.
Geplant sind neben Features, die größere Files und Filesysteme erlauben, auch solche, die der Zuverlässigkeit und Robustheit zugute kommen, etwa Checksummen für Metadaten. Der bequeme Migrationspfad vom Vorgänger zu Ext 4, den es später einmal geben soll, wird dann für die große Anzahl Ext-3-Nutzer das überzeugendste Argument sein.
| Whitepaper |
|
Open Source Datenintegration in der Praxis: Fallstudien und Anwendungsbeispiele
Über die letzten Jahre hinweg haben sich Open Source Lösungen als fester Bestandteil des gesamten Datenintegrationsmarktes etabliert. Viele Unternehmen haben bereits das Open Source Modell für Ihre Datenintegrationsprojekte aufgegriffen. Das vorliegende White Paper illustriert anhand ausgewählter Fallstudien und Anwendungsbeispiele die Implementierung von Open Source Datenintegration in der Praxis und benennt die daraus resultierenden Vorteile.
Download PDF (Registrierung erforderlich)
|
|
The Role of Open Source in Data Integration
Obwohl in den letzten Jahren viele technische Fortschritte erzielt werden konnten, verfügen die meisten Datenintegrationsprozesse nach wie vor nur über eine sehr begrenzte Automatisierung. Das vorliegende White Paper von dem Industry Analyst Mark Madson wird zunächst ein grundlegendes Verständnis von Daten Integration vermitteln, die Vorzüge von Open Source Lösungen für Daten Integration erläutern und Ihnen professionelle Empfehlungen geben, damit Sie Ihre Integrationsjobs noch einfacher und produktiver gestalten können.
Download PDF (Registrierung erforderlich)
|
Dieser Online-Artikel kann Links enthalten, die auf nicht mehr vorhandene Seiten verweisen. Wir ändern solche "broken links"
nur in wenigen Ausnahmefällen. Der Online-Artikel soll möglichst unverändert der gedrucken Fassung entsprechen.
|