Open Source im professionellen Einsatz
Linux-Magazin 07/2003

IDE-Raid-System als Streamer-Ersatz an der Uni Tübingen

Nie wieder Bandsalat

Der Preisverfall bei IDE-Festplatten eröffnet ihnen neue Einsatzmöglichkeiten als Backupmedien, denn sie kosten inzwischen etwa genauso viel wie DLT- oder AIT-Streamer-Bänder. Der Storage-Cluster der Uni Tübingen zeigt die Backup-Zukunft.

605

Die Datenmengen sind in den letzten Jahren förmlich explodiert, ob in Universitäten, Firmen oder zu Hause: Noch vor etwa fünf Jahren waren Festplatten mit 6 GByte Standard bei Desktop-Rechnern, heute sind 40 bis 60 GByte pro Rechner völlig normal - und in ein bis zwei Jahren steht erneut eine Verdopplung der Speicherkapazität an.

Diese Entwicklung bringt Firmen und Administratoren beim Backup in Bedrängnis, der Preis pro Rechner-Backup hat sich seit 1998 vervielfacht: Ein DDS-3-DAT-Band mit 12 GByte Nettokapazität kostete damals 12 Euro und reichte für ein bis zwei Rechner. Ein DLT- oder AIT-Band mit 40 bis 50 GByte Netto kostet heute 70 Euro und reicht gerade mal für einen Desktop - das entspricht Faktor sechs bis zehn gegenüber 1998.

Weitere Probleme sind der hohe Verschleiß bei Bandlaufwerken und Bändern, wenn Backups etwa nach dem Revolver-Prinzip im Wochenabstand auf immer denselben Bändern landen, sowie die im Vergleich zu Festplatten lange Zugriffszeit und niedrige Datenrate der Bandlaufwerke. Datenvolumina von mehreren Terabyte pro Tag können praktisch nur noch mehrere parallel arbeitende Bandlaufwerke und Tape-Roboter bewältigen.

Raid-Knoten als Backupmedium

Das Datenverarbeitungszentrum der Universität Tübingen hat sich für ein Backupsystem auf Basis von IDE-Festplatten von Dr. Koch Computertechnik[1] entschieden. Der Storage-Cluster besteht aus 24 Backupknoten und einem Server. Jeder Knoten ist ein unabhängiger Rechner mit zwei Athlon-Prozessoren 1500+ MP, 1 GByte RAM, drei 7850-8-IDE-Raid-Controllern von 3Ware sowie einer Gigabit-Ethernet- und einer 100-MBit-Netzwerkkarte.

An jedem IDE-Raid-Controller sind acht Maxtor-Festplatten D540X mit einem Nettovolumen von 152 GByte angeschlossen und zu einem Raid-5 mit Hot-Spare zusammengefasst. Insgesamt kann der Storage-Cluster 64 TByte auf seinen 576 Festplatten speichern, das sind knapp 2,7 TByte pro Knoten in drei unabhängigen Raids. Der aktuelle Preis für einen Knoten mit 200-GByte-Festplatten beträgt gut 11500 Euro.

Die Festplatten der Knoten sind - wie in Abbildung 1 zu sehen - in drei Reihen hintereinander angeordnet und werden von acht 8-Zentimeter-Lüftern gekühlt. Dabei ist jede Festplatte an einer Seite auf ein Aluprofil geschraubt, das wiederum mit zwei Schrauben auf dem Deckel des Gehäuses befestigt ist. So lässt sich eine Festplatte im Betrieb leicht wechseln, ohne teure Wechselrahmen verwenden zu müssen. Hot-Plugging ist trotz Parallel-ATA kein Problem, die 3Ware-Controller sind nach Herstellerangaben darauf ausgelegt und initialisieren die Platte nach Anschluss selbst.

Deutlich schwieriger ist die Kabelführung innerhalb des vorne und hinten offenen Gehäuses, trotz UATA-Rundkabeln (blau), was Abbildung 2 sehr eindrucksvoll zeigt. Je acht Kabel führen von den Controllern durch den Gehäusedeckel zu den Festplatten. Die Beschränkung der Kabellängen auf 45 Zentimeter macht die Verlegung besonders für die hinteren Festplatten schwierig, in der Anfangszeit kam es wegen unter mechanischer Spannung stehender Kabel oft zu Übertragungsproblemen. Ulrich Hahn vom Datenverarbeitungszentrum der Uni Tübingen ist zuversichtlich, dass der Umstieg auf Serial ATA der Ausweg aus der anfälligen Spaghetti-Verkabelung ist.

Backup mit Tuba

Alle Knoten des Storage-Clusters arbeiten mit Linux, das System ist mit den benötigten Diensten und Programmen auf einem separaten Hardware-Raid-1 untergebracht. Beim Booten beziehen alle Knoten jedoch den Kernel per Boot-P vom Backupserver.

Das Backup wird mittels Tuba, dem Tübinger Backup- und Restore System[2], durchgeführt. Dabei handelt es sich um eine Client-Server-Lösung über Ethernet, als Desaster-Recovery eignet sich Tuba daher nur beschränkt. Die Clientprogramme, es gibt sie für verschiedene Betriebssysteme, stellen die zu sichernden Daten zusammen und melden sich beim Backupserver. Dort erhalten sie den Namen des zuständigen Storage-Knotens. Der Server informiert dann den Knoten über das 100-MBit-Netzwerk, welche Clients wie viel anliefern.

Abbildung 1: Die Festplatten sind einfach stehend auf dem Gehäusedeckel des Knotens montiert, acht Lüfter in zwei Reihen sorgen für gute Kühlung.

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Canonical mit eigener Storage-Lösung für die Cloud

    Auf dem Open Stack Summit in Vancouver hat Canonical eine eigene Software-Defined-Storage-Lösung namens Ubuntu Advantage Storage für Open Stack vorgestellt.

  • Big Iron unter Linux

    Wie schafft es eigentlich ein Supercomputer, zehntausende Male mehr Operationen auszuführen als ein PC? Wie ist er organisiert und welche Rolle spielt Linux in dieser Welt? Ein erklärender Blick hinter die Kulissen des Supercomputing.

     

  • Reservespieler

    Ein Hochverfügbarkeits-Cluster unter Linux ist auch mit einfachen Mitteln zu realisieren. Der Einstieg in die Oberliga für Server benötigt nur Standardkomponenten und die beiden freien Programme Heartbeat und DRBD - und schon steht beim Absturz des Mittelstürmers ein Reservespieler bereit.

  • Storage-Cluster

    Wer Cloudumgebungen baut, braucht nicht nur eine skalierbare Infrastruktur, sondern auch eine performante Storagekomponente. Zu den relevanten Speicherlösungen, die dieser Schwerpunkt vorstellt, gehört auch der Newcomer Ceph, der als Objectstore für die Cloud ein schönes Paar mit Open Stack abgibt.

  • Need for Speed

    Wo sehr große Files und Dateisysteme vorkommen und gleichzeitig hohe Performance gefragt ist, müssen herkömmliche Dateisysteme passen. Einen Ausweg bietet Lustre, ein Performance-optimiertes verteiltes Dateisystem für Hochleistungsrechner.

comments powered by Disqus

Ausgabe 05/2017

Digitale Ausgabe: Preis € 7,62
(inkl. 19% MwSt.)

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.