Open Source im professionellen Einsatz
Linux-Magazin 12/2011
© Gina Sanders, Fotolia

© Gina Sanders, Fotolia

Opsview-Monitoring eines KVM-Servers im Clusterbetrieb

Pulsmesser

, ,

Gerade im Notfall will der Admin schnell informiert sein, wenn ein System in der privaten Wolke streikt. Weder Monitoring- noch Hochverfügbarkeits-Konfiguration müssen dabei kompliziert sein, auch ein einfaches Setup mit KVM, Pacemaker, DRBD und Opsview hilft in den meisten Fällen.

739

Seit der Release 2.6.20 des Linux-Kernels im Februar 2007 ist die Kernel-based Virtual Machine KVM ([1], [2]) auf dem besten Weg, andere Virtualisierungslösungen in vielen Bereichen vom Markt zu verdrängen. Nicht selten dient KVM auch als Grundlage für einen Virtualisierungscluster, der mehrere Gäste in einer hochverfügbaren Umgebung betreibt – dank Open-Source-Tools wie Heartbeat [3] und Pacemaker [4].

Nur wenig Monitoring

Dennoch sehen immer noch viele Systemverwalter bei Clustern keine Notwendigkeit, die Hosts und virtuellen Gäste zu monitoren. Heartbeat und Pacemaker bieten eingebaute Alerting-Funktionen. Vielen Admins reicht es, per E-Mail über den neuen Status des Clusters informiert zu werden. Doch mit einem einheitlichen, zentralen Monitoring, das auch die virtuellen Gastsysteme einer privaten Wolke einbindet, erhält der Admin eine nicht zu unterschätzende Notfallzentrale, in der er alle Systeme auf einen Blick überwachen und im Ernstfall sofort eingreifen kann.

Doch noch vor dem Monitoring stehen grundsätzliche Überlegungen zum Cluster-Setup: Eine simple Kombination aus Heartbeat und Pacemaker mit der Virtualisierung KVM sowie Logical Volumes und DRBD [5] kann vielleicht nicht mit dem Funktionsumfang von VMware mithalten, dafür muss der Admin aber auch nicht so tief in die Tasche greifen (Abbildung 1). Mit wenig Aufwand erhält er ein System, in dem immer eine virtuelle Instanz verfügbar ist.

Abbildung 1: Zwei leistungsstarke Server als Gastgeber sowie Heartbeat, Pacemaker und DRBD bilden das Gerüst der Corebiz Virtual Server Base. Die Überwachung des Ganzen übernimmt Opsview.

Permanente Datensynchronisation mit DRBD sorgt dafür, dass zumindest die auf der virtuellen Festplatte gespeicherten Daten sofort wieder verfügbar sind, nur ungesicherte Session-Daten der Anwender gehen verloren, ähnlich wie bei einem lokalen Systemabsturz. Raucht einer der beiden Virtualisierungshosts ab, booten die VMs ganz automatisch neu. Dann aber laufen alle Instanzen auf einem Knoten. Die Mitarbeiter können nach kurzer Zeit weiterarbeiten, genügend Ressourcen auf dem verbleibenden Node vorausgesetzt.

DRBD und Logical Volumes

Abbildung 1 zeigt das Beispiel eines Linux-Clusters mit zwei Knoten auf Basis des Linux-Systems Corebiz VSB (Virtual Server Base, [6]) der Münchner LIS AG. Für die virtuelle Festplatte einer VM besteht der Stack aus dem physikalischen Speicher (in der Regel ein Raidsystem), einer LVM-Partition und für die Datenreplikation zwischen den beiden Knoten einem DRBD-Container. Der wird entweder der virtuellen Maschine direkt zugewiesen oder alternativ auf dem Cluster eingebunden und als Partition für eine Imagedatei (Qcow2, Vmdk, …) genutzt.

Dem Cluster-Management dient die Kombination aus Heartbeat 3 und Pacemaker ([7], [8]). Ersteres sorgt dafür, dass die Knoten miteinander kommunizieren können, und prüft, ob das "Herzklopfen" eines Knotens noch zu hören, also ob der Node noch verfügbar ist. Pacemaker als Cluster Resource Manager (CRM) weiß, welche Dienste im Cluster voneinander abhängen, und kennt zu jedem Zeitpunkt deren Zustand.

Fürs Monitoring ist besonders Pacemaker von Interesse. Um den Zustand der Cluster-Ressourcen festzustellen, nutzt er so genannte OCF-Agenten (Open Cluster Framework, [9]). Die sind eine Art Weiterentwicklung der Ressourcen-Agenten der Linux Standard Base (LSB), die Admins als Init-Skripte unter »/etc/init.d« auf einem Linux-System finden. Ein solcher Agent stellt typischerweise folgende Funktionen bereit:

  • »start« : Startet die Ressource
  • »stop« : Stoppt die Ressource
  • »monitor« : Gibt Auskunft über den Status der Ressource
  • »meta-data« : Gibt Informationen über die Ressource

Einen OCF-Agenten kann der Admin zwar in einer beliebigen Programmier- oder Skriptsprache erstellen, die meisten Agenten sind jedoch simple Shellskripte. Weitere Parameter, die viele Agenten benötigen, um die oben genannten Aktionen durchführen zu können, sind in der Konfiguration der Pacemaker-Ressourcen festgelegt. Darüber hinaus muss der Admin noch Timeouts und Monitor-Intervalle definieren.

Jeder Ressource im Cluster weist der Admin einen passenden Agenten zu und gibt ihm die nötige Konfiguration mit. Der KVM-Cluster braucht einen Agenten für DRBD und das Management der virtuellen Maschinen. Für Letzeres bietet sich meist der Agent »ocf:heartbeat:VirtualDomain« an, bei Corebiz kommt eine Eigenentwicklung zum Zug.

Neben dem Starten und Stoppen prüft Pacemaker diese Ressourcen auch automatisch und regelmäßig mit dem Monitor-Kommando der OCF-Agenten. Auf diese Weise weiß der Cluster ständig über den Zustand seiner Ressourcen Bescheid.

Per Default prüfen der Corebiz-OCF- und auch der Virtual-Domain-Agent lediglich, ob eine KVM-Instanz aktiv, aber nicht, ob ein einzelner Dienst erreichbar ist. Doch »ocf:heartbeat:VirtualDomain« erlaubt weitere Checks, um die Verfügbarkeit beliebiger Dienste zu prüfen und diese automatisch auch auf anderen Hosts neu zu startet. Die Ursache des Ausfalls ist damit aber nicht behoben.

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Opsview Iron: Monitoring für KMU

    Der Anbieter Opsview möchte seine Monitoring-Lösung mit einer neuen Preisklasse auch kleinen und mittleren Unternehmen schmackhaft machen.

  • Daseq setzt auf Monitoring-Lösung Opsview

    Das deutsche Unternehmen Daseq verkauft Open-Source-Sicherheitslösungen und Red-Hat-Schulungen und schließt nun eine Vertriebspartnerschaft mit Opsview, einem international aufgestellten Monitoring-Anbieter.

  • Opsview 4.5 zeigt Business-Sicht

    Die Open-Source-basierte Monitoringlösung Opsview bringt in der neuen Version 4.5 Business Service Monitoring (BSM).

  • Pacemaker

    Macht ein Clusterknoten schlapp, startet die HA-Software Pacemaker bekanntermaßen die dabei mitgerissenen Dienste auf einem anderen Knoten neu. Wenig bekannt ist des Schrittmachers Dienste-Monitoring, mit dessen Hilfe der Clustermanager hängenden Diensten einzeln auf die Beine hilft.

  • Schrittmacherdienste

    Zero Downtime ist angesichts globaler Zusammenarbeit über Kontinente und Zeitzonen hinweg keine ungewöhnliche Forderung mehr. Daran gebunden ist der Ruf nach Hochverfügbarkeit. Um ihm unter Linux nachzukommen, bietet sich der neue Cluster-Resource-Manager Pacemaker mit weiteren Komponenten an.

comments powered by Disqus

Ausgabe 06/2017

Digitale Ausgabe: Preis € 6,40
(inkl. 19% MwSt.)

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.