Open Source im professionellen Einsatz
Linux-Magazin 03/2008
© NASA

© NASA

Geschäftsprozesse mit Nagios überwachen

Draufsicht

Admins interessiert beim Monitoring, welche Komponente gerade Probleme bereitet. Das Management oder die Kunden benötigen dagegen eher eine Ansicht, die Auswirkungen eines Ausfalls verdeutlicht. Nagios kann auch diese Perspektive visualisieren - das richtige Addon vorausgesetzt.

514

Wer IT-Dienstleistungen anbietet - sei es für Kunden oder für Mitarbeiter -, ist immer öfter mit dem Thema Service Level Agreements (SLA) konfrontiert (siehe Kasten "Service Level Agreements"). Solche Zielvereinbarungen wären ohne Überwachung nutzlos. Im ungünstigsten Fall ist der Anwender die erste und einzige Monitoring-Komponente, die sich mit einem Problem an die Hotline wendet. Der Administrator kann in diesem Fall erst im Nachhinein damit beginnen, das Problem zu analysieren und nach einer Lösung zu suchen.

Service Level
Agreements

Service Level Agreements (SLAs) definieren in der Regel, zu welchen Zeiten eine bestimmte Anwendung verfügbar sein muss, wie viel Prozent dieser Zeit die Anwendung ausfallen und wie lange ein einzelner Ausfall maximal dauern darf, wann Wartungsarbeiten erlaubt und wie diese anzukündigen sind, wie lange die Antwortzeiten maximal sein dürfen und so weiter. Vor allem SLAs mit externen Dienstleistern regeln auch, was bei Nicht-Einhaltung der SLAs passiert. Meist drohen finanzielle Konsequenzen.

Komponenten-Monitoring

Unternehmen, die ihren Anwendern einen besseren Service bieten wollen, verwenden Monitoring-Systeme, die ihre Server, Router, Switches, WAN-Strecken, und so weiter überwachen. Oft kommen dabei funktionale Tests zum Einsatz, die beispielsweise HTTP-Requests an einen Webserver schicken und die Antwortzeit messen sowie die HTTP-Fehlercodes auswerten. Verlängert sich die Bedenkzeit des Servers oder häufen sich die Fehler, schlägt das System Alarm.

Dadurch bemerkt der Administrator frühzeitig Probleme, die sich ankündigen, und kann dem hohen Besucherandrang auf seiner Internetpräsenz oder dem volllaufenden Filesystem mit geeigneten Maßnahmen begegnen, bevor seine Anwender in die Bredouille geraten.

Komponenten-Monitoring dieses Zuschnitts hilft dabei, Probleme zu vermeiden oder zumindest schnell zu lokalisieren. Bei der Überwachung von Service Level Agreements stößt es allerdings an seine Grenzen. Viele der Tools können zwar auf Ebene einzelner Komponenten Reports generieren oder Verfügbarkeitszahlen für einen bestimmten Zeitraum liefern, die Anwendung aber, auf die sich das SLA bezieht, besteht in der Regel aus mehreren Komponenten. Deren Verfügbarkeit lässt sich nicht ohne Weiteres durch einfache Addition einzelner Ausfallzeiten ermitteln. Überschneiden sich Störungen oder arbeitet ein redundanter Verbund weiter, obwohl einzelne Komponenten ausgefallen sind, dann könnte das einfache Zusammenzählen zu falschen Ergebnissen führen.

Robots

Einen anderen Ansatz verfolgt das Monitoring aus Kundensicht. Dabei bedient eine Robot-Software die zu überwachende Anwendung genau so, wie dies ein Anwender täte. Der Robot arbeitet eine einmal aufgezeichnete Schrittfolge ab, zeichnet die Antwortzeiten auf und prüft, ob sich die erwarteten Resultate einstellen. Diese Art der Überwachung liefert alle Kennzahlen, die zur Bewertung von SLAs nötig sind. Sie hat aber auch einen Nachteil: Sie informiert nur darüber, dass die Anwendung nicht verfügbar ist oder zu langsam antwortet, verrät aber nicht, welche Komponente das Problem verursacht.

Bei kleineren Anwendungen mit nur wenigen Komponenten funktioniert die Lokalisierung des Fehlers meist trotzdem, vor allem wenn ein erfahrener Administrator aus dem Verhalten der Anwendung Rückschlüsse auf die Ursache zieht. Bei einer komplexeren Anwendung, die vielleicht sogar redundant ausgelegt ist und aus Dutzenden Einzelkomponenten besteht, ginge mit dieser Methode allerdings viel Zeit verloren, bis die Ursache entdeckt wäre.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 6 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • LTR-Update: Geschäftsprozesse überwachen

    Für die Überwachung von Service Level Agreements (SLAs) ist es wichtig, neben dem Monitoring einzelner Komponenten auch die Funktionsfähigkeit komplexer Prozesse im Blick zu behalten, in die eine Vielzahl von Programmen und Geräten, teils auch redundant eingebunden sind. EIn Nagios Plug-In leistet genau dies.

  • Volle Kontrolle

    Blindflug birgt ein hohes Risiko. In der Luft wie im Rechenzentrum. Hier wie da helfen deshalb Instrumente dabei, rechtzeitig Gefahren zu erfassen. Die verbreiteste freie Software für diesen Zweck ist Nagios, das sich in vielen kleinen wie großen IT-Umgebungen bewährt.

  • Kostenlose Mobil-App für Nagios

    Das schwedische Unternehmen Op5 hat Version 1.0 einer kostenlosen Android-App veröffentlicht, die Monitoring-Daten eines entfernten Nagios-Systems anzeigt.

  • Immer im Dienst

    Service Level Agreements gehören zum lästigen Teil der Admin-Arbeit - wer ihre Einhaltung überprüfen will, muss die Ausfallzeiten von Diensten addieren und je nach Tageszeit bewerten. Eine Nagios-Erweiterung kann das besser und warnt von sich aus, wenn ein Verstoß droht.

  • Open IT Cockpit

    Rechner und deren Dienste überwachen, das übertragen Admins gern an aufmerksame Tools wie Nagios. Ein neues, halbkommerzielles Projekt aus Hessen bündelt und verbirgt alles unter einer Oberfläche.

comments powered by Disqus

Ausgabe 09/2017

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.