Von Zeit zu Zeit veröffentlicht Netflix eigene Software als Open-Source-Projekte. Diesmal ist Dispatch dran, das Admins beim Krisenmanagement unterstützt.
Auf Vorfälle im Netzwerk zu reagieren, seien sie durch Sicherheitslecks oder Bugs entstanden, ist aufreibend. Dabei ließen sich viele kleine Gegenmaßnahmen bereits im Vorfeld erledigen. Doch bleiben diese Arbeiten im täglichen Stress häufig liegen. Hier verspricht Dispatch von Netflix Abhilfe. Laut der Ankündigung erledigt es nicht nur ein paar dieser Arbeiten schon im Vorfeld für den Admin, sondern bietet auch Prozesse an, um bei späteren Vorfällen auf frühere Erfahrungen zurück zu greifen.
Vier-Komponenten-Kleber
Dispatch bespielt dabei vier zentrale Problembereiche. Der erste ist das Ressourcen-Management. Dazu zählen nicht nur die über einen Vorfall gesammelten Daten, sondern auch die Metadaten zu den Antworten auf den Vorfall. Der zweite Punkt ist das individuelle Engagement: Hier geht es darum, vor dem Hintergrund eines Vorfalls die Mitarbeiter und Teams optimal einzusetzen. Für den dritten Bereich, das Life Cycle Management, versorgt Dispatch die Incident Commander (IC, die Personen, die den Vorfall lösen soll) mit Tools, die dabei helfen, den Status des Vorfalls im Auge zu behalten. Schließlich spielt Viertens auch das Incident Learning eine Rolle: es soll dafür sorgen, die Abläufe bei einer Wiederholung des Vorfalls zu optimieren.
Fest integriert
Dispatch integriert sich dabei eng in die im Unternehmen genutzten Tools, zu denen Slack, die G-Suite, Jira und weitere gehören. Den Zugriff auf AWS-APIs benötigt Dispatch hingegen nicht. Trudeln Meldungen zu Vorfällen von Benutzern oder über das automatische Detection-System herein, landen diese in der Datenbank von Dispatch, das nun einen so genannten Incident Workflow erzeugt. Den bildet es dann wahlweise in PageDuty, G-Suite, Slack und Jira ab. Slack kümmert sich dabei um die Metadaten, in Google Doc und Drive landen die eigentlichen Daten. Ein eigenes Dispatch UI hilft den Admins, den Überblick über die Vorfälle zu behalten. Hier finden sie bei künftigen Vorfällen auch hilfreiches Wissen aus vergangenen Vorfällen.
Überblick behalten
Die Kommunikation über Vorfälle lässt sich dank Dispatch also an zentraler Stelle sammeln und über APIs auch für externe Tools verfügbar machen. Der Code dürfte aber vor allem für größere Firmen von Interesse sein. Zu finden ist er auf Github. Der zugehörige Blogpost liefert noch weitere Informationen rund um typische Merkmale von Incident Management.




