Chaos Toolkit erreicht Version 1.0

Das Chaos Toolkit ist in Version 1.0 zu haben. Die Open-Source-Software veranstaltet ein kontrolliertes Chaos auf verschiedenen Cloudplattformen und hilft Entwicklern so, Fehler in komplexen Setups zu finden.

Welche Tests und Aktionen das Chaos Toolkit in der Cloud anstoßen soll, legen die Entwickler selbst fest. Die Community bringt dabei auch eigene Ideen für Tests ein. Neben dem Kern gibt es Erweiterungen, die auf Kubernetes oder kommerziellen Plattformen wie AWS, Azure oder GCE laufen. Auf Kubernetes killt die Software dann beispielsweise zufällig Pods. Die Entwickler sehen anschließend, ob und wie schnell sich die Infrastruktur davon erholt.

Die Macher der Python-Software haben diese nun in Version 1.0 veröffentlicht. Von großen Features ist nicht die Rede, vielmehr soll die 1.0 anzeigen, dass es sich bei Chaos Toolkit um eine stabile Software handelt. In ihrer Ankündigung schreiben die Entwickler auch, dass sich das Konzept eines stabilen Kerns, den verschiedene Extensions ausbauen, rentiert habe. Die Erweiterungen seien im Wesentlichen Community-getrieben.

Zukunftschaos

Zugleich stellen die Macher um Sylvain Hellegouarch und Russ Miles im Blogpost ihre Zukunftspläne für die Software vor. Unter anderem wollen sie ein Governance-Modell für die Erweiterungen entwickeln. So betreuen im Idealfall die Entwickler ihre Extensions auch als Maintainer. Sie wollen die Dokumentation aktualisieren und an der Chaos-Plattform arbeiten, die sich an Teams richten will. Zugleich soll die Open Chaos Initiative ein Ort werden, um Chaos-Engineering-Konzepte zu diskutieren.

Die Hintergründe zum Thema Chaos Engineering erläutert dabei ein Dokument namens “Principles of Chaos Engineering“. Der Disziplin geht die Annahme voraus, dass in großflächigen, verteilten Softwaresystemen Dinge auf unvorhergesehene Weise schief gehen können. Zwar funktionieren einzelne Dienste reibungslos, kommunizieren sie aber miteinander, kommt es zu den berühmten “Verkettungen unglücklicher Umstände”, die dann trotz Failover und Replikationen doch zu Ausfällen führen können. Chaos Engineering simuliert solche unerwarteten Situation und deckt Probleme im besten Fall in einer kontrollierten Umgebung auf.

Wer sich den Code für das Chaos Toolkit 1.0 einmal ansehen möchte, findet ihn auf Github.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben