Geschichten über Kubernetes-Fails

Henning Jacobs arbeitet beim Modeversandhaus Zalando, das seit 2016 Kubernetes einsetzt. Nun sammelt er Geschichten zu Kubernetes-Fails. Die zeigen, was im Umgang mit der Container-Plattform und ihrem Ökosystem schiefgehen kann.

Wer Tech-Konferenzen zum Thema Cloud besucht, hört selten Horrorstories über die verwendeten Technologien. Meist schlagen die Unternehmen, die sie einsetzen, Success Stories vor. Die berichten dann, wie Unternehmen XY erfolgreich von der veralteten Technologie Z auf die neue Technologie A gewechselt ist. Herausforderungen auf dem Weg halten diese Geschichten zwar auch parat, aber nur, um sie am Ende erfolgreich zu meistern.

Geschichten vom Scheitern oder von Ausfällen einer bejubelten neuen Technologien tauchen seltener auf. Und wenn, dann oft nur in persönlichen Gesprächen mit anderen Konferenzteilnehmern. Sie sind aber wertvoll für Admins, die mit einer noch neuen Technologie arbeiten müssen. In der Regel ist es schwierig genug, die Konzepte neuer Plattformen zu verstehen und diese überhaupt an den Start zu bringen. Erst dann zeigen sich aber unter Umständen die mit der Technologie verbundenen Stolperfallen, die dann offenbar jedes Unternehmen intern selbst lösen will.

Fehlende Postmortem-Kultur

Das aber sollte im Open-Source-Umfeld nicht so sein und liegt auch an einer fehlenden Postmortem-Kultur in vielen eher traditionell aufgestellten Unternehmen. Die sind gerade dabei, mit den neuen Technologien auch die Unternehmenskultur zu öffnen. Dabei gehen sie zwar gern mit Erfolgen hausieren, kehren Ausfälle und Probleme aber lieber verschämt unter den Teppich. Doch Probleme mit Technologie sind normal, Teil des Prozesses und im Idealfall offen zu diskutieren.

Das ein wenig zu ändern hat sich Henning Jacobs auf die Fahnen geschrieben. Laut seinem Blogpost habe ihn der Vortrag “101 Ways to Crash your Cluster” von Marius Grigoriu und Emmanuel Gomez auf der Kubecon 2017 inspiriert, selbst eine Sammlung von Geschichten über Kubernetes-Fails zu kompilieren. Neben seinem eigenen Vortrag, den der Blogpost verlinkt, hat er auf Github eine ganze Liste von Texten rund um Kubernetes-Ausfälle zusammengetragen. Er hofft, dass auch andere Firmen und Admins seinem Beispiel folgen und es in Zukunft mehr Talks gibt, die sich mit technischen Problemen rund um die Container-Plattform auseinandersetzen.

Bei seinen Recherchen über reguläre Suchmaschinen wurde er jedenfalls nicht auf Anhieb fündig. Laut Jacobs waren viele der Geschichten Success-Stories, die darüber schrieben, wie sich Ausfälle vermeiden lassen, keine Postmortems also. Wer solche kennt, kann dem Autor Links auf Twitter zusenden oder einen Pull Request im oben erwähnten Github-Repository veröffentlichen.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben