Aus Linux-Magazin 07/2026

Notizen von der Stackconf 2026

Ein breites Themenspektrum, das viele Referenten in der Tiefe ausloteten. Das bildete die Mischung für eine gelungene Konferenz zu Fragen der Open-Source-Infrastruktur.

Abbildung 1: Jeff Fan, der zweite Vortragende mit einem Referat zu llm-d, dem Load Balancer für Sprachmodelle unter Kubernetes. Quelle: Netways

Lässt sich ein Sprachmodell in einem Kubernetes-Cluster betreiben? Die Antwort könnte ausfallen wie bei den Radio-Eriwan-Witzen: “Im Prinzip ja, aber …” Auf der Open Source Infrastructure Conference Stackconf in München, ausgerichtet von der Event-Sparte des Nürnberger IT-Lösungsanbieters Netways, lieferte die Fragestellung Stoff für gleich zwei Vorträge.

Prinzipiell würde es funktionieren, aber ohne besondere Vorkehrungen müsste man sich mit einer ungenügenden Performance zufriedengeben. Das Problem: Der standardmäßig verfügbare Load Balancer, der die Last nach dem einfachen Round-Robin-Verfahren auf die Pods verteilt, die noch freie Kapazitäten haben, ist für zustandslose Web-Applikationen gedacht. Dort sind die Anfragen jeweils in sich abgeschlossen und nicht von einander abhängig. Die Anfragen an ein LLM sind aber nicht unabhängig von einander. So kann es hier eine große Rolle spielen, welche Informationen wo bereits im Cache vorhanden sind. Zudem haben die beiden Phasen des Inferencing, die Verarbeitung der Eingabedaten in der Prefill-Phase, die eher Rechenpower braucht, und die Erzeugung der Ausgabetoken in der Decode-Phase, die mehr vom Memory abhängt, sehr unterschiedliche Ressourcenprofile. Daher ist es günstig, wenn sie der Load Balancer auf verchiedene Maschinen verteilt (Prefil/Decode Disaggregation).

Die Lösung für ein intelligentes Loadbalancing für Sprachmodelle ist llm-d, ein Kubernetes-natives Open-Source-Framework für verteilte LLM-Inferenz, das auf hohe Skalierung, intelligentes Routing und disaggregiertes Serving ausgerichtet ist. Vorgestellt wurde es von Antonio Cardace von Red Hat. Red Hat ist neben Partnern wie Google, NVIDIA oder IBM Research eng in die Entwicklung von llm-d eingebunden.

Der zweite Vortrag zum Thema unter dem Titel “Stop treating LLMs like REST-Apis” kam von Jeff Fan (Digital Ocean, Abbildung 1). Er behandelte llm-d eher unter praktischen Gesichtspunkten und demonstrierte seine Inbetriebnahme in unter 15 Minuten.

Das ein Problem beim Betrieb der heutzutage allgegenwärtigen generativen KI so prominent auf der Konferenz vertreten war, wundert nicht. Das Themenspektrum war aber viel breiter. Ein zweiter mehrmals diskutierter Gegenstand war Security. So sprach Mofesola Babalola (Tempo.io) über “Securing Microservices with Istio’s Zero-Trust-Model” und Daniel Bodky (Netways Managed Services GmbH) beleuchtete “Real Time Threat Detection with Falco”. Daneben drehten sich Vorträge um so unterschiedliche Fragen wie Kubernetes auf Risc-Vhardware oder die Zukunft von Git.

Das Referat zu Git hielt übrigens PJ Hagerty, seines Zeichens Head of Developer and Community Relations bei GitButler, Hersteller eines Git-Clients. Das er Gründe dafür fand “Why git still matters” war nicht überraschend. Zuweilen wirkte eine solche Vorhersehbarkeit auch störend. Etwa bei Dmytro Kozlov (Victoria Metrics), der über darüber sprach, wie man mit Victoria Metrics und Open Telemetry einen Open-Source-Observability-Stack bauen könne. Was konnte er dabei über das Produkt seines Arbeitgebers anderes sagen, als es zu loben? Auch wenn das an die Grenze zu Werbung führte.

SCHLAGWORTE
Linux
Netways
Stackconf

DIESEN ARTIKEL ALS PDF KAUFEN
EXPRESS-KAUF ALS PDF	Umfang: 1 Heftseite	Preis €0,99 (inkl. 19% MwSt.)	Kasse

LINUX-MAGAZIN KAUFEN
EINZELNE AUSGABE	Print-Ausgaben	Digitale Ausgaben
ABONNEMENTS	Print-Abos	Digitales Abo
TABLET & SMARTPHONE APPS

Linux 7.0

Linus Torvalds mag bei der Kernel-Versionierung keine Zahlen, die die Anzahl seiner Finger und Zehen überschreiten. Jetzt folgt also auf Kernel 6.19 folgerichtig die Ausgabe 7.0

Künstliche Intelligenz in der Ausbildung sinnvoll einsetzen

Für junge Erwachsene gehören KI-unterstützte Anwendungen zum Alltag, ältere Semester benutzen solche Werkzeuge eher zurückhaltend. Ausbilder, Lehrkräfte und Trainer verantworten jedoch die Vermittlung des passenden Umgangs mit künstlicher Intelligenz. Dabei stellt sich die Frage, wie sich mit...

Einordnung der KI-Strategie von Ubuntu

Ubuntu ist nicht das einzige Projekt, das der Einsatz von KI umtreibt. Wir haben die Pläne der Distro unter die Lupe genommen.

Welche Neuerungen die SUSECON 2026 in Prag bringt

Niemand entkam auf der SUSECON den beiden Topthemen KI und digitale Souveränität – manch einer mag versucht gewesen sein, laut Bingo zu rufen. Doch abseits davon lässt sich vor allem bei SLE und MLM viel Positives berichten.

25 Jahre Vintage Computer Festival Europa

2026 feiert das Vintage Computer Festival Europa sein 25. Jubiläum. Veranstaltungen in Berlin, München und Zürich präsentieren historische Rechentechnik zum Bestaunen und Anfassen.

KubeCon CloudNativeCon Europe 2026

Rund 13 500 Teilnehmer aus 100 Ländern machen die KubeCon CloudNativeCon Europe 2026 zur bislang größten Open-Source-Konferenz weltweit, berichten die Veranstalter stolz. Künstliche Intelligenz in allen Schattierungen dominiert das Treffen von Anwendern, Projekten, Firmen und Entwicklern aus...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Was ist die beliebteste Linux-Distro? Zum Einstieg nehmen wir das DistroWatch-Ranking auseinander und erklären, warum Seitenaufrufe keine Popularität messen. Im Hauptthema geht es um Open Source Funding: Wie im XKCD 2347 ruht unsere digitale Infrastruktur auf Komponenten, die oft von Einzelnen...