Red Hat AI 3.4 bringt Model-as-a-Service

- 13. Mai 2026

Mit Red Hat AI 3.4 erweitert der Linux-Spezialist seine KI-Plattform und stellt „Model-as-a-Service“ (MaaS) in den Mittelpunkt, womit Entwicklern eine einheitliche, kontrollierte Schnittstelle für den Zugriff auf kuratierte Modelle geboten bekommen.

Mittels MaaS steht Plattformingenieuren eine bereits allgemein verfügbare Benutzeroberfläche zur Verfügung, die eine selbstständige Verwaltung von Token-Schlüsseln für die rollenbasierte Administration, die Nutzungserfassung und das Showback ermöglicht. Letzteres trägt noch den Status einer Technologievorschau. MaaS soll zudem die Einhaltung von Sicherheitsstandards sowohl bei selbst gehosteten als auch bei cloudbasierten Modellen gewährleistet. Unternehmen erhalten laut Red Hat damit eine Grundlage für hochperformante, verteilte Inferenz, die auf vLLM und llm-d basiert, sodass sie Modelle optimiert und effizient in einer Vielzahl von Umgebungen bereitstellen können.

Die Red Hat AI-Plattform integriert den vLLM-Inferenzserver, der nun laut dem Anbieter auch spekulatives Decodieren unterstützt. Durch den Einsatz effizienter Entwurfsmodelle zur Beschleunigung der Verarbeitung kann diese Technik die Antwortzeiten ohne Qualitätseinbußen um das Zwei- bis Dreifache steigern und so die Kosten pro Interaktion direkt senken, lässt Red Hat wissen.

In Sachen Hardware und gemanagte Clouds bietet Red Hat AI 3.4 Unterstützung für Blackwell-GPUs von Nvidia und MI325X-Architekturen von AMD. Auch der native Betrieb in Clouds, die von Drittanbietern verwaltet werden, sei möglich. Unter anderem läuft das neue Red Hat AI Inference in der Cloud von IBM, dem Mutterkonzern von Red Hat. Red Hat AI 3.4 wird voraussichtlich im Laufe des Monats verfügbar sein.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

Red Hat macht Ansible fit für KI-Agenten

Red Hat baut die Red Hat Ansible Automation Platform zum zentralen „Trusted Execution Layer“ für KI-gestützte Prozesse aus. Damit können KI-Agenten kontrolliert und skalierbar in vorhandene Workflows und Infrastrukturen integriert werden.

Operation Endgame: Behörden zerschlagen Schadsoftware-Netzwerken**

m Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Im Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Cloud Tag: KI als Partner im Gruppenchat

Anthropic hat seine jüngste Entwicklung Claude Tag vorgestellt, die sich in einen Slack-Gruppenchat einbinden lässt und dann von Teammitgliedern via @Claude Aufgaben übertragen bekommt. Claude Tag soll sich dabei Kontext-Informationen aus den Channels besorgen, in denen es eingebunden ist.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Wir melden uns mit einer kurzen Folge direkt von den Chemnitzer Linux-Tagen 2026. Es war wieder ein aufregendes CLT-Wochenende – und wir hoffen, dass euch unsere Kurz-Interviews einen guten Eindruck von der Veranstaltung vermitteln.