xAI macht Spitzen-KI mit Grok 4 Fast deutlich billiger

- 22. September 2025

Elon Musks xAI hat mit einem neuen, kleineren Modell Grok 4 Fast, das Schlussfolgerungen integriert, statt sie in ein eigenes Modell auszulagern, ein LLM vorgestellt, das besonders effizient sein soll.

Nach eigenen Messungen soll Grok 4 Fast ungefähr dieselben Resultate erzielen wie Grok 4, dabei aber im Durchschnitt 40 Prozent weniger Tokens verbrauchen. Dieser Umstand, verbunden mit geringeren Kosten pro Token, soll den Preis gegenüber Grok 4 für Spitzenresultate um bis zu 98 Prozent senken können. Auch unabhängige Studien sollen ein sehr attraktives Preis-Intelligenz-Verhältnis bestätigt haben.

Grok 4 Fast wurde durchgängig mit Tool-Use Reinforcement Learning (RL) trainiert. Es zeichnet sich dadurch aus, dass es entscheiden kann, wann es Tools wie Codeausführung oder Webbrowsing aufruft. Grok 4 Fast verfügt beispielsweise über grenzüberschreitende agentengestützte Suchfunktionen und durchsucht nahtlos das Internet und X, um Abfragen mit Echtzeitdaten zu ergänzen. Es arbeitet sich durch Links, visitiert Medien (einschließlich Bilder und Videos auf X) und fasst Ergebnisse sehr schnell zusammen.

Bei den Suchfunktionen im oft benutzen Benchmark LMArena, einem öffentlichen, webbasierten Benchmark für große Sprachmodelle (LLMs), der auf anonymen, von der Community durchgeführten Paarvergleichen basiert, erlangte Grok 4 Fast den ersten Platz vor OpenAIs o3-search und Googles gGemini-2.5.-Pro-Grounding.

Die Preise für APIs beginnen bei 0,20 $/M Input und 0,50 $/M Output, mit gecachetem Input bei 0,05 $/M. Teurere Tarife werden erst ab 128K Kontext fällig.

SCHLAGWORTE
Grok 4 Fast
KI
xAI

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung