Wissenschaftler glaubt, LLMs werden niemals zuverlässige Agenten

- 28. Januar 2026

Vishal Sikka, der ehemalige CTO von SAP und heutiger Chef seines Start-ups VianAI Systems, hat zusammen mit seinem Sohn, Varin Sikka (Stanford University) eine Studie herausgegeben, die mathematisch beweisen will, dass LLMs Aufgaben jenseits eines bestimmten Komplexitätsgrads niemals zuverlässig abarbeiten können.

Bereits das vergangene Jahr wurde zum “Jahr der KI-Agenten” erkoren, der Durchbruch blieb allerdings aus, weil die existierenden Agenten noch zu unzuverlässig arbeiten und daher menschliche Bearbeiter nicht ersetzen können. Die Studienautoren glauben nun, daran wird sich auch nichts ändern. Sie schreiben: “Wir zeigen, dass LLMs nicht in der Lage sind, rechnerische und agentenbezogene Aufgaben auszuführen, die eine bestimmte Komplexität überschreiten, und dass LLMs darüber hinaus nicht in der Lage sind, die Genauigkeit der Erledigung von Aufgaben zu überprüfen, die eine bestimmte Komplexität überschreiten.”

Wenn N die Anzahl der Input-Tokens ist und d die Anzahl der Dimensionen des Vektors, der sie beschreibt, dann könnten LLMs keine Aufgaben mehr berechnen, die eine Komplexität größer O(N².d) haben. Diverse Algorithmen und auch agentische Aufgaben überschreiten allerdings diese Grenze. Hinzukommt: Weil das Überprüfen der Erledigung einer Aufgabe oft noch schwieriger ist als die Aufgabe selbst, kann kein LLM verifizieren, ob ein anderes eine Aufgabe jenseits der Komplexitätsschwelle korrekt erledigt hat.

Die Schwierigkeit zeigt sich beispielsweise beim berühmten Problem des Handelsreisenden (Traveling Salesman Problem, TSP), bei dem die kürzeste Route für den Händler gesucht wird, wenn der bestimmte Städte nacheinander besuchen soll. Bei der Brute-Force-Lösung dieses Problems muss die Streckenlänge jeder Städtekombination mit jeder anderen verglichen werden, was schon bei 20 Städten zu 10 hoch 17 Vergleichen führt.

Die Autoren glauben schließlich auch nicht, dass spezielle Reasoning-Modelle dabei besser abschneiden können. Einerseits, weil sie an dieselbe Komplexitätsschranke stießen, andererseits weil ihr Token-Budget viel zu klein für komplexe Aufgaben ist.

Homebrew 6.0.0 führt Tap Trust ein

Mit Homebrew 6.0.0 hält ein neuer Sicherheitsmechanismus namens „Tap Trust“ Einzug in den universellen Paketmanager für Linux, MacOS und WSL.

Google investiert in Forschung zur Sicherheit von KI-Agenten

Google investiert zusammen mit den Partnern Stiftung Schmidt Sciences, der britischen Regierungsagentur ARIA, der Cooperative AI Foundation und unterstützt von Google.org 10 Millionen Dollar in Forschungsprojekte, die weltweit die Erkundung und Minderung der Risiken zum Ziel haben, die...

Snapshot 07/2026: Videos aussortieren mit Go

Eine GUI-Applikation in Go hilft Mike Schilli dabei, Videos von seinem Handy über animierte Thumbnails auszuwählen und Ballast abzuwerfen.

Root-Attacke gegen Ivanti Endpoint Manager Mobile

Bei Ivanti Endpoint Manager Mobile (EPMM) handelt es sich um eine zentrale Verwaltungssoftware für Unternehmen. Mit ihr können IT-Abteilungen alle firmeninternen Mobilgeräte wie Smartphones und Tablets von einem zentralen Punkt aus sichern, konfigurieren und überwachen. Genau in dieser Software...

500 Millionen Dollar für Forschung zu Gehirn-ähnlicher KI

Das neurowissenschaftlich ausgerichtete KI-Start-up Flourish hat in einer neuen Finanzierungsrunde 500 Millionen Dollar eingesammelt, die die Forschung an einer KI ermöglicht, die einmal wie das menschliche Gehirn funktionieren und mit 20 bis 50 Watt auskommen soll. Zu den Investoren gehört der...

Idee aus der Nukleartechnik revolutioniert Server-Kühlung

Das US-amerikanische Start-up Ferveret, gegründet von zwei MIT-Forschern, hat ein neuartiges Kühlsystem entwickelt, das ohne Wasser und mit viel weniger Strom im Vergleich zu modernsten Lösungen für die Kühlung zu einer um 15 Prozent höheren Energieeffizienz der Rechenleistung führt.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Inline Feedbacks

Alle Kommentare anzeigen