MIT-Forscher erfinden effektivere Methode für LLMs, um nachzudenken

- 04. Dezember 2025

Um härtere Probleme lösen zu können, sind LLMs in der Lage länger nachzudenken. Forscher des MIT haben nun eine Methode entwickelt, das Budget an Rechenzeit dynamisch zu verwalten.

Gängige Ansätze, die LLMs dieFähigkeit verleihen, ihre Nachdenkzeit zu verlängern, legen für jedes Problem ein festes Rechenbudget fest, unabhängig davon, wie komplex es ist. Das bedeutet, dass das LLM möglicherweise Rechenressourcen für einfachere Fragen verschwendet oder nicht in der Lage ist, komplexe Probleme zu lösen, die mehr logisches Denken erfordern. Die neue Methode der MIT-Forscher ermöglicht es dem Modell nun, sein Rechenbudget dynamisch anzupassen, basierend auf der Schwierigkeit der Frage und der Wahrscheinlichkeit, dass jede Teillösung zur richtigen Antwort führt.

Die Forscher fanden heraus, dass ihr neuer Ansatz es LLMs ermöglicht, nur halb so viel Rechenleistung wie bestehende Methoden zu verbrauchen und dabei bei einer Reihe von Fragen mit unterschiedlichem Schwierigkeitsgrad eine vergleichbare Genauigkeit zu erzielen. Darüber hinaus ermöglicht ihre Methode kleineren, weniger ressourcenintensiven LLMs, bei komplexen Problemen genauso gut oder sogar besser abzuschneiden als größere Modelle.

“Die Rechenkosten für die Inferenz sind schnell zu einem großen Engpass für Anbieter von Spitzenmodellen geworden, und diese suchen aktiv nach Möglichkeiten, die Recheneffizienz pro Benutzeranfrage zu verbessern. Beispielsweise unterstreicht die kürzlich veröffentlichte Version GPT-5.1 die Wirksamkeit des in unserer Veröffentlichung vorgeschlagenen Ansatzes des ‘adaptiven Schlussfolgerns’. Indem wir den Modellen die Fähigkeit verleihen, zu erkennen, was sie nicht wissen, können wir sie in die Lage versetzen, mehr Rechenleistung für die schwierigsten Probleme und vielversprechendsten Lösungswege aufzuwenden und weitaus weniger Token für einfache Probleme zu verwenden. Das macht das Schlussfolgern sowohl zuverlässiger als auch weitaus effizienter”, sagt Navid Azizan, leitender Forscher am Labor für Informations- und Entscheidungssysteme (LIDS) und leitender Autor einer Veröffentlichung zu dieser Technik.

Ein wichtiger Bestandteil vieler Skalierungsalgorithmen zur Inferenzzeit ist das gewählte Prozessbelohnungsmodell (Process Reward Model, PRM). PRMs werden trainiert, um zu quantifizieren, wie gut oder wünschenswert die Zwischenausgaben eines Modells in Bezug auf eine bestimmte Aufgabe und/oder die Übereinstimmung mit menschlichen Präferenzen sind. In ihrem Artikel stellen die Forscher eine Pipeline zur Verbesserung der Kalibrierung aller handelsüblichen PRMs vor. Damit können deren Bewertungen die Unsicherheit, mit der ein bestimmtes LLM die richtige Antwort findet, genauer widerspiegeln. Dafür entwickelten sie ein auf Quantilsregression basierendes Schema, das den Kalibrierungsfehler von PRM-Bewertungen reduziert. Das resultierende Modell sagt für jede Abfrage und jeden Zwischenschritt der Argumentation die Erfolgswahrscheinlichkeit zusammen mit Konfidenzgrenzen voraus.

Homebrew 6.0.0 führt Tap Trust ein

Mit Homebrew 6.0.0 hält ein neuer Sicherheitsmechanismus namens „Tap Trust“ Einzug in den universellen Paketmanager für Linux, MacOS und WSL.

Google investiert in Forschung zur Sicherheit von KI-Agenten

Google investiert zusammen mit den Partnern Stiftung Schmidt Sciences, der britischen Regierungsagentur ARIA, der Cooperative AI Foundation und unterstützt von Google.org 10 Millionen Dollar in Forschungsprojekte, die weltweit die Erkundung und Minderung der Risiken zum Ziel haben, die...

Snapshot 07/2026: Videos aussortieren mit Go

Eine GUI-Applikation in Go hilft Mike Schilli dabei, Videos von seinem Handy über animierte Thumbnails auszuwählen und Ballast abzuwerfen.

Root-Attacke gegen Ivanti Endpoint Manager Mobile

Bei Ivanti Endpoint Manager Mobile (EPMM) handelt es sich um eine zentrale Verwaltungssoftware für Unternehmen. Mit ihr können IT-Abteilungen alle firmeninternen Mobilgeräte wie Smartphones und Tablets von einem zentralen Punkt aus sichern, konfigurieren und überwachen. Genau in dieser Software...

500 Millionen Dollar für Forschung zu Gehirn-ähnlicher KI

Das neurowissenschaftlich ausgerichtete KI-Start-up Flourish hat in einer neuen Finanzierungsrunde 500 Millionen Dollar eingesammelt, die die Forschung an einer KI ermöglicht, die einmal wie das menschliche Gehirn funktionieren und mit 20 bis 50 Watt auskommen soll. Zu den Investoren gehört der...

Idee aus der Nukleartechnik revolutioniert Server-Kühlung

Das US-amerikanische Start-up Ferveret, gegründet von zwei MIT-Forschern, hat ein neuartiges Kühlsystem entwickelt, das ohne Wasser und mit viel weniger Strom im Vergleich zu modernsten Lösungen für die Kühlung zu einer um 15 Prozent höheren Energieeffizienz der Rechenleistung führt.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Inline Feedbacks

Alle Kommentare anzeigen