Mit weniger Aufwand zu besseren Antworten

- 04. September 2025

Forscher der University of California San Diego und von Meta haben in einem Papier eine neue Methode vorgestellt, um schlussfolgernde Sprachmodelle so zu optimieren, dass sie bessere Antworten mit weniger Rechenpower generieren.

Die Methode heißt Deep Think with Confidence (DeepConf) benutzt modellinterne Signale für den Grad des Vertrauens in die Antwort, um minderwertige Gedankengänge während oder nach dem Schlussfolgern auszufiltern. Sie erfordert kein zusätzliches Modelltraining oder Hyperparameter-Tuning und lässt sich nahtlos in bestehende Serving-Frameworks integrieren.

Die Forscher evaluierten DeepConf mit einer Vielzahl von Argumentationsaufgaben und den neuesten Open-Source-Modellen, darunter Qwen 3 und die GPT-OSS-Serie. Bei anspruchsvollen Benchmarks wie AIME 2025 erreicht DeepConf@512 eine Genauigkeit von bis zu 99,9 Prozent und reduziert die Anzahl der generierten Token um bis zu 84,7 Prozent.

Eine bisher gängige Methode war beispielsweise Self-Consistency with Majority Voting, bei der dem Modell mehrmals dieselbe Aufforderung gegeben wird und die häufigste Antwort als endgültige Antwort gewählt wird. Diese Technik ist zwar effektiv, aber mit einem erheblichen Rechenaufwand verbunden. Die Generierung von Hunderten von Argumentationsketten für eine einzige Aufforderung erhöht die Kosten für die Schlussfolgerung erheblich, was sie für viele Anwendungen unpraktisch macht.

Außerdem besteht das Kernproblem dieser Methode darin, dass bei der Standard-Mehrheitsabstimmung jeder Argumentationspfad gleich behandelt wird, unabhängig von seiner Qualität. Dies kann zu suboptimalen Ergebnissen führen, wenn einige wenige minderwertige, aber ähnliche Antworten den Abstimmungsprozess dominieren und die richtige Antwort überstimmen.

SCHLAGWORTE
KI
LLM
Optimierung

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung