Weshalb LLMs halluzinieren

- 15. September 2025

Forscher von OpenAI und der Georgia Tech Universität haben Gründe dafür gefunden, warum Sprachmodelle halluzinieren und schlagen Gegenmaßnahmen vor.

Ein Forschungspapier macht vor allem zwei Gründe für Halluzinationen aus: Erstens erfolgt das sogenannte Pre-Training, in dem die Modelle vor allem Lernen, das nächste Wort vorherzusagen und dabei einen flüssigen Sprachstil einzuhalten, ohne Rücksicht auf den Wahrheitsgehalt der Aussagen. Dadurch wird Raten höher bewertet als das Zugeben von Unsicherheit. Halluzinationen sind dann nur noch ein statistischer Effekt dieser Fehlanreize. “Wenn unrichtige Aussagen nicht von Tatsachen unterschieden werden können, dann entstehen Halluzinationen in vortrainierten Sprachmodellen durch natürlichen statistischen Druck”, schreiben die Forscher.

Zweitens festigt sich während des Post-Trainings die Tendenz im Zweifelsfall zu Raten dadurch, dass die gängigen Bewertungssysteme für falsche Antworten nur 0 Punkte vergeben, sie aber nicht bestrafen. Dadurch ist das Bluffen mit einer überzeugend klingenden, aber frei erfundenen Antwort in der Bilanz noch immer günstiger, als keine Antwort zu geben. So würden sich auch menschliche Studenten verhalten und die Benchmarks für LLMs seien menschlichen Tests oft nachempfunden.

Das gesamte System der Evaluation und wichtige Benchmarks für LLMs müssten geändert werden. Das sei schwierig und überdies ein sozio-technisches Problem. “… in dem Sinne, dass nicht nur die bestehenden Bewertungen geändert werden müssen, sondern diese Änderungen auch in den einflussreichen Leaderboards übernommen werden müssen.”

Die Forscher schlussfolgern, dass die meisten Mainstream-Bewertungen halluzinatorisches Verhalten belohnen. “Einfache Modifikationen der Mainstream-Bewertungen können die Anreize neu ausrichten, indem sie angemessene Ausdrücke der Unsicherheit belohnen, anstatt sie zu bestrafen. Dies kann Hindernisse für die Unterdrückung von Halluzinationen beseitigen und die Tür für zukünftige Arbeiten an nuancierten Sprachmodellen öffnen.”

SCHLAGWORTE
Halluzinationen
KI

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung