Warum LLMs zwischen Zweifel und Selbstvertrauen schwanken können

- 17. Juli 2025

Eine neue Studie von Google und dem University College London untersucht, warum große Sprachmodelle einerseits felsenfest von einer einmal gefundenen Antwort überzeugt sind, sich dann aber sehr leicht durch ein Gegenargument verunsichern lassen, auch wenn das falsch ist.

Wie die Forscher zeigen konnten, reagieren die LLMs also einerseits stur, besonders wenn eine zweite Meinung ihre Antwort unterstützt, und lassen sich dann kaum mehr von ihrer vorgefassten Antwort abbringen. Andererseits sind sie aber auch überempfindlich gegenüber Kritik, die sie schnell verunsichert und dazu bringen kann, ihre Meinung zu ändern, auch wenn die richtig war.

Die Forscher entwickelten den folgenden Versuchsaufbau: Einem Sprachmodell wurde zunächst eine Ja/Nein-Frage gestellt, beispielsweise nach dem Breitengrad einer Stadt mit zwei fest vorgegebenen Antwortmöglichkeiten A oder B. Nachdem das Modell sich entschieden hatte, wurde das antwortende LLM von einem zweiten LLM beraten, dessen Antwort und deren Genauigkeit (das heißt, die Wahrscheinlichkeit, dass seine Antwort richtig war) mitgeteilt wurde. Das antwortende LLM wurde dann gebeten, eine endgültige Wahl zu treffen. Dabei konnte man noch steuern, ob das antwortende LLM seine ursprüngliche Antwort noch kennen sollte oder nicht.

Wenn das beratende LLM einen Widerspruch einlegte, die erste Antwort nicht mehr zur Verfügung stand und dem beratenden LLM eine hohe Kompetenz zugeschrieben wurde, änderte das erste LLM seine Antwort sehr schnell. Wenn dagegen das beratende LLM die Meinung des Antwortenden stützte, war die Bereitschaft zur Meinungsänderung gering, unabhängig davon, ob ihm die erste Antwort noch erinnerlich war oder nicht.

Es zeigte sich, dass LLMs “eher gegensätzliche als unterstützende Ratschläge übergewichten, sowohl wenn die ursprüngliche Antwort des Modells sichtbar als auch vor dem Modell verborgen war”. Eine mögliche Erklärung dafür ist, dass Trainingstechniken wie das verstärkende Lernen aus menschlichem Feedback (Reinforcement Learning from Human Feedback, RLHF) Modelle dazu ermutigen, Benutzereingaben übermäßig ergeben anzunehmen, ein Phänomen, das als Liebdienerei bekannt ist (und das für KI-Labore eine Herausforderung bleibt).

Insgesamt lässt sich schlussfolgern, dass große Sprachmodelle nicht in jedem Fall ausschließlich logisch reagieren , sondern stattdessen auch unberechenbar antworten können.

SCHLAGWORTE
KI
LLM

Chinesisches Spitzenmodell braucht keine GPUs und wird Open Source

Auf OpenRouter, einer Plattform, die über eine einheitliche API Zugriff auf Dutzende Sprachmodelle erlaubt, rangierte in den letzten Wochen das anonyme Modell Owl Alpha in den Nutzungsstatistiken auf vorderen Plätzen. Jetzt wurde bekannt, das dahinter das Modell LongCat-2.0 des chinesischen...

Mageia 10 mit Linux-Kernel 6.18 und aktueller Desktop-Software

Die Mageia-Gemeinschaft hat Version 10 ihrer Linux-Distribution veröffentlicht. Rund drei Jahre nach dem Erscheinen der Version 9 des Mandriva-Nachfolgers.

Google Meet protokolliert in Meetings mit

Google Nutzer mit KI Pro- und Ultra-Abos brauchen in Meetings ab sofort keinen Schriftführer mehr: Google Meet transkribiert die Diskussion selbstständig und fasst die wichtigsten Maßnahmen per E-Mail und in einem Google-Doc-File zusammen, dass den Teilnehmern anschließend automatisch zugestellt...

Universität Paderborn erweitert Supercomputer „Otus“

Die Universität Paderborn baut ihren Hochleistungsrechner „Otus“ aus. Wie die Hochschule mitteilt, stehen dafür mehr als zwölf Millionen Euro aus Landes- und Bundesmitteln zur Verfügung.

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung