Personalisierte Sprachmodelle reden ihren Nutzern besonders oft nach dem Mund

- 04. März 2026

Forscher des MIT und der Pennstate University haben jetzt in einer Veröffentlichung gezeigt, dass das als Sycophancy (Schmeichelei, Anbiederung) bekannte Phänomen, wonach Sprachmodelle geneigt sind, ihren Nutzern auch wider besseren Wissen nach dem Mund zu reden, besonders bei personalisierten Modellen weit verbreitet ist.

An 38 Nutzern, die sie über zwei Wochen beobachteten, studierten die Forscher zwei Arten von Sycophancy: Übereinstimmungs-Sycophancy – die Tendenz von Modellen, übermäßig bejahende Antworten zu geben – und Perspektiven-Sycophancy – das Ausmaß, in dem Modelle die Sichtweise eines Benutzers widerspiegeln. Besonders die erste Form verstärkte sich, je mehr Kontext verfügbar war. Memory Profile des Benutzers führen zum größten Anstieg der Unterwürfigkeit bei der Übereinstimmung (beispielsweise +45 Prozent für Gemini 2.5 Pro). Einige Modelle werden sogar in nicht benutzerspezifischen synthetischen Kontexten unterwürfiger (zum Beispiel +15 Prozent für Llama 4 Scout). Die zweite Form, die Anbiederung an die Perspektiven des Nutzers, nimmt dagegen nur dann zu, wenn Modelle die Standpunkte der Benutzer aus dem Interaktionskontext genau ableiten können.

Sycophancy kommt auch in der Kommunikation unter Menschen in verschiedenen Formen vor. Dort dient dieses Verhalten dazu, Anerkennung zu erlangen, andere zu überzeugen oder Beziehungen zu pflegen. Einige Formen der Unterwürfigkeit sind offensichtliche Schmeicheleien, wie übertriebene Komplimente oder enthusiastische Zustimmung. Andere Formen sind subtiler, wie das Herunterspielen von Meinungsverschiedenheiten, das Übernehmen der Perspektive des anderen oder das unbewusste Spiegeln des Gesprächsstils.

Dasselbe Verhalten hat man seit längerem auch bei LLMs beobachtet, wo es unerwünschte Konsequenzen haben kann, wenn es etwa Echokammern fördert und wahnhaftes Denken begünstigt. So gelangte beispielsweise ein ChatGPT-Nutzer im Laufe eines 300-stündigen Gesprächs zu der Überzeugung, er habe eine neuartige mathematische Formel entdeckt und sei ein echter Superheld. In einem anderen Fall sagte ChatGPT einem Psychiatriepatienten, er könne von einem 19-stöckigen Gebäude springen und fliegen, wenn er nur fest genug daran glaube. Obwohl es sich hierbei um Extremfälle handelt, verdeutlichen sie doch die Notwendigkeit zu verstehen, wie Nutzerkontexte die Schmeichelei in LLMs beeinflussen.

Dabei erwies sich, dass frühere Forschungen den Einfluss des Kontexts unterschätzt haben. Die neuen Untersuchungen zeigen, dass das Modellverhalten stark variieren kann, je nachdem, ob Memory Profile vorhanden sind. Obwohl wenig Transparenz darüber besteht, wie kommerzielle Systeme Speicherprofile für die Personalisierung erstellen und verwenden, bleibt festzuhalten, dass die Personalisierung die Modellreaktionen stark verändern kann.

Auch wenn in vielen Fällen die negativen Folgen der Sycophancy auf der Hand liegen, ist es womöglich auch nicht wünschenswert, sie total zu beseitigen. So könnte ein gewisses Maß an Spiegelung der Perspektive in einer persönlichen Beratung hilfreich sein, meinen die Forscher.

SCHLAGWORTE
KI
Sycophancy

libx11-compat reanimiert Xlib-Software unter Wayland

Vor allem viele ältere X11-Clients setzen auf der Bibliothek Xlib auf. Mithilfe des Projekts libx11-compat lassen sich solche Anwendungen unter Wayland und anderen Systemen ohne X-Server weiterbetreiben.

Nach Agentenausbruch: Verteidiger mussten ein chinesisches Modell einsetzen

Im Nachgang des Angriffs eines ausgebrochenen KI-Agenten von OpenAI auf die Plattform HuggingFace wurde bekannt, dass die Verteidiger bei der Analyse des Vorfalls auf das chinesische Modell GLM-5.2 setzen mussten, weil führende amerikanische Modelle wegen der eingebauten Sicherheitsvorkehrungen...

Raspberry Pi: Touch-Bildschirm mit 10 Zoll vorgestellt

Wer seinem Raspberry Pi einen Touch-Bildschirm spendieren möchte, kann jetzt auch auf ein offizielles Display mit 10 Zoll zurückgreifen. Das Touch Display 2 kostet in dieser Größe 80 US-Dollar – wenn man denn einen Lieferanten findet.

OpenDesk bewährt sich als Notfallarbeitsplatz für Sozialversicherungen

Ein Verbund aus Sozialversicherungen, IT-Unternehmen und dem Zentrum für Digitale Souveränität der Öffentlichen Verwaltung (ZenDiS) hat OpenDesk als Notfallarbeitsplatz für Krisensituationen getestet.

Canonical führt Enterprise Store für Ubuntu-Pro-Kunden ein

Beim neuen Enterprise Store handelt es sich um einen Proxy, der die Softwareverwaltung hinter Firewalls und in Air-Gap-Netzwerken erleichtern soll. Der Enterprise Store steht allerdings nur Ubuntu-Pro-Abonnement zur Verfügung.

GNOME-Projekt ändert Verfahren für neu entdeckte Sicherheitslücken

Entdeckte Sicherheitslücken in GNOME-Komponenten verwaltet zentral die Stelle GNOME Security. Dahinter steht im Wesentlichen Michael Catanzaro, der jetzt nicht nur den Prozess verändert, sondern auch für den Herbst einen Nachfolger sucht.

E-Mail Benachrichtigung

2 Kommentare

Älteste

Neuste Beste Bewertung

Linuxhase

4 Monate her

Das ist genau das Phänomen das ich bei Gemini schon mehrfach festgestellt habe. Je länger die Konversationsrunden waren umso mehr hatte ich den Eindruck das Gemini mir nach dem Mund redet, mir Antwortet was zu meinen “Erwartungen” passt. Bei grok hingegen habe ich das, auch bei längeren “Gesprächen” nicht wahrnehmen können. Dabei unterscheiden sich die Antworten bei Grok je nachdem ob ich per Text oder mittels Audio Fragen stelle. Bei Audio hat sie einen Unterton der besserwisserisch klingt, sie lacht dabei, als ob mein Einwand (z.B. bei Justizsystemen oder gar über flache Erde) komplett an den Haaren herbeigezogen ist. Kürzlich… Mehr »

Antworten

Peter L.