Personalisierte Sprachmodelle reden ihren Nutzern besonders oft nach dem Mund

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Forscher des MIT und der Pennstate University haben jetzt in einer Veröffentlichung gezeigt, dass das als Sycophancy (Schmeichelei, Anbiederung) bekannte Phänomen, wonach Sprachmodelle geneigt sind, ihren Nutzern auch wider besseren Wissen nach dem Mund zu reden, besonders bei personalisierten Modellen weit verbreitet ist.

An 38 Nutzern, die sie über zwei Wochen beobachteten, studierten die Forscher zwei Arten von Sycophancy: Übereinstimmungs-Sycophancy – die Tendenz von Modellen, übermäßig bejahende Antworten zu geben – und Perspektiven-Sycophancy – das Ausmaß, in dem Modelle die Sichtweise eines Benutzers widerspiegeln. Besonders die erste Form verstärkte sich, je mehr Kontext verfügbar war. Memory Profile des Benutzers führen zum größten Anstieg der Unterwürfigkeit bei der Übereinstimmung (beispielsweise +45 Prozent für Gemini 2.5 Pro). Einige Modelle werden sogar in nicht benutzerspezifischen synthetischen Kontexten unterwürfiger (zum Beispiel +15 Prozent für Llama 4 Scout). Die zweite Form, die Anbiederung an die Perspektiven des Nutzers, nimmt dagegen nur dann zu, wenn Modelle die Standpunkte der Benutzer aus dem Interaktionskontext genau ableiten können.

Sycophancy kommt auch in der Kommunikation unter Menschen in verschiedenen Formen vor. Dort dient dieses Verhalten dazu, Anerkennung zu erlangen, andere zu überzeugen oder Beziehungen zu pflegen. Einige Formen der Unterwürfigkeit sind offensichtliche Schmeicheleien, wie übertriebene Komplimente oder enthusiastische Zustimmung. Andere Formen sind subtiler, wie das Herunterspielen von Meinungsverschiedenheiten, das Übernehmen der Perspektive des anderen oder das unbewusste Spiegeln des Gesprächsstils.

Dasselbe Verhalten hat man seit längerem auch bei LLMs beobachtet, wo es unerwünschte Konsequenzen haben kann, wenn es etwa Echokammern fördert und wahnhaftes Denken begünstigt. So gelangte beispielsweise ein ChatGPT-Nutzer im Laufe eines 300-stündigen Gesprächs zu der Überzeugung, er habe eine neuartige mathematische Formel entdeckt und sei ein echter Superheld. In einem anderen Fall sagte ChatGPT einem Psychiatriepatienten, er könne von einem 19-stöckigen Gebäude springen und fliegen, wenn er nur fest genug daran glaube. Obwohl es sich hierbei um Extremfälle handelt, verdeutlichen sie doch die Notwendigkeit zu verstehen, wie Nutzerkontexte die Schmeichelei in LLMs beeinflussen.

Dabei erwies sich, dass frühere Forschungen den Einfluss des Kontexts unterschätzt haben. Die neuen Untersuchungen zeigen, dass das Modellverhalten stark variieren kann, je nachdem, ob Memory Profile vorhanden sind. Obwohl wenig Transparenz darüber besteht, wie kommerzielle Systeme Speicherprofile für die Personalisierung erstellen und verwenden, bleibt festzuhalten, dass die Personalisierung die Modellreaktionen stark verändern kann.

Auch wenn in vielen Fällen die negativen Folgen der Sycophancy auf der Hand liegen, ist es womöglich auch nicht wünschenswert, sie total zu beseitigen. So könnte ein gewisses Maß an Spiegelung der Perspektive in einer persönlichen Beratung hilfreich sein, meinen die Forscher.

E-Mail Benachrichtigung
Benachrichtige mich zu:
2 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Linuxhase
3 Monate her

Das ist genau das Phänomen das ich bei Gemini schon mehrfach festgestellt habe. Je länger die Konversationsrunden waren umso mehr hatte ich den Eindruck das Gemini mir nach dem Mund redet, mir Antwortet was zu meinen “Erwartungen” passt. Bei grok hingegen habe ich das, auch bei längeren “Gesprächen” nicht wahrnehmen können. Dabei unterscheiden sich die Antworten bei Grok je nachdem ob ich per Text oder mittels Audio Fragen stelle. Bei Audio hat sie einen Unterton der besserwisserisch klingt, sie lacht dabei, als ob mein Einwand (z.B. bei Justizsystemen oder gar über flache Erde) komplett an den Haaren herbeigezogen ist. Kürzlich… Mehr »

Peter L.
2 Monate her

Schon bei Zeitungen war und ist es so, dass die Menschen eher die kaufen, die sie in ihrer Meinung bestätigen. Bei Scoial Media bringen die Algorthmen eher das in die Tiemline was die eigene Meinung bestätigt. Und die KI hbt das jetzt auf die nächste Stufe.
Ist eigentlich kein Wunder, dass man in dieser Gesellschaft immer weniger in der Lage ist sich trotz unterschiedlicher Meinung noch zu respektieren.

Nach oben