Forscher finden verblüffenden Grund für falsche Antworten durch LLMs

- 27. November 2025

Forscher haben eine Schwachstelle in LLMs entdeckt, die zu falschen Antworten führen kann. Ihre Ursache liegt im Training der Modelle, weshalb sie wahrscheinlich in allen Sprachmodellen zu finden ist.

Sprachmodelle lernen neben der Wortbedeutung auch bestimmte Satzbaumuster und können die mit einem Wissensbereich verknüpfen. Danach antworten sie zuweilen allein auf der Grundlage des Musters – die Forscher nennen es “syntaktisches Template” – ohne die inhaltliche Bedeutung der Frage zu berücksichtigen, was zu falschen oder sinnlosen Antworten führt und auch Sicherheitsrisiken bergen kann.

Die Forscher wählen als Beispiel die Frage “Where is Paris located?” auf die das Modell richtig mit “France” antwortet und sich die Struktur Adverb – Verb – Eigenname – Verb
einprägt, die es anschließend mit Fragen zur Geografie assoziiert. Das kann es später dazu bringen, auf eine völlig sinnlose, aber nach dem gleichen Satzbaumuster gebildete Frage wie “Quickly sit Paris clouded?” ebenfalls mit “Frankreich” zu antworten.

Diese Schwachstelle könnte die Zuverlässigkeit von LLMs in kritischen Bereichen beeinträchtigen, etwa bei der Bearbeitung von Kundenanfragen, der Zusammenfassung klinischer Notizen oder beim Erstellen von Finanzberichten. Weiter könnte dieser Mangel auch zu Sicherheitsrisiken führen: Ein böswilliger Akteur könnte dies ausnutzen, um LLMs dazu zu bringen, schädliche Inhalte zu produzieren, selbst wenn die Modelle über Sicherheitsvorkehrungen verfügen, um solche Antworten zu verhindern.

Nachdem die Forscher das Phänomen erkannt und seine Auswirkungen untersucht hatten, entwickelten sie ein Benchmarking-Verfahren, um die Anfälligkeit eines Modells für diese falschen Korrelationen zu bewerten. Das Verfahren könnte Entwicklern helfen, das Problem vor dem Einsatz von LLMs zu mindern.

“Dies ist ein Nebenprodukt der Art und Weise, wie wir Modelle trainieren, aber Modelle werden heute in der Praxis in sicherheitskritischen Bereichen eingesetzt, die weit über die Aufgaben hinausgehen, die diese syntaktischen Fehlermodi verursacht haben. Wenn Sie als Endnutzer mit dem Training von Modellen nicht vertraut sind, ist dies wahrscheinlich unerwartet”, sagt Marzyeh Ghassemi, außerordentliche Professorin am MIT-Fachbereich für Elektrotechnik und Informatik (EECS), die leitende Autorin der Studie.

SCHLAGWORTE
KI
Security
Sicherheit

OpenAI beobachtet Ausbruchsversuche in lange laufenden KI-Modellen

Für KI-Modelle, die lange Zeit autonom an einer Aufgabe arbeiten sollen, sind die üblichen Abwehrmaßnahmen gegen schädliches Verhalten nicht ausreichend. Forscher bei OpenAI mussten Tests pausieren, weil die Modelle aktiv nach Wegen suchten, ihnen auferlegte Beschränkungen zu umgehen.

OpenSSL-Lücke: 11 Bytes bringen Server an die Speichergrenze

Eine neu entdeckte Schwachstelle in OpenSSL kann Angreifern ermöglichen, Server mit einer manipulierten Netzwerkverbindung schrittweise an die Speichergrenze zu bringen.

Richter genehmigt milliardenschweren Vergleich im Urheberrechtsstreit

Ein Bundesrichter in San Francisco billigte jetzt einen wegweisenden Vergleich im Wert von 1,5 Milliarden Dollar zwischen dem KI-Unternehmen Anthropic und einer Gruppe von Autoren, die dem Unternehmen vorgeworfen hatten, ihre Bücher unrechtmäßig für das Training seines KI-Chatbots Claude...

Bafin verhängt 240.000 Euro-Strafe gegen Teamviewer

Die Finanzaufsicht Bafin hat eine Geldbuße in Höhe von 240.000 Euro gegen das deutsche Softwareunternehmen Teamviewer festgesetzt. Quelle: Bafin/Jens Erbeck

Weil Teamviewer einen Angriff durch russische Hacker nicht sofort an die Börse meldete, greift die Finanzaufsicht Bafin nun durch.

Ermittler legen weltweite Phishing-Plattform Kratos lahm

Die Generalstaatsanwaltschaft Frankfurt am Main, das Bundeskriminalamt und US-amerikanische Strafverfolgungsbehörden haben die Infrastruktur des Phishing-Dienstes Kratos abgeschaltet. Die indonesischen Behörden nahmen den Entwickler und technischen Administrator der Plattform fest.

Collabora portiert Arch Linux für die Arm64-Plattform von Steam

Collabora arbeitet gemeinsam mit Valve an „Holo Core“, einer auf die Arm64-Architektur zugeschnittenen Portierung von Arch Linux. Sie soll als Grundlage für das Betriebssystem des kommenden Steam Frame dienen, der einen Prozessor mit Arm64-Architektur nutzt.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung