LLMs decken auf, wer hinter anonymisierten Nutzerkonten steckt

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Forscher der ETH Zürich und von Anthropic haben ein Papier veröffentlicht, das zeigt, wie sich die wahren Inhaber pseudonymer Nutzerprofile aufdecken lassen.

Ausgehend von zwei Datenbanken, die jeweils unstrukturierte Texte pseudonymer Personen enthalten, die von oder über diese Personen geschrieben wurden, implementierten die Forscher eine skalierbare Angriffspipeline. Sie verwendeten LLMs, um zunächst Merkmale zu extrahieren, die für die Identität relevant sind.  Dabei werden auch wenig spektakuläre, unscheinbare Informationen verarbeitet. Dann wurde über semantische Einbettungen nach möglichen Übereinstimmungen gesucht und schließlich wurden die besten Kandidaten bewertet, um Übereinstimmungen zu verifizieren und Fehlalarme zu reduzieren. Im Vergleich zur klassischen Deanonymisierung, die strukturierte Daten erfordert, funktioniert dieser Ansatz direkt mit rohen Benutzerinhalten auf beliebigen Plattformen.

Die Forscher erstellten drei Datasets. Der erste verknüpft Hacker News mit LinkedIn-Profilen unter Verwendung plattformübergreifender Referenzen, die in den Profilen erscheinen. Ein zweiter Datensatz gleicht Nutzer in Reddit-Filmdiskussionsforen ab, und ein dritter teilt die Reddit-Historie eines einzelnen Nutzers zeitlich auf, um zwei pseudonyme Profile zu erstellen, die abgeglichen werden können. In jeder Einstellung übertreffen LLM-basierte Methoden die klassischen Baselines erheblich und erreicht eine Genauigkeit von 90 Prozent.

Der Versuch zeigt, wie mit wenigen, öffentlich verfügbaren Daten die Anonymität einer beliebigen Person mit hoher Sicherheit automatisiert aufgehoben werden kann. Damit ergab sich, dass die praktische Annahme, dass eine Deanonymisierung zwar theoretisch möglich, aber zu kostspielig ist, um sie in großem Umfang durchzuführen – eine Vermutung, die pseudonyme Nutzer lange geschützt hat – nicht mehr gilt. Dafür sind keine übermenschlichen Fähigkeiten nötig. Die Merkmale, die zur Aufdeckung der Identität führen, sind im Wesentlichen dieselben, die auch ein geschulter menschlicher Untersucher verwenden würde. Aber die LLMs senken die Kosten dafür dramatisch. Damit ergibt sich eine Asymmetrie zwischen Angriffskosten und Verteidigungskosten, die es erfordert, neu zu bewerten, was als private Online-Aktivitäten angesehen werden kann. Nutzer, Plattformen und politische Entscheidungsträger müssen erkennen, so die Forscher, dass die Datenschutzannahmen, die einem Großteil des heutigen Internets zugrunde liegen, nicht mehr greifen.

E-Mail Benachrichtigung
Benachrichtige mich zu:
1 Kommentar
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Blackcrack
3 Monate her

wie übel iss das denn… die übergehen also den willen der leute, die sich bedeckt halten wollen.. wow… klar iss auch daß man heut immer mehr schauen muss, seine daten sicher zu halten, wenns solche Menschen gibt, die die Leute dann beschuldigen wollen und dessen Daten für direkte Werbung und Spamm genommen werden wollen und damit dann wiederum Geld gemacht wollen wird… tja, die zeiten von früher sind vorbei mit diesen Hochtechnologisierten Welt wo der Mensch als solches nicht mehr geschützt wird und überall hingezerrt wird wo ein fremder Mensch der nicht mal die Leute kennt die er diffamiert und… Mehr »

Last edited 3 Monate her by Blackcrack
Nach oben