Die Social Media Plattforn Reddit, die ein ein breites Spektrum an Diskussionsforen zu den verschiedensten Themen hostet, hat das KI-Unternehmen Anthropic vor einem kalifornischen Gericht auf Schadensersatz und Unterlassung verklagt, weil es seine KI mit Daten von Reddit-Nutzern ohne deren Einwilligung trainiert haben soll.
In der Klageschrift beschuldigt Reddit Anthropic unter anderem des Vertragsbruchs, der unrechtmäßigen Bereicherung oder des unlauteren Wettbewerbs. Es verlangt Schadenersatz, eine Unterlassungsverfügung, die es Anthropic untersagt, weiterhin Inhalte von Reddit zu verwenden, Entschädigung für den Betrag, um den sich Anthropic durch das Scraping bereichert hat, und die Übernahme der Gerichtskosten.
Reddit führt an, Anthropic geriere sich als weißer Ritter der KI-Branche, sei aber alles andere als das. Alle Aussagen, man priorisiere Ehrlichkeit und hab nicht die Absicht seine Modelle mit personenbezogenen Daten zu trainieren, seien nur Marketinggeklingel. Das Gegenteil sei wahr: Anthropic habe seine KI absichtlich mit den persönlichen Daten von Reddit-Nutzern trainiert, ohne jemals deren Zustimmung eingeholt zu haben.
Im Gegensatz zu seinen Konkurrenten habe sich Anthropic geweigert, die grundlegenden Datenschutzrechte der Reddit-Nutzer zu respektieren, einschließlich der Entfernung gelöschter Beiträge aus seinen Systemen. Anthropic leide unter einer kognitiven Dissonanz des Unternehmens – seine Handlungen entsprächen nicht seinen erklärten Werten.
Reddit stützt sich auf Aussagen von Anthropic-Mitarbeitern, darunter CEO Amodei, denen zufolge auch Reddit-Daten für das Training verwendet wurden, was auch das Modell selbst auf eine entsprechende Frage hin zugibt (“Wurdest Du, mindestens teilweise, mit Reddit-Daten trainiert?” “Ja, zumindest einige Daten von Reddit waren Teil meines größeren Sets an Trainingsdaten.”) Anthropic führt dagegen an, Reddit stehe seit Mai 2024 auf der Blockliste für die Claude-KI. Dagegen argumentiert Reddit, seine Audit-Logs zeigten, dass automatisierte Bots von Anthropic in den Folgemonaten mehr als Hunderttausend Mal auf Reddit-Content zugegriffen hätten.




