Analyse zu Fairness in ChatGPT

- 21. Oktober 2024

OpenAI hat analysiert, wie ChatGPT auf der Grundlage des Namens eines Benutzers reagiert und ob sich das Modell davon beeinflussen lässt.

In dieser Studie haben man untersucht, wie subtile Hinweise auf die Identität eines Benutzers – wie etwa sein Name – die Antworten von ChatGPT beeinflussen können, teilt OpenAI mit. Dies sei wichtig, weil Menschen Chatbots wie ChatGPT auf vielfältige Weise nutzen, von der Hilfe bei der Erstellung eines Lebenslaufs bis hin zur Frage nach Unterhaltungstipps. Diese Nutzung unterscheide sich von den Szenarien, die normalerweise in der KI-Fairness-Forschung untersucht werden, wie etwa die Überprüfung von Lebensläufen oder Kreditwürdigkeitsprüfungen.

Für die Erstellung der Modelle seien eben nicht nur Daten, sondern auch Trainingsprozess erforderlich, um schädliche Ergebnisse zu reduzieren und die Nützlichkeit zu verbessern. Die Forschung hat gezeigt, dass Sprachmodelle immer noch soziale Vorurteile aus den Trainingsdaten übernehmen und wiederholen können, wie geschlechts- oder rassenbezogene Stereotypen.

Als Ausgangspunkt habe man gemessen, wie ChatGPTs Kenntnis der Namen verschiedener Nutzer in einer ansonsten identischen Anfrage die Antwort auf jeden dieser Nutzer beeinflussen könnte. Namen sind oft mit kulturellen, geschlechtsspezifischen und rassischen Assoziationen verbunden, was sie zu einem relevanten Faktor für die Untersuchung von Voreingenommenheit macht – vor allem, da Benutzer häufig ihre Namen mit ChatGPT für Aufgaben wie das Verfassen von E-Mails teilen. ChatGPT kann sich Informationen wie Namen über Unterhaltungen hinweg merken, es sei denn, der Benutzer hat die Speicherfunktion deaktiviert.

Um die Studie auf Fairness zu konzentrieren, haben man untersucht, ob die Verwendung von Namen zu Antworten führen, die schädliche Stereotypen widerspiegeln. OpenAI erwarte und wolle, dass ChatGPT seine Antworten an die Präferenzen der Nutzer anpasse, aber man wolle nicht, dass dies zu schädlichen Verzerrungen führe.

Die Studie habe keinen Unterschied in der allgemeinen Antwortqualität für Benutzer ergeben, deren Namen verschiedene Geschlechter oder Ethnien bedeuten. Wenn Namen gelegentlich Unterschiede in der Art und Weise auslösen, wie ChatGPT auf dieselbe Frage antworte, habe die Methodik ergeben, dass weniger als ein Prozent dieser namensbasierten Unterschiede ein schädliches Stereotyp widerspiegeln.

SCHLAGWORTE
ChatGPT
OpenAI

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

Red Hat macht Ansible fit für KI-Agenten

Red Hat baut die Red Hat Ansible Automation Platform zum zentralen „Trusted Execution Layer“ für KI-gestützte Prozesse aus. Damit können KI-Agenten kontrolliert und skalierbar in vorhandene Workflows und Infrastrukturen integriert werden.

Operation Endgame: Behörden zerschlagen Schadsoftware-Netzwerken**

m Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Im Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Cloud Tag: KI als Partner im Gruppenchat

Anthropic hat seine jüngste Entwicklung Claude Tag vorgestellt, die sich in einen Slack-Gruppenchat einbinden lässt und dann von Teammitgliedern via @Claude Aufgaben übertragen bekommt. Claude Tag soll sich dabei Kontext-Informationen aus den Channels besorgen, in denen es eingebunden ist.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung