Anthropic fordert mehr Transparenz in KI-Entwicklung

- 09. Juli 2025

Anthropic schlägt einen Transparenz-Framework vor, das auf Bundes-, Landes- oder internationaler Ebene angesiedelt sein könne und nur für die größten KI-Systeme und -Entwickler gilt. Gleichzeitig soll es klare Offenlegungspflichten für Sicherheitspraktiken geben.

Mehr Transparenz sei nötig, schreibt die Firma, um die öffentliche Sicherheit aufrecht zu erhalten und die Verantwortlichkeit für diese mächtige Technologie zu gewährleisten. Dabei wolle man nicht vordergründig auf Vorschriften setzen. “Wir sind uns bewusst, dass sich die Wissenschaft der KI ständig weiterentwickelt und jede Regulierungsmaßnahme leicht und flexibel bleiben muss. Sie sollten weder die KI-Innovation behindern noch unsere Fähigkeit einschränken, die Vorteile der KI zu nutzen.”

Stattdessen schlägt Anthropic die folgenden Grundsätze als Kern einer KI-Strategie vor:

Beschränkung der Anwendung auf die größten Modellentwickler: KI-Transparenz sollte nur für die größten Entwickler von Spitzenmodellen gelten, die die leistungsfähigsten Modelle entwickeln – wobei die Spitzenmodelle durch eine Kombination von Schwellenwerten für Rechenleistung, Rechenkosten, Bewertungsleistung, Jahresumsatz und Ausgaben für Forschung und Entwicklung unterschieden werden. Dem Vorschlag zufolge soll es um Grenzwerte in der Größenordnung von 100 Millionen Dollar jährlicher Einnahmen oder 1 Milliarde Dollar jährlicher Ausgaben für Forschung und Entwicklung gehen.
Schaffung eines sicheren Entwicklungsrahmens: Verlangt von den Entwicklern, dass sie dargelegen, wie sie unangemessene Risiken in einem Modell bewerten und mindern werden. Diese Risiken müssen die Entstehung chemischer, biologischer, radiologischer und nuklearer Schäden sowie von Schäden durch falsch eingestellte Modellautonomie einschließen.
Veröffentlichungspflicht für das Rahmenwerk für sichere Entwicklung: Die Maßnahmen sollten vorbehaltlich angemessener Schwärzungsmaßnahmen für sensible Informationen auf einer öffentlich zugänglichen Website, die auf das KI-Unternehmen registriert ist und von diesem gepflegt wird, der Öffentlichkeit zugänglich gemacht werden.
Veröffentlichung eines System-Steckbriefs: System Cards oder andere Unterlagen sollten eine Zusammenfassung der Test- und Bewertungsverfahren, der Ergebnisse und der erforderlichen Abhilfemaßnahmen enthalten. Diese Systemkarten sollten bei der Einführung veröffentlicht und aktualisiert werden, wenn das Modell wesentlich überarbeitet wird.
Schutz von Whistleblowern: Falschaussagen über das KI System sollten eine explizite Rechtsverletzung darstellen, so dass die Anwendung des bestehenden Schutzes für Hinweisgeber ermöglicht und sicherstellt wird, dass absichtliches Fehlverhalten Konsequenzen hat.
Transparenz-Standards: Da KI-Sicherheitspraktiken noch in den Kinderschuhen stecken und Pionierentwickler wie Anthropic aktiv an bewährten Praktiken forschen, muss der Rahmen für die Entwicklung flexibel ausgelegt sein. Standards sollten als annpassbare, leichtgewichtige Anforderungen beginnen, die verschärft werden können, wenn sich in der Industrie, bei den Behörden und anderen Interessengruppen ein Konsens über die besten Praktiken herausbildet hat.

Anthropic verweist darauf, dass es selbst und andere führende Labore wie Google, Microsoft oder OpenAI bereits ähnliche Prinzipien intern verabschiedet haben. Nun käme es darauf an, diese bewährten Praktiken zu standardisieren und rechtlich zu verankern.

SCHLAGWORTE
KI
Security

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

Red Hat macht Ansible fit für KI-Agenten

Red Hat baut die Red Hat Ansible Automation Platform zum zentralen „Trusted Execution Layer“ für KI-gestützte Prozesse aus. Damit können KI-Agenten kontrolliert und skalierbar in vorhandene Workflows und Infrastrukturen integriert werden.

Operation Endgame: Behörden zerschlagen Schadsoftware-Netzwerken**

m Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Im Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Cloud Tag: KI als Partner im Gruppenchat

Anthropic hat seine jüngste Entwicklung Claude Tag vorgestellt, die sich in einen Slack-Gruppenchat einbinden lässt und dann von Teammitgliedern via @Claude Aufgaben übertragen bekommt. Claude Tag soll sich dabei Kontext-Informationen aus den Channels besorgen, in denen es eingebunden ist.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung