Anthropic schlägt einen Transparenz-Framework vor, das auf Bundes-, Landes- oder internationaler Ebene angesiedelt sein könne und nur für die größten KI-Systeme und -Entwickler gilt. Gleichzeitig soll es klare Offenlegungspflichten für Sicherheitspraktiken geben.
Mehr Transparenz sei nötig, schreibt die Firma, um die öffentliche Sicherheit aufrecht zu erhalten und die Verantwortlichkeit für diese mächtige Technologie zu gewährleisten. Dabei wolle man nicht vordergründig auf Vorschriften setzen. “Wir sind uns bewusst, dass sich die Wissenschaft der KI ständig weiterentwickelt und jede Regulierungsmaßnahme leicht und flexibel bleiben muss. Sie sollten weder die KI-Innovation behindern noch unsere Fähigkeit einschränken, die Vorteile der KI zu nutzen.”
Stattdessen schlägt Anthropic die folgenden Grundsätze als Kern einer KI-Strategie vor:
- Beschränkung der Anwendung auf die größten Modellentwickler: KI-Transparenz sollte nur für die größten Entwickler von Spitzenmodellen gelten, die die leistungsfähigsten Modelle entwickeln – wobei die Spitzenmodelle durch eine Kombination von Schwellenwerten für Rechenleistung, Rechenkosten, Bewertungsleistung, Jahresumsatz und Ausgaben für Forschung und Entwicklung unterschieden werden. Dem Vorschlag zufolge soll es um Grenzwerte in der Größenordnung von 100 Millionen Dollar jährlicher Einnahmen oder 1 Milliarde Dollar jährlicher Ausgaben für Forschung und Entwicklung gehen.
- Schaffung eines sicheren Entwicklungsrahmens: Verlangt von den Entwicklern, dass sie dargelegen, wie sie unangemessene Risiken in einem Modell bewerten und mindern werden. Diese Risiken müssen die Entstehung chemischer, biologischer, radiologischer und nuklearer Schäden sowie von Schäden durch falsch eingestellte Modellautonomie einschließen.
- Veröffentlichungspflicht für das Rahmenwerk für sichere Entwicklung: Die Maßnahmen sollten vorbehaltlich angemessener Schwärzungsmaßnahmen für sensible Informationen auf einer öffentlich zugänglichen Website, die auf das KI-Unternehmen registriert ist und von diesem gepflegt wird, der Öffentlichkeit zugänglich gemacht werden.
- Veröffentlichung eines System-Steckbriefs: System Cards oder andere Unterlagen sollten eine Zusammenfassung der Test- und Bewertungsverfahren, der Ergebnisse und der erforderlichen Abhilfemaßnahmen enthalten. Diese Systemkarten sollten bei der Einführung veröffentlicht und aktualisiert werden, wenn das Modell wesentlich überarbeitet wird.
- Schutz von Whistleblowern: Falschaussagen über das KI System sollten eine explizite Rechtsverletzung darstellen, so dass die Anwendung des bestehenden Schutzes für Hinweisgeber ermöglicht und sicherstellt wird, dass absichtliches Fehlverhalten Konsequenzen hat.
- Transparenz-Standards: Da KI-Sicherheitspraktiken noch in den Kinderschuhen stecken und Pionierentwickler wie Anthropic aktiv an bewährten Praktiken forschen, muss der Rahmen für die Entwicklung flexibel ausgelegt sein. Standards sollten als annpassbare, leichtgewichtige Anforderungen beginnen, die verschärft werden können, wenn sich in der Industrie, bei den Behörden und anderen Interessengruppen ein Konsens über die besten Praktiken herausbildet hat.
Anthropic verweist darauf, dass es selbst und andere führende Labore wie Google, Microsoft oder OpenAI bereits ähnliche Prinzipien intern verabschiedet haben. Nun käme es darauf an, diese bewährten Praktiken zu standardisieren und rechtlich zu verankern.




