Anthropic schlägt Pause bei KI-Entwicklung vor

Anthropic hat eine Pause bei der Entwicklung von KI-Spitzenmodellen vorgeschlagen, um mehr Zeit zu gewinnen, mit den möglichen Folgen umzugehen.

Während der längsten Zeit in der KI-Entwicklung hätten Menschen den Fortschritt vorangetrieben, schreibt Anthropic in einem Blogbeitrag. Jetzt aber würde mehr und mehr Entwicklungsarbeit an KI-Systeme delegiert und das bereite den Weg für die rekursive Selbstoptimierung dieser Systeme. Man sei noch nicht an diesem Punkt, aber man könne ihn womöglich eher erreichen, als man darauf vorbereitet sei.

Dieser Trend habe gewaltige Auswirkungen. Das könne eine Entwicklung sein, die der Welt in den Bereichen Wissenschaft, Gesundheitswesen und darüber hinaus enormen Nutzen bringen könnte. Doch eine umfassende, rekursive Selbstverbesserung könnte auch das Risiko erhöhen, dass der Mensch die Kontrolle über KI-Systeme verliert. Wenn Systeme in der Lage sind, ihre Nachfolger vollständig selbst zu erschaffen, gewinnen die Methoden, mit denen Menschen sie absichern, überwachen und ihr Verhalten steuern, massiv an Bedeutung.

Die Entwicklungsgeschwindigkeit der KI nimmt zu. Die Länge der Aufgaben, die ein KI-System zuverlässig alleine bewältigen kann, würde sich ungefähr alle vier Monate verdoppeln. Noch im März 2024 konnte das eigene Modell Claude Opus 3 selbstständig Aufgaben übernehmen, die einen menschlichen Entwickler etwa vier Minuten gekostet hätten. Ein Jahr später übernahm Claude Sonnett 3.7 Aufgaben, für die ein Mensch anderthalb Stunden bräuchte. Und wieder ein Jahr später kommt Cloude Opus 4.6 mit 12-Stunden-Aufgaben zurecht. Heute stammten 80 Prozent des Codes für Claude von Claude, so Anthropic. Noch im Februar 2025 war dieser Wert erst einstellig.

“Die Anzeichen deuten darauf hin, dass die Rolle des Menschen in jeder Phase der KI-Entwicklung abnimmt. Sobald die Qualität von Code, der von Menschen geschrieben wurde, und jener von KI-generiertem Code gleichwertig ist, werden Menschen keinen Code mehr selbst schreiben, sondern sich auf dessen Überprüfung beschränken. Sollten sie jedoch nicht in der Lage sein, den Code ebenso schnell zu prüfen, wie Claude ihn generiert, wird die menschliche Überprüfung zum Engpass bei der KI-Entwicklung werden.”

Der Blog entwirft drei Zukunftsszenarien: Erstens, die Entwicklung verlangsamt sich wieder, auch wenn sich die heutigen Fähigkeiten der KI weiter verbreiten. Das reine Skalieren von Rechenleistung und Datenmenge erweist sich nicht als der richtige Weg. Aber selbst dann wären enorme Auswirkungen auf die Welt zu erwarten. Anthropic erwähnt dieses Szenario der Vollständigkeit halber, glaubt aber nicht daran.

Zweitens: Die KI-Labs verzeichnen weitere Effizienzgewinne. Die KI-Entwicklung wird weitgehend automatisiert, aber die Menschen behalten die Kontrolle über die Richtung der Forschung und bewerten die Resultate. Eine 100-Mann-Firma könnte Arbeit bewältigen, für die zuvor 100.000 Mann nötig waren. Dies würde die Wissensarbeit und die staatlichen Dienstleistungen revolutionieren, könnte aber auch für schädliche Zwecke missbraucht werden – von der autoritären Überwachung ganzer Bevölkerungen bis hin zu Einflusskampagnen, die Manipulationen individuell zuschneiden und in einem Ausmaß ablaufen, das kein menschliches Team bewältigen könnte.

Drittens: KI-Systeme werden selbst zu einer vollständigen rekursiven Selbstverbesserung fähig und beginnen, ihre Nachfolger zu entwickeln. Sollten sich die technischen Trends bei der Weiterentwicklung der Leistungsfähigkeit fortsetzen und KI-Systeme in die Lage versetzen, Fähigkeiten zu entwickeln, die für transformative menschliche Erfindungskraft charakteristisch sind, so ist es plausibel, dass diese Systeme sich selbst entwerfen und optimieren könnten. Menschen spielen dann eine immer kleinere Rolle.

Aus allem zieht Anthropic den Schluss: “Sollte es möglich sein, die Entwicklung dieser Technologie wirksam zu verlangsamen, um uns mehr Zeit für den Umgang mit ihren enormen Auswirkungen zu verschaffen, so wäre dies unserer Ansicht nach wahrscheinlich begrüßenswert. Führt eine solche Verlangsamung jedoch lediglich dazu, dass die technologisch aufholen können, die am wenigsten vorsichtig agieren, könnte dies die Sicherheit aller gefährden.”

Gut ausgestattete KI-Labore an oder in der Nähe der Spitze müssten sich länderübergreifend einigen, die Entwicklung unter denselben Bedingungen anzuhalten. Darüber hinaus müsste es möglich sein, gegenseitig zu überprüfen, ob der jeweils andere sich an die Vereinbarung hält. Eine glaubwürdige Pause muss zudem festlegen, was sie auslöst, was sie aufhebt und wer darüber entscheidet. Das sei, meint Anthropic, nicht von vornherein unmöglich. Man habe auch für andere Technologien Kontrollmechanismen geschaffen, wie zum Beispiel für nukleare Mittelstreckenraketen. Das habe allerdings Jahrzehnte gedauert und so viel Zeit habe man nun nicht mehr.

“In den kommenden Monaten werden wir Gespräche organisieren, in denen politische Entscheidungsträger, Forschende, die Zivilgesellschaft und andere KI-Unternehmen dazu beitragen können, einige der in diesem Beitrag aufgeworfenen Fragen zu beantworten – insbesondere im Hinblick auf die vollständige rekursive Selbstverbesserung sowie die Schaffung besserer Möglichkeiten für Koordination und Beratung. Die Ergebnisse dieser Gespräche werden wir veröffentlichen.”