Anthropic veröffentlicht Claude Sonnet 4.5

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Wenige Wochen nachdem OpenAI sein neues Modell GPT 5 vorgestellt hat, zieht nun Rivale Anthropic mit Clause Sonnet 4.5 nach und bezeichnet es selbst als weltbestes Modell für Programmierer.

Außerdem soll es sich für komplexe Agenten eignen, besonders pfiffig in der Benutzung von Computern sein und große Fortschritte beim Schlussfolgern und bei Mathe-Aufgaben gemacht haben. Die Claude App kann nun Code ausführen und verschiedene Arten von Files erzeugen (Spreadsheets, Slides und Dokumente).

Besonders für Programmierer hat die neue Version einiges zu bieten. So wurde die VS-Code-Erweiterung Claude Code um die Fähigkeit ergänzt, Checkpoints zu setzen und die Arbeit bei Bedarf dahin zurückzurollen. Auch wurde ein neues Context-Editing-Feature und ein Memory-Tool hinzugefügt, was es Agenten erlauben soll, länger eigenständig zu arbeiten. Zudem gibt es nun ein Claude Agent SDK, mit dem Entwickler ihre eignen Agenten entwerfen können.

Claude Sonnet 4.5 führt jetzt den SWE-Benchmark an, der die realen Codierfähigkeiten der Modelle messen soll. Anthropic berichtet, das Modell habe an komplexen, mehrschrittigen Aufgaben bis zu 30 Stunden am Stück gerechnet, ohne den Faden zu verlieren. Auch in diversen anderen Benchmarks liegt es nach Herstellerangaben vor GPT 5.

Ein umfangreiches Sicherheitstraining habe es ermöglicht, das Verhalten des Modells erheblich zu verbessern und schädliches Verhalten zu reduzieren. Dazu gehört Speichelleckerei, Täuschung, Machtstreben oder die Tendenz, wahnhaftes Denken zu fördern. Für die agentischen und computergestützten Funktionen des Modells wurden bemerkenswerte Fortschritte bei der Verteidigung gegen schnelle Injektionsangriffe gemacht – eines der größten Risiken für Benutzer dieser Fähigkeiten.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben