Anthropic veröffentlicht Claude Sonnet 5

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Anthropic hat mit Claude Sonnet 5 sein neuestes Sprachmodell veröffentlicht, das sich besonders für agentische Aufgaben empfiehlt. Es kann Pläne schmieden, Tools wie Browser und Terminals verwenden und in einem Maße autonom arbeiten, wie das noch vor wenigen Monaten nur größeren und teureren Modellen möglich war.

(C) Anthropic

Sonnet 5 soll die Lücke zwischen früheren Sonnet-Modellen und dem Spitzenmodell der Opus-Klasse schließen. Es kommt Opus 4.8 nahe, ist aber billiger. Es hat eine geringere Neigung zu unerwünschtem Verhalten als sein Vorgänger Sonnet 4.6 und ist allgemein sicherer im agentischen Einsatz.  Was die agentische Sicherheit betrifft, ist das Modell besser darin, böswillige Anfragen abzulehnen und sich bei Prompt-Injection-Angriffen gegen Hijacking-Versuche zu wehren. Das Modell weist geringere Raten an Halluzinationen und Unterwürfigkeit auf als Sonnet 4.6. Bei einem automatisierten Verhaltensaudit, das ein breites Spektrum an fehlgeleitetem Verhalten wie die Mitwirkung bei Missbrauch und Täuschung testet, erzielte Sonnet 5 insgesamt niedrigere Werte. Allerdings zeigte es bei dieser Bewertung im Vergleich zu den leistungsfähigeren Modellen Opus 4.8 und Claude Mythos Preview etwas höhere Raten an fehlgeleitetem Verhalten. Für Cybersecurity-Aufgaben wie die Schwachstellensuche eignet es sich deutlich schlechter als die Opus-Modelle.

Sonnet 5 bietet bei mittlerem Aufwand eine deutlich verbesserte Kosteneffizienz; bei höherem Aufwand kann seine Leistung bei einigen Aufgaben mit der von Opus 4.8 mithalten. Zwischen Sonnet 5 und Opus 4.8 können Anwender den Aufwandsgrad anpassen, um das richtige Gleichgewicht zwischen Kosten und Leistung zu finden. Das Feedback von Early-Access-Partner war einheitlich: Sonnet 5 sei wesentlich eigenständiger als seine Vorgängermodelle. Die Tester beschrieben, wie es komplexe Aufgaben zu Ende führt, bei denen frühere Sonnet-Modelle an ihre Grenzen stießen, wie es seine eigenen Ergebnisse überprüft, ohne ausdrücklich dazu aufgefordert zu werden, und wie es all diese Aufgaben zu einem attraktiven Preis erledigt.

Ab sofort ist Clause Sonnet 5 weltweit verfügbar. Für Nutzer mit kostenlosen oder Pro-Accounts ist es der Default. Zudem ist es auch in Claude Code verfügbar und in der Claude-Plattform mit Einstiegspreisen von 2 Dollar pro Millionen Input-Tokens und 10 Dollar pro Millionen Output-Tokens bis 31. August. Danach steigen die Preise auf 3 beziehungsweise 15 Dollar.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben