Anthropic veröffentlich zwei neue Spitzenmodelle: Claude Fable 5 und Mythos 5

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Anthropic hat zwei neue Spitzenmodelle vorgestellt Claude Fable 5 und Claude Mythos 5. Beide Modelle basieren auf derselben technischen Grundlage, wobei Fable 5, das Modell für die breite Öffentlichkeit, mit strengsten Sicherheitsvorkehrungen ausgeliefert wird, die einen Missbrauch verhindern sollen. Mythos 5, das nur einem exklusiven Kreis von Sicherheitsforschern und staatlichen Stellen angeboten wird, hat diese Einschränkungen nicht.

In ausgewählten Benchmarks liegen die neuen Modelle deutlich vor der Konkurrenz. Beim SWE-Bench-Pro, der die Fähigkeiten bei der autonomen Programmierung messen soll, erreicht Fable 5 eine Erfolgsquote von 80,3 Prozent, wogegen es das direkt Konkurrenzmodell von OpenAI, ChatGPT 5.5 lediglich auf 58,6 Prozent bringt.

(C) Anthropic

Beim FrontierCode-Benchmark ist der Abstand noch größer: Fable 5 bewältigt 29,3 Prozent der komplexen Aufgaben – ChatGPT 5.5 nur 5,7 Prozent.

Besonders stark soll Fable 5 auch bei Aufgaben sein, die ein besonderes visuelles Verständnis erfordern, etwa beim Extrahieren von Daten aus komplexen wissenschaftlichen Diagrammen oder beim Spielen von Videospielen. Auch ein großes Kontextfenster kommt dem neuen Modell hier zugute.

Gerade bei der autonomen Bewältigung komplexer Aufgaben soll Fable 5 seine Stärken ausspielen können. So berichtet der Zahlungsdienstleister Stripe, das Modell habe die Migration einer Codebasis in Ruby mit 50 Millionen Zeilen in einem Tag abschließen können. Menschliche Entwickler hätten dafür schätzungsweise zwei Monate benötigt.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben