Anthropic veröffentlicht Claude Opus 4.6

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Anthropic hat sein Spitzenmodell auf die Version 4.6 upgedatet. Es kommt erstmals mit einem Kontextfenster von einer Million Token und verbesssert vor allem die Programmier- und Debuggingfähigkeiten noch weiter.

Opus 4.6 kann seine verbesserten Fähigkeiten auch auf eine Reihe von alltäglichen Arbeitsaufgaben anwenden: Finanzanalysen durchführen, Recherchen anstellen sowie Dokumente, Tabellen und Präsentationen verwenden und erstellen. Innerhalb von Cowork bearbeitet es autonom mehrere Aufgaben gleichzeitig.

In mehereren Benchmarks erreicht das neue Modell Bestwerte. So erzielt es beispielsweise die höchste Punktzahl bei der agentenbasierten Codierungsbewertung Terminal-Bench 2.0 und liegt bei Humanity’s Last Exam, einem komplexen multidisziplinären Test zum logischen Denken, vor allen anderen Spitzenmodellen. Bei GDPval-AA – einer Bewertung der Leistung bei wirtschaftlich wertvollen Wissensaufgaben in den Bereichen wie Finanzen oder Recht – übertrifft Opus 4.6 das zweitbeste Modell der Branche (GPT-5.2 von OpenAI) um rund 144 Elo-Punkte und seinen eigenen Vorgänger (Claude Opus 4.5) um 190 Punkte. Opus 4.6 schneidet auch besser ab als jedes andere Modell bei BrowseComp, das die Fähigkeit eines Modells misst, schwer auffindbare Informationen online zu lokalisieren. Auch in Sachen Sicherheit und Zuverlässigkeit setzt das neue Modell nach Herstellerangaben neue Maßstäbe.

In Claude Code lassen sich nun Teams von Agenten zusammenstellen, die gemeinsam an einer Aufgabe arbeiten. Der Kontext lässt sich nun komprimieren, so dass das Modell seltener an dessen Grenzen stößt. Außerdem wird eine Technik eingeführt, die Anthropic Adaptive Thinking nennt. Sie soll aus dem Kontext ableiten, wann das Modell erweiterte Fähigkeiten zum Schlussfolgern einsetzen soll, und so eine bessere Kontrolle von Geschwindigkeit und Kosten ermöglicht.

Der Preis bleibt dergeleich wie beim Vorgänger: 5 beziehungsweise 25 Dollar pro Million Input- beziehungsweise Output-Token.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben