Anthropics Claude Opus 4 konzentriert sich einen Programmierer-Arbeitstag lang

- 23. Mai 2025

Anthropic hat seine neuen Sprachmodelle Claude Opus 4 und Claude Sonnet 4 vorgestellt und damit das Limit dafür verschoben, was ein solches Modell auf sich allein gestellt am Stück leisten kann.

Das Flagschiff-Modell Cloude Opus 4 arbeitete danach an einer komplexen Refactoring-Aufgabe fast sieben Stunden lang ohne Hilfe und verschob damit die Aufmerksamkeitsspanne bisheriger Modelle im Minutenbereich auf fast einen ganzen Arbeitstag. Damit eignet es sich auch für komplexe Aufgaben, die es von der Konzeption bis zum Abschluss bewältigen kann, wobei es über die gesamte Zeit den Kontext im Blick hat und fokussiert bleibt.

Außerdem schlägt Claude Opus 4 den Konkurrenten GPT-4.1 von OpenAI auch im schweren Softwareentwicklungsbenchmark SWE-bench mit 72,5 Prozent (GPT-4.1 erzielte bei seiner Einführung 54,6 Prozent).

Die neuen Claude-Modelle gehören zu der relativ jungen Klasse der schlussfolgernden Modelle (Reasoning Models), zu denen auch OpenAIs o-Serie, Gemini 2.5 oder DeepSeeks R1-Modell gehören. Die Clause-Modelle unterscheiden sich aber von ihren Mitbewerbern dadurch, dass sie Werkzeuggebrauch direkt in den Prozess des Schlussfolgerns integrieren und durch das simultane “Forschen” und “Nachdenken” dem menschlichen Problemlösen näher kommen.

Beide neuen Claude-Modelle können die Intensität der Lösungssuche steuern und bieten umgehende Antworten bei leichteren Fragen und brauchen länger für schwierige Fragen. Damit haben sie das frustrierende Verhalten früherer Reasoning Modelle überwunden, die oft auch bei leichten Fragen lange nachdachten – die Ressourcen werden jetzt in Abhängigkeit von der Schwere des Problems dynamisch eingesetzt.

Der Zeitpunkt der Ankündigung von Anthropic macht deutlich, wie schnell sich der Wettbewerb im Bereich der fortgeschrittenen KI beschleunigt. Nur fünf Wochen, nachdem OpenAI seine GPT-4.1-Familie auf den Markt gebracht hat, hat Anthropic mit Modellen gekontert, die diese in wichtigen Parametern herausfordern oder übertreffen. Google hat seine Gemini 2.5-Reihe Anfang des Monats aktualisiert, während Meta vor kurzem seine Llama 4-Modelle mit multimodalen Fähigkeiten und einem Kontextfenster mit 10 Millionen Token vorgestellt hat.

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung