Die jetzt veröffentlichte Vollversion von OpenAIs neuestem Sicherheitsmodell GPT-5.5 Cyber soll das entsprechende Modell Mythos 5 von Anthropic hinter sich lassen, das eben noch nur ausgewählten Partnern zugänglich gemacht wurde, weil es ansonsten zu gefährlich sei, und das die US-Regierung kürzlich verbieten ließ. Das Modell erreichte im Benchmark CyberGym mit 85,6 Prozent einen neuen Maßstab. Im Vergleich dazu kam GPT‑5.5 auf 81,8 Prozent und Mythos 5 auf 83,8 Prozent.
GPT-5.5-Cyber übertraf GPT-5.5 zudem bei zwei anspruchsvollen Sicherheits-Benchmarks aus der Praxis: 39,5 Prozent gegenüber 25,95 Prozent bei ExploitGym, der testet, ob Agenten bekannte Schwachstellen in funktionierende Exploits umwandeln können. Beim SEC-bench Pro, der die Erkennung von Schwachstellen mit langfristigem Horizont und die Erstellung von Proof-of-Concepts für komplexe Softwareziele bewertet, erreichte GPT-5.5-Cyber 69,8 Prozent, verglichen mit 63,1 Prozent für GPT-5.5.
Das aktuellste Update gehe einen weiteren Schritt voran, so OpenAI: “Es ist unser bislang leistungsstärkstes Modell zur Erkennung und Behebung von Software-Sicherheitslücken, das gleichzeitig die universelle Intelligenz von GPT-5.5 und dessen Fähigkeit zur Bearbeitung langer, komplexer Aufgaben beibehält. Das Modell ist in der Lage, tiefgreifende Analysen in großen Codebasen durchzuführen: Es identifiziert sicherheitsrelevante Komponenten, verfolgt, ob anfälliger Code erreichbar ist, validiert potenzielle Probleme in kontrollierten Umgebungen, entwickelt und testet Patches und bereitet Nachweise für die Überprüfung durch Menschen vor. Das Ziel ist es, Sicherheitsverantwortlichen dabei zu helfen, den gesamten Behebungszyklus zu durchlaufen – und nicht nur mehr Befunde zu liefern.”





