Das chinesische Start-up DeepSeek hat in aller Stille sein neuestes Modell mit der Versionsnummer 3.1 auf die Plattform Hugging Face hochgeladen und erneut für Aufmerksamkeit in aller Welt gesorgt.
Das Open-Source-Modell mit 685 Milliarden Parametern reiht sich ersten Tests zufolge erneut in die Liga der Top-Modelle ein und stellt die Dominanz der amerikanischen KI-Konzerne infrage. Schnell und unaufhaltsam kletterte es in Beliebtheits-Rankings in die Höhe – nicht zuletzt deshalb, weil es im Unterschied zu vielen Mitbewerbern als Open-Source-Modell auf der ganzen Welt frei zugänglich ist.
Das Modell erreichte 71,6 Prozent beim renommierten Aider-Codierungs-Benchmark, womit es sich als eines der leistungsstärksten Modelle auf dem Markt etabliert und die Dominanz der amerikanischen KI-Giganten direkt herausfordert. Das sei, so KI-Forscher Andrew Christianson in einem Tweet, 1 Prozent mehr als Claude Opus 4 — dabei sei es aber 68mal billiger.
Das System verarbeitet bis zu 128 000 Kontext-Token – was in etwa einem 400-seitigen Buch entspricht – und erreicht dabei eine Reaktionsgeschwindigkeit, die etliche schlussfolgernde Konkurrenten in den Schatten stellt. Der eigentliche Durchbruch liegt in dem, was DeepSeek seine “hybride Architektur” nennt. Im Gegensatz zu früheren Versuchen, verschiedene KI-Fähigkeiten zu kombinieren, was oft zu Systemen führte, die in allen Bereichen schlechte Leistungen erbrachten, integriert V3.1 nahtlos Chat-, Denk- und Kodierungsfunktionen in ein einziges, kohärentes Modell.
Die Vorstellung der neuen Version erfolgte nur Wochen nach der Einführung von OpenAI GPT-5 und Anthropic Claude 4, beides Spitzenmodelle, mit denen DeepSeek V3.1 nun mithalten kann. Im Unterschied zu ihnen ist es aber frei zugänglich. Das wirft grundsätzliche Fragen nach den jeweiligen Strategien auf: Amerikanische Firmen wie OpenAI und Anthropic behandeln ihre Modelle als geistiges Eigentum, das geschützt und monetär verwertet werden muss, um für die Wagniskapitalgeber die hohen Kosten für Infrastruktur und Personal wieder einzuspielen. Chinesische Forscher betrachten ihre KI-Modelle eher als Allgemeingut und fördern deren schnelle Weiterentwicklung durch den freien Zugang. Das wiederum untergräbt die Möglichkeiten der Wettbewerber, für vergleichbare Leistungen hohe Margen zu erzielen. Gleichzeitig werden quelloffene Modelle von der weltweiten Community der KI-Entwickler begeistert aufgenommen, ungeachtet ihrer geografischen Herkunft.





