Das chinesiche KI-Unternehmen DeepSeek hat zwei neue, leistungsstarke Open-Source-Modelle releast, die nach eigenen Angaben OpenAIs GPT-5 and Googles Gemini-3.0-Pro in den Schatten stellen sollen.

(C) DeepSeek
Damit ist die nächste Runde im Ringen zwischen USA und China um das beste LLM eingeläutet. Das in Hangzhou ansässige Unternehmen brachte DeepSeek-V3.2 auf den Markt, das als Assistent für alltägliche Aufgaben konzipiert ist, sowie DeepSeek-V3.2-Speciale, eine leistungsstarke Variante, die bei vier internationalen Elitewettbewerben Goldmedaillen gewann: der Internationalen Mathematik-Olympiade 2025, der Internationalen Informatik-Olympiade, den ICPC-Weltmeisterschaften und der Chinesischen Mathematik-Olympiade.
Ein weiteres Mal stellt DeepSeek damit unter Beweis, dass es trotz der US-Exportbeschränkungen für Nvidia-GPUs Modelle entwickeln kann, die an die Leistung der US-Konkurrenz heranreichen oder diese übertreffen. Das gelingt zu einem guten Teil durch architektonische Innovationen wie DeepSeek Sparse Attention (DSA), einen Attention-Mechanismus, der im Unterschied zu früheren Technologien auch bei langen Inputsequenzen nicht den Überblick über den Kontext verliert. Stattdessen indiziert ein spezieller Indexer nur die wichtigsten Bestandteile des Kontext und ignoriert einstweilen den Rest. Das halbiert die Inferenz-Kosten gegenüber Vorgänger-Modellen ohne die Performance zu beeinträchtigen.
In vielen Benchmarks agieren die neuen DeepSeek-Modelle auf Augenhöhe mit ChatGPT-5 und Gemini-3-Pro. Besonders bei den Reasoning-Fähigkeiten zieht DeepSeek-3.2-Speciale aber vorbei und setzt sich an die Spitze.





