Neue Open-Source-Modelle von DeepSeek

- 24. April 2026

DeepSeek veröffentlicht die Version 4 seiner Modelle, darunter DeepSeek-V4-Pro und DeepSeek-V4-Flash, beide mit einem Kontextfenster von einer Million Token.

Die neuen Modelle agieren nach dem Mixture-of-Experts-Ansatz, wobei das V4-Pro-Modell 49 Milliarden von seinen 1,2 Billionen Token und das Modell V4-Flash 13 Milliarden von 284 Milliarden Parametern aktiviert.

Die Modelle zeichnen vor allem Updates bei Architektur und Optimierung aus. So braucht DeepSeek-V4-Pro im Vergleich zum Vorgänger DeepSeek-V3.2 nur 27 Prozent der Gleitkommaoperationen für die Inferenz und nur 10 Prozent des Key-Value-Cache. Erreicht wird das durch eine Kombination verschiedener Aufmerksamkeitsmechanismen, namentlich Compressed Sparse Attention (CSA) und Heavily Compressed Attention (HCA). Um die Stabilität der Signalausbreitung über verschiedene Layer des neuronalen Netzes zu verbessern, setzt DeepSeek auf die Technik Manifold-Constrained Hyper-Connections (mHC). Außerdem wird der Muon Optimizer verwendet, um eine schnellere Konvergenz und größere Stabilität im Training zu erzielen.

In Bezug auf die Leistung in üblichen Benchmarks wie SimpleQA Verified, Terminal Bench 2.0 oder SWE Verified befindet sich V4-Pro auf Augenhöhe mit Spitzenmodellen von OpenAI, Anthropic oder Google.

SCHLAGWORTE
DeepSeek
KI

Python verstärkt Schutzmechanismen

Der Python Package Index (PyPI) lehnt künftig Uploads von neuen Dateien ab, die zu Releases hochgeladen werden, die älter als 14 Tage sind.

Deutschland rangiert bei KI mit China auf Rang vier weltweit

In einer internationalen Studie von Adobe, die die Reife der wichtigsten globalen Ökosysteme für künstliche Intelligenz analysiert, landet Deutschland zusammen mit China auf Platz 4 hinter den USA, UK und Frankreich.

Tails 7.10 reduziert Datenverlust durch verbesserten Shutdown

Das Live-System zum anonymen Surfen im Internet über das Tor-Netzwerk wechselt in seiner neuen Version den mitgelieferten Video-Player, verlangsamt absichtlich das Herunterfahren des Systems und aktualisiert den Tor-Browser.

Codeberg sperrt Projekte mit überwiegend KI-generiertem Code aus

Nach einer Mitgliederabstimmung überarbeitet der Verein Codeberg e.V. die Nutzungsbedingungen seiner gleichnamigen Code-Hosting-Plattform. Zukünftig sind keine Projekte mehr erlaubt, die überwiegend mit Künstlicher Intelligenz erstellt wurden.

libx11-compat reanimiert Xlib-Software unter Wayland

Vor allem viele ältere X11-Clients setzen auf der Bibliothek Xlib auf. Mithilfe des Projekts libx11-compat lassen sich solche Anwendungen unter Wayland und anderen Systemen ohne X-Server weiterbetreiben.

Nach Agentenausbruch: Verteidiger mussten ein chinesisches Modell einsetzen

Im Nachgang des Angriffs eines ausgebrochenen KI-Agenten von OpenAI auf die Plattform HuggingFace wurde bekannt, dass die Verteidiger bei der Analyse des Vorfalls auf das chinesische Modell GLM-5.2 setzen mussten, weil führende amerikanische Modelle wegen der eingebauten Sicherheitsvorkehrungen...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Was ist die beliebteste Linux-Distro? Zum Einstieg nehmen wir das DistroWatch-Ranking auseinander und erklären, warum Seitenaufrufe keine Popularität messen. Im Hauptthema geht es um Open Source Funding: Wie im XKCD 2347 ruht unsere digitale Infrastruktur auf Komponenten, die oft von Einzelnen...