DeepSeek schockt erneut mit neuem, schnellen, aber sehr genügsamen Modell

- 25. März 2025

Ganz ohne Ankündigung und Marketing Tamtam hat DeepSeek sein neues Modell DeepSeek-V3-0324 veröffentlicht, dass auf einem einzelnen Mac Studio performant läuft und zudem unter einer MIT-Lizenz steht, also auch kommerziell kostenlos verwendet werden kann, was Mitbewerber wie OpenAI unter Druck setzt.

Zwar kann man wahrscheinlich noch nicht von Consumer Hardware reden, denn der nötige Mac Studio mit M3-Ultra-Chip und 512 GB RAM kostet um die 9500 Dollar, andererseits unterscheiden sich diese Hardwareanforderungen aber auch sehr deutlich von den sonst üblichen Rechenzentren, in denen vergleichbare Modelle betrieben werden. Statt der dort üblichen NVIDIA GPUs, die Kilowattweise Strom fressen, kommt der Apple-Rechner stattdessen mit 200 Watt aus. Auf dem Mac soll das neue DeepSeek-Modell eine Performance von mehr als 20 Token/Sekunde erreichen. Bisher vorliegende Benchmarkergebnisse müssen noch von weiteren Testern bestätigt werden, wenn dies aber geschieht, würde sich das V3-Modell als bestes Non-Reasoning-Modell in der Rangliste knapp über Claude 3.5 Sonnett von Anthropic einordnen, das von sich selbst behauptet der derzeit leistungsstärkste KI-Chatbot zu sein.

Einmal mehr scheint sich DeepSeeks Mixture-of-Experts-Ansatz (MoE) als sehr effizient zu erweisen. Während herkömmliche LLMs alle ihre Hunderte Milliarden von Parametern bei jeder Fragestellung aktivieren, braucht DeepSeek für einzelne Aufgaben nur 37 seiner 685 Milliarden Parameter. Durch die Verwendung nur vergleichsweise weniger “Experten”-Parameter erreicht DeepSeek einerseits einen großen Performancevorteil und kann andererseits die Hardwareanforderungen drastisch senken.

Das Modell bedient sich weiterer zwei bahnbrechenden Technologien: Multi-Head Latent Attention (MLA) und Multi-Token Prediction (MTP). MLA verbessert die Fähigkeit des Modells, den Kontext über lange Textpassagen hinweg aufrechtzuerhalten, während MTP mehrere Token pro Schritt erzeugt, wo bisher ein einzelnes Token üblich war. Zusammen steigern diese Innovationen die Ausgabegeschwindigkeit um fast 80 Prozent.

Der Umstand, dass China kompromisslos auf Open Source setzt, hat das chinesische KI-Ökosystem rasch verändert. Die offene Verfügbarkeit von Spitzenmodellen schafft einen Multiplikatoreffekt, der es Start-ups, Forschern und Entwicklern ermöglicht, ohne großen Kapitalaufwand auf hoch entwickelter KI-Technologie aufzubauen. Dies hat Chinas KI-Fähigkeiten in einem Tempo beschleunigt, das westliche Beobachter schockiert.

SCHLAGWORTE
DeepSeek
KI
LLM

Mageia 10 mit Linux-Kernel 6.18 und aktueller Desktop-Software

Die Mageia-Gemeinschaft hat Version 10 ihrer Linux-Distribution veröffentlicht. Rund drei Jahre nach dem Erscheinen der Version 9 des Mandriva-Nachfolgers.

Google Meet protokolliert in Meetings mit

Google Nutzer mit KI Pro- und Ultra-Abos brauchen in Meetings ab sofort keinen Schriftführer mehr: Google Meet transkribiert die Diskussion selbstständig und fasst die wichtigsten Maßnahmen per E-Mail und in einem Google-Doc-File zusammen, dass den Teilnehmern anschließend automatisch zugestellt...

Universität Paderborn erweitert Supercomputer „Otus“

Die Universität Paderborn baut ihren Hochleistungsrechner „Otus“ aus. Wie die Hochschule mitteilt, stehen dafür mehr als zwölf Millionen Euro aus Landes- und Bundesmitteln zur Verfügung.

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung