Die chinesischen DeepSeek-Modelle haben schon mehrfach wegen ihrer guten Leistung bei geringeren Trainingskosten Aufsehen erregt. Dank ihrer Open-Source-Lizenzierung können sie von jedermann weiter verbessert werden. Nun hat eine mittelständische Beratungsfirma aus Unterföhring bei München, die TNG Technology Consulting GmbH, ihre DeepSeek-Version namens DeepSeek-TNG R1T2 Chimera vorgestellt, die DeepSeek R1 an Intelligenz und Geschwindigkeit übertrifft.
Die neue Version ist ein LLM mit drei Elternmodellen: DeepSeek R1-0528, R1 und V3-0324. Sie scheint ein nahezu optimales Verhältnis von Geschwindigkeit zu Inferenzkosten gefunden zu haben. Das Modell ist etwa 20 Prozent schneller als R1 (aus dem Januar) und mehr als doppelt so schnell wie R1-0528 (veröffentlicht im Mai). Dabei ist es in Benchmarks wie GPQA-Diamond und AIME-24/25 deutlich intelligenter als R1, wenn auch nicht ganz auf dem Niveau von R1-0528.
Selbstverständlich steht auch das neue Modell seinerseits unter einer Open-Source-Lizenz (MIT Lizenz). Die Modellgewichte sind auf Hugging Face verfügbar. Die Raktionen der KI-Entwicklergemeinde fallen sehr positiv aus.





