Chinesisches Sprachmodell Spitze beim Schlussfolgern

- 21. Januar 2025

Das chinesische Startup DeepSeek stellt sein neues schlussfolgerndes Sprachmodell DeepSeek-R1 vor, das so leistungsfähig wie OpenAIs o1-Modell sein soll, dabei aber 90 bis 95 Prozent kostengünstiger ist.

Sprachmodell mit der Fähigkeit Schlussfolgerungen zu ziehen, gelten als Schritt hin zu einer allgemeinen Künstlichen Intelligenz (AGI), die intellektuelle Aufgaben wie Menschen bewältigen kann. OpenAI machte den ersten Schritt in diese Richtung mit dem o1-Modell. Durch RL (Reinforcement Learning oder belohnungsgesteuerte Optimierung) lernt o1, seine Gedankenkette und die von ihm verwendeten Strategien zu verfeinern. Es kann seine Fehler erkennen und korrigieren oder neue Ansätze ausprobieren, wenn die aktuellen nicht funktionieren.

DeepSeek-R1 nutzt ebenfalls Reinforcement Learning, kombiniert mit überwachter Feinabstimmung, um komplexe logische Aufgaben zu bewältigen und die Leistung von o1 zu erreichen. In diversen Benchmarks schneidet es ebenso gut oder etwas besser ab. Das Unternehmen entwickelte die Denkfähigkeiten des Modells zunächst ohne Verwendung überwachter Daten. Es konzentrierte sich im Wesentlichen nur auf seine Selbstentwicklung durch einen rein RL-basierten Versuch-und-Irrtum-Prozess. Während des Trainings entwickelte DeepSeek-R1-Zero auf natürliche Weise zahlreiche leistungsstarke und interessante logische Verhaltensweisen”, schreiben die Forscher in einem Papier. “Nach Tausenden von RL-Schritten zeigt DeepSeek-R1-Zero eine hervorragende Leistung bei schlussfolgernden Benchmarks.” Trotz verbesserter Leistung, einschließlich Verhaltensweisen wie Reflexion und Erkundung von Alternativen, wies das ursprüngliche Modell jedoch einige Probleme auf, darunter schlechte Lesbarkeit und Sprachmischung. Um das zu beheben, verwendeten die Forscher schließlich einen mehrstufigen Ansatz, der sowohl überwachtes Lernen als auch bestärkendes Lernen kombinierte, und entwickelte so das verbesserte R1-Modell.

DeepSeek-Rl steht als Open-Source-Software unter der MIT-Lizenz und wurde auf Hugging Face veröffentlicht.

SCHLAGWORTE
KI

Zwölfte Checkmk-Konferenz läuft in München

Als ausgereifte und dabei kostengünstige Full-Stack-Monitoringlösung präsentierte sich in diesen Tagen Checkmk auf seiner 12. Anwenderkonferenz in München, die mit über 580 Besuchern vor Ort einen neuen Rekord verzeichnete.

Jahresbericht Telekommunikation der Bundesnetzagentur

Die Bundesnetzagentur hat jüngst den Jahresbericht 2025 zum Bereich Telekommunikation veröffentlicht. Quelle: Bundesnetzagentur

Die Bundesnetzagentur hat jüngst den Jahresbericht 2025 zum Bereich Telekommunikation veröffentlicht. Demnach haben die Telekommunikationsunternehmen im Jahr 2025 rund 15,3 Milliarden Euro in Sachanlagen investiert.

Curl-Projekt macht Sommerfrische

Daniel Stenberg, Maintainer und Erfinder von Curl hat eine Pause von 1. Juli bis 3. August angekündigt. In der Zeit werde man keine Sicherheitsreports annehmen. Die Curl-Entwickler haben diese Zeit den „Curl-Sommer der Glückseligkeit“ getauft.

Open Source Wettbewerb: BDMS übernimmt Schirmherrschaft

Das Bundesministerium für Digitales und Staatsmodernisierung übernimmt erneut die Schirmherrschaft für den Open Source Wettbewerb. Die Open Source Business Alliance – Bundesverband für digitale Souveränität e.V. hat die Initiative im März 2026 gestartet.

Deutsche oft von digitalen Technologien überfordert

Digitale Technologien gehören für viele Bürger zum Alltag. Allerdings fühlt sich ein Drittel (33 Prozent) der Deutschen häufig damit überfordert. Das hat eine repräsentative Befragung im Auftrag des Digitalverbands Bitkom ergeben.

Hunderte AUR-Pakete kompromittiert

Hunderte von verwaisten Paketen, die im Arch User Repository (AUR) gehostet werden, wurden von einem Angreifer kompromittiert, der ein bösartiges npm-Paket hinzugefügt hat, das sensible Daten abgreifen kann.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Inline Feedbacks

Alle Kommentare anzeigen