Hugging Face baut Open-Source-Repo von DeepSeek R1

- 30. Januar 2025

Quelle: Hugging Face

Eine vollständig offene Reproduktion von DeepSeek-R1 ist das Ziel eines neuen Projekts des auf Tools für maschinelles Lernen spezialisierten Unternehmen Hugging Face.

Ziel dieses Repos sei es, die fehlenden Teile der R1-Pipeline so zu erstellen, dass jeder sie reproduzieren und auf ihr aufbauen kann. Mit den fehlenden Teilen sind etwa Details zu Trainingsmethoden gemeint und den Tools dafür. Hugging Face will diese Traings-Pipeline und die Datensätze rekonstruieren. Das Ergebnis soll ein nachgebautes DeepSeek R1 unter dem Nemn Open R1 sein, das komplett Open Source ist.

Das Projekt hat Hugging Face auf Github in drei Phasen eingeteilt. Die erste ist ein Destillat der Trainingsdaten. Die zweite Phase sieht ein replizieren der reinen RL-Pipeline vor, die DeepSeek zur Erstellung von R1-Zero verwendet hat. Dies beinhalte wahrscheinlich die Kuratierung neuer, umfangreicher Datensätze für Mathematik, logisches Denken und Code. Die dritte Phase soll schließlich zeigen, dass man durch mehrstufiges Training vom Basismodell zum RL-abgestimmten Modell gelangen kann. Auf Github bittet Hugging Face um Mithilfe und Datensätze.

SCHLAGWORTE
DeepSeek
KI

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung