NVIDIA veröffentlicht Spracherkennungsmodell als Open Source

- 06. Mai 2025

NVIDIA, bekannt vor allem als Hardwarehersteller, der die für die KI-Beschleunigung so wichtigen GPUs liefert, arbeitet auch an der Software eigener KI-Modelle. Nun hat der Hersteller unter der Bezeichnung Parakeet-TDT-0.6B-v2 ein automatisches Spracherkennungsmodell veröffentlicht, das eine Stunde Audio-Material in einer Sekunde transkribieren können soll.

Vorgängerversionen des Modells kamen bereit im Januar 2024 auf den Markt, das jetzige Modell aber setzt sich an die Spitze des Hugging Face Open ASR Leaderboard mit einer Fehlerrate von nur 6,05 Prozent. Die unter der freien Lizenz Creative Commons CC-BY-4.0 veröffentlichte Software spielt damit in einer Liga mit proprietären Spracherkennungssystemen wie OpenAI’s GPT-4o-transcribe (Fehlerrate 2,46 Prozent für Englisch) oder ElevenLabs Scribe (3,3 Prozent).

Dabei legt es eine enorm hohe Geschwindigkeit an den Tag und kann eine Stunde Audiomaterial in nur einer Sekunde transkribieren. Damit steht es an der Spitze der von Hugging Face geführten Benchmarkliste.

Das Modell, das seit dem 1. Mai global verfügbar ist, zielt auf Forscher und Entwickler von Sprache-zu-Text-Systemen. Es unterstützt Interpunktion, Großschreibung und detaillierte Zeitstempel auf Wortebene und bietet damit ein komplettes Transkriptionspaket für eine breite Palette von Sprache-zu-Text-Anforderungen. Die Lizenz erlaubt auch kommerzielle Anwendungen.

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung