Meta veröffentlicht selbstlernende Spracherkennung für Tausende Sprachen

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Meta hat mit Omnilingual ASR ein Spracherkennungssystem (Automatic Speech Recognition, ASR) veröffentlicht, das mehr als 1600 Sprachen erkennt. Das Konkurrenzsystem Whisper von OpenAI schafft nur 99.

Seine Architektur soll es erlauben, weitere Tausende Sprachen einfach hinzuzufügen, so dass es theoretisch eine Kapazität von 5400 Sprachen erreichen könnte und damit jede existierende Sprache mit einer Schriftform erkennen könnte. Dank eines Features namens ‘Zero-Shot In-Context Learning’ soll es reichen, dem Modell lediglich einige Beispiele als Audiodatei und Text zu übergeben, wonach es dann Texte in dieser neuen Sprache transkribieren können soll.

Neu ist auch, dass Meta dieses Modell unter einer echten Open-Source-Lizenz (Apache 2.0) veröffentlicht, wodurch es Wissenschaftlern und Entwicklern kostenfrei zur Verfügung steht. Es wird nun zusammen mit einem Demo-Bereich auf Hugging Face und einem technischen Dokument angeboten. Die Veröffentlichung umfasst eine Reihe von Spracherkennungsmodellen, ein mehrsprachiges Audio-Repräsentationsmodell mit 7 Milliarden Parametern und einen riesigen Sprachkorpus, der über 350 bisher unterversorgte Sprachen umfasst.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben