Metas neuer KI-Übersetzer versteht 100 Sprachen

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Der Tech-Riese Meta hat mit SEAMLESSM4T ein neues KI-Modell vorgestellt, dass gesprochene Worte in 101 Sprachen übersetzen kann.

Während herkömmliche Übersetzungsprogramme das gesprochene Wort zunächst in Text umwandeln, den Text übersetzen und dann daraus mit einem Sprachsynthesizer wieder gesprochene Worte produzieren, kann das neue Modell gesprochene Sprache auch direkt übersetzen. Dabei kann es aus 101 Sprachen in 36 andere übersetzen. Die Genauigkeit der Übersetzung soll dabei um 23 Prozent höher sein, als bei bisherigen Top-Modellen.

Ein Problem bei der Entwicklung waren die Trainingsdaten, weil umfangreiche Beispielsammlungen (Korpusse) eher für die Sprachen der hoch entwickelten Länder existieren und für Sprachen, die eher in Entwicklungsländern gesprochen werden, nicht existieren. Hier behalf man sich mit einer Technik, die als Parallel Data Mining bezeichnet wird, und die auf Audio-Ressourcen mit Untertiteln in einer anderen Sprache zurückgreift. Es wurden rund 443 000 Stunden Audiomaterial mit passendem Text gesammelt, woraus sich etwa 30 000 ausgerichtete Sprach-Text-Paare ergaben. SEAMLESSM4T besteht aus drei verschiedenen Blöcken, von denen einige Text- und Spracheingaben und andere Ausgaben verarbeiten. Der Übersetzungsteil der KI wurde anhand eines riesigen Datensatzes mit 4,5 Millionen Stunden gesprochenem Audio in mehreren Sprachen vorab trainiert. Die KI lernte, allgemeine Strukturen in der Sprache unabhängig von der Sprache zu erkennen, und legte damit eine Grundlage, die es später einfacher machte, ressourcenarme Sprachen zu übersetzen. Die KI wurde dann anhand der Sprachpaare trainiert und anhand anderer Übersetzungsmodelle bewertet.

Meta unterstützt zunehmend Open Source. In der Vergangenheit hat es beispielsweise die bekannte Bibliothek PyTorch freigegeben. Auch von SEAMLESSM4T sollen alle Daten und der Code, der zur Entwicklung der KI verwendet wurde, der Öffentlichkeit zur nichtkommerziellen Nutzung zur Verfügung gestellt werden, damit andere ihn optimieren und darauf aufbauen können.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben