TikTok-Mutter ByteDance veröffentlicht Open-Source-LLM

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Der TikTok-Mutterkonzern ByteDance hat mit Seed-OSS-36B ein weiteres chinesisches LLM als Open Source veröffentlicht. Es erschien unter der Apache-2.0-Lizenz.

Seed-OSS-36B ist ein Sprachmodell mit einem besonders großen Kontext von 512K, kann also besonders viele Informationen als Input akzeptieren. Es soll sich für allgemeine wie schlussfolgernde und agentische Anwendungen eignen und auch entwicklerfreundlich sein. Besonders ist die Möglichkeit, den Grad des “Nachdenkens” flexibel und dynamisch einstellen zu können, was der Effizienz des Modells zugute kommt. Auch soll es für Aufgaben, die Schlussfolgerungen erfordern, besonders optimiert sein. In veröffentlichten Benchmarks liegt das neue Modell beständig vor chinesischen Konkurrenzmodellen der Qwen-Serie von Alibaba Cloud, die ebenfalls quelloffen sind.

Das neue Modell wird in Varianten angeboten, die wahlweise mit oder ohne synthetische Daten trainiert wurden. Das mit synthetischen Daten trainierte Modell schneidet in den Standardbenchmarks etwas besser ab, es unterliegt dafür aber auch in höherem Maß der Gefahr von Verzerrungen (Bias). Eine dritte Modellvariante, Seed-OSS-36B-Instruct, unterscheidet sich dadurch, dass sie so nachtrainiert wurde, um Priorität auf die Ausführung von Aufgaben und die Befolgung von Instruktionen zu setzen.

Die Nutzung des Modells und seiner API ist für alle (auch kommerzielle) Zwecke kostenlos. Damit findet sich das neue Modell in einer Reihe chinesischer LLMs, die alle unter Open-Source-Lizenzen angeboten werden.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben