OpenAI veröffentlicht zwei neue Open-Source-LLMs

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

OpenAI hat zwei neue Open-Source-Sprachmodelle veröffentlicht: gpt-oss-120b und gpt-oss-20b.

Das größere Modell, mit 120 Milliarden Parametern, wie aus dem Namen zu ersehen ist, kann auf einer einzelnen Nvidia H100 GPU laufen, das kleinere eignet sich auch für den Einsatz auf normalen Laptops oder Desktop-PCs. Beides sind reine Sprachmodelle, sie können also nicht wie momentan moderne multimodale Modelle auch mit Bildern umgehen. Beide Modelle sind quelloffen und können kostenlos eingesetzt und von Entwicklern an eigene Bedürfnisse angepasst werden.

Das Modell gpt-oss-120b soll das frühere proprietäre o4-mini-Modell beim Schlussfolgern und in der Werkzeugnutzung übertreffen. Das kleinere Modell ist mit o3-mini vergleichbar und schlägt es ebenfalls in einigen Disziplinen. Beide Modelle sind mehrsprachig, wobei eine Feinabstimmung auf die Landessprache – wie sie derzeit beispielsweise in Zusammenarbeit mit der schwedischen Regierung erstellt wird – ihre Leistung noch verbessern kann.

Beide Modelle stehen unter der Apache 2.0-Lizenz, unter der in letzter Zeit auch chinesische Modelle veröffentlicht wurden. Die Lizenz ist freier als etwa Metas Llama-Lizenz, die verlangt, dass für einen Einsatz mit mehr als 700 Millionen monatlich aktiven Usern eine neue Lizenz gekauft werden muss.

Die freie Verfügbarkeit macht es möglich, ein Top-Modell auf eigener Hardware laufen zu lassen, ohne irgendwelche Daten in eine Cloud hochladen zu müssen. Für stark regulierte Branchen wie das Finanzwesen, das Gesundheitswesen und juristische Dienstleistungen, ganz zu schweigen von Organisationen in den Bereichen Militär, Geheimdienste und Regierung, kann dies eine Voraussetzung sein.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben