Neues Open-Source-LLM spielt in der Oberliga

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Stillschweigend hat das Startup Nous Research seinen ChatBot Hermes 4  veröffentlicht, der mit Top-Systemen der oft proprietären Konkurrenz mithalten können soll.

Hermes 4 führt ein, was Nous Research als “hybrides Denken” bezeichnet: Der Benutzer soll sich zwischen schnellen Antworten und tiefergehenden, schrittweisen Denkprozessen entscheiden können. Wenn das tiefere Nachdenken aktiviert ist, stellt das Modell seine internen Überlegungen innerhalb spezieller <think>-Tags vor, bevor sie eine endgültige Antwort gibt. Das ähnelt dem Vorgehen bei den den o1-Modellen von OpenAI, bietet hier aber eine vollständige Transparenz des Denkprozesses.

Die technische Leistung ist beachtlich. In Tests erzielte das größte Modell von Hermes 4 mit 405 Milliarden Parametern 96,3 % beim MATH-500-Benchmark im Argumentationsmodus und 81,9 % beim anspruchsvollen AIME’24-Mathematikwettbewerb – eine Leistung, die mit vielen proprietären Systemen, deren Entwicklung Millionen kostet, konkurriert oder sie sogar übertrifft.

Hinter den Fähigkeiten von Hermes 4 steht eine ausgeklügelte Trainingsinfrastruktur, die Nous Research über mehrere Jahre entwickelt hat. Die Modelle wurden mit zwei neuartigen Systemen trainiert: DataForge, ein graphenbasierter Generator für synthetische Daten, und Atropos, ein Open-Source-Rahmenwerk für verstärkendes Lernen.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben