Stillschweigend hat das Startup Nous Research seinen ChatBot Hermes 4 veröffentlicht, der mit Top-Systemen der oft proprietären Konkurrenz mithalten können soll.
Hermes 4 führt ein, was Nous Research als “hybrides Denken” bezeichnet: Der Benutzer soll sich zwischen schnellen Antworten und tiefergehenden, schrittweisen Denkprozessen entscheiden können. Wenn das tiefere Nachdenken aktiviert ist, stellt das Modell seine internen Überlegungen innerhalb spezieller <think>-Tags vor, bevor sie eine endgültige Antwort gibt. Das ähnelt dem Vorgehen bei den den o1-Modellen von OpenAI, bietet hier aber eine vollständige Transparenz des Denkprozesses.
Die technische Leistung ist beachtlich. In Tests erzielte das größte Modell von Hermes 4 mit 405 Milliarden Parametern 96,3 % beim MATH-500-Benchmark im Argumentationsmodus und 81,9 % beim anspruchsvollen AIME’24-Mathematikwettbewerb – eine Leistung, die mit vielen proprietären Systemen, deren Entwicklung Millionen kostet, konkurriert oder sie sogar übertrifft.
Hinter den Fähigkeiten von Hermes 4 steht eine ausgeklügelte Trainingsinfrastruktur, die Nous Research über mehrere Jahre entwickelt hat. Die Modelle wurden mit zwei neuartigen Systemen trainiert: DataForge, ein graphenbasierter Generator für synthetische Daten, und Atropos, ein Open-Source-Rahmenwerk für verstärkendes Lernen.





