MiroThinker 1.5 performt besser als zigmal größere Modelle

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Das neue Modell MiroThinker 1.5 vom Hersteller MiroMind leistet mit nur 30 Milliarden Parametern mehr als große Foundation-Modelle mit Hunderten Milliarden Parametern.

Damit reiht sich MiroThinker ein in eine Reihe von kleinen, aber leistungsstarken Modellen, hebt sich von diesen aber andererseits auch dadurch ab, dass seine Leistung beim Schlussfolgern die von Mitbewerbern mit bis zu 30-mal mehr Parametern wie DeepSeek oder Kimi K2 übertrifft – und das zu einem Bruchteil der Kosten.

Das neue Modell kommt insbesondere der Entwicklung von Agenten entgegen, bei denen Unternehmen bislang nur die Wahl hatten zwischen teuren API-Calls mit sehr großen Modellen oder Kompromissen bei der Leistungsfähigkeit mit kleineren, lokalen Modellen.

Auch beim Thema Halluzinationen geht MiroThinker neue Wege. Es kennt einen sogenannten “Wissenschaftler-Modus”, in dem es nicht nur die statistisch plausibelste Antwort gibt, sondern eine nachvollziehbare Forschungsschleife durchläuft, mit Hypothesenbildung, externe Quellen nach Belegen abfragen, Unstimmigkeiten identifizieren, Schlussfolgerungen überarbeiten und erneut überprüfen. Während des Trainings wird das Modell ausdrücklich für Ergebnisse mit hoher Konfidenz bestraft, die nicht durch Quellen gestützt werden.

Die praktische Auswirkung für den Einsatz in Unternehmen ist die Überprüfbarkeit. Wenn MiroThinker eine Antwort liefert, kann es sowohl die Argumentationskette als auch die externen Quellen, die es herangezogen hat, offenlegen. Für regulierte Branchen wie Finanzdienstleistungen, Gesundheitswesen und Rechtswesen schafft dies einen Dokumentationspfad, den auf Auswendiglernen basierende Modelle nicht bieten können. Compliance-Teams können nicht nur überprüfen, zu welchem Ergebnis das Modell gekommen ist, sondern auch, wie es zu diesem Ergebnis gelangt ist.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben