Neue KI-Herausforderung aus China: Qwen-2.5 Max

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

Mit Alibaba hat ein weiterer chinesischer Hersteller ein großes Sprachmodell vorgestellt, das mit allen führenden Modellen (einschließlich DeepSeek) auf Augenhöhe operiert oder sie in Benchmarks übertrifft, dabei aber sehr kostengünstig arbeitet.

Das Modell Qwen-2.5 Max verwendet einen Mixture-of-Experts-Ansatz (MoE), der zeigt, dass eine wettbewerbsfähige KI-Leistung auch ohne massive GPU-Cluster erreicht werden kann. Dadurch sinken die Infrastrukturkosten im Vergleich zu herkömmlichen großen Sprachmodellimplementierungen um 40-60 Prozent. Das Modell aktiviert für jede Aufgabe nur bestimmte Komponenten des neuronalen Netzes, wodurch sich fortschrittliche KI-Funktionen auf bescheideneren Hardwarekonfigurationen ausführen lassen. Dieser Ansatz, bei dem die Effizienz im Vordergrund steht, könnte die KI-Roadmaps von Unternehmen grundlegend umgestalten. Anstatt massiv in die Erweiterung von Rechenzentren und GPU-Clustern zu investieren, könnte in Zukunft die Optimierung der Architektur und die effiziente Bereitstellung von Modellen im Vordergrund stehen. Die starke Leistung des Modells bei der Codegenerierung und bei schlussfolgernden Aufgaben deutet darauf hin, dass es für viele Anwendungsfälle in Unternehmen geeignet ist und dabei deutlich weniger Rechenaufwand erfordert.

Viele Experten nehmen an, dass die leistungsfähigen und dabei sehr viel kostengünstigeren Modelle aus China nicht zufällig in der ersten Amtswoche Trumps vorgestellt werden, untergraben sie doch den amerikanischen Anspruch auf Vorherrschaft auf dem Feld der KI.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben