Neue KI-Herausforderung aus China: Qwen-2.5 Max

- 29. Januar 2025

Mit Alibaba hat ein weiterer chinesischer Hersteller ein großes Sprachmodell vorgestellt, das mit allen führenden Modellen (einschließlich DeepSeek) auf Augenhöhe operiert oder sie in Benchmarks übertrifft, dabei aber sehr kostengünstig arbeitet.

Das Modell Qwen-2.5 Max verwendet einen Mixture-of-Experts-Ansatz (MoE), der zeigt, dass eine wettbewerbsfähige KI-Leistung auch ohne massive GPU-Cluster erreicht werden kann. Dadurch sinken die Infrastrukturkosten im Vergleich zu herkömmlichen großen Sprachmodellimplementierungen um 40-60 Prozent. Das Modell aktiviert für jede Aufgabe nur bestimmte Komponenten des neuronalen Netzes, wodurch sich fortschrittliche KI-Funktionen auf bescheideneren Hardwarekonfigurationen ausführen lassen. Dieser Ansatz, bei dem die Effizienz im Vordergrund steht, könnte die KI-Roadmaps von Unternehmen grundlegend umgestalten. Anstatt massiv in die Erweiterung von Rechenzentren und GPU-Clustern zu investieren, könnte in Zukunft die Optimierung der Architektur und die effiziente Bereitstellung von Modellen im Vordergrund stehen. Die starke Leistung des Modells bei der Codegenerierung und bei schlussfolgernden Aufgaben deutet darauf hin, dass es für viele Anwendungsfälle in Unternehmen geeignet ist und dabei deutlich weniger Rechenaufwand erfordert.

Viele Experten nehmen an, dass die leistungsfähigen und dabei sehr viel kostengünstigeren Modelle aus China nicht zufällig in der ersten Amtswoche Trumps vorgestellt werden, untergraben sie doch den amerikanischen Anspruch auf Vorherrschaft auf dem Feld der KI.

Project Myna: Speech-to-Text kommt auf Ubuntu Desktop

Der Gesangvogel Mynah imitiert menschliche Sprache.

Das für Ubuntu 26.10 geplante Diktiertool ist ein wichtiger Schritt für die Barrierefreiheit und nebenbei auch ein nützliches Werkzeug zur Produktivität. Dabei legt Ubuntu besonderen Wert auf Sicherheit und Datenschutz.

Sicherheitslücken: Nginx braucht Updates

Der Webserver Nginx weist zwei kritische Sicherheitslücken auf. Das Unternehmen F5 schließt diese mit Updates.

Abgeordnete fordern Aufklärung über Verbot der Anthropic-Modelle

Eine parteiübergreifende Gruppe von Abgeordneten des Repräsentantenhauses fordert von der Trump-Regierung eine Erklärung dafür, warum sie weitreichende Beschränkungen für die neuesten KI-Modelle von Anthropic verhängt hat – und ob konkurrierende Technologieunternehmen mit einer ähnlichen...

Manifest fordert Umkehr in KI-Nutzung

Ein jetzt erschienenes "Tokenminning Manifesto" wendet sich direkt gegen die auch als Tokenmaxxing bekannte Praxis, derzufolge diejenigen als beste Mitarbeiter gelten und belohnt werden, die am meisten KI nutzen.

IDC: Servermarkt wächst stark

Laut dem „Worldwide Quarterly Server Tracker“ des US-Marktforschers IDC erreichte der weltweite Servermarkt im ersten Quartal 2026 einen Herstellerumsatz von 122,6 Milliarden US-Dollar.

IT-Planungsrat legt Grundlagen für Deutschland-Stack fest

Der IT-Planungsrat berichtet über zentrale Beschlüsse seiner 50. Sitzung zur Weiterentwicklung des Deutschland-Stacks. Quelle: FITKO

Der IT-Planungsrat berichtet über zentrale Beschlüsse seiner 50. Sitzung zur Weiterentwicklung des Deutschland-Stacks. Bund und Länder haben sich dabei auf wesentliche Elemente des geplanten digitalen Ökosystems für die öffentliche Verwaltung verständigt.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung