Neues genügsames Nicht-GPT-LLM von Liquid AI vorgestellt

- 28. April 2025

Liquid AI hat ein besonders ressourcenschonendes Sprachmodell vorgestellt, das im Unterschied zu den meisten anderen LLMs nicht auf der Transformer-Architektur beruht.

Die MIT-Ausgründung Liquid AI beschäftigt sich schon seit längerer Zeit mit KI-Modellen, die bewusst nicht auf die Transformer-Architektur setzen und sich wegen geringerer Inanspruchnahme von Rechenleistung und Speicher für das Edge Computing eignen (wir berichteten). Das nun im Vorfeld der International Conference on Learning Representations (ICLR) 2025 vorgestellte neue Modell namens “Hyena Edge” basiert auf den vor allem aus der Bildverarbeitung bekannten Convolutional Neural Networks (CNN). Unter realistischen Bedingungen erreichte es auf einem Samsung-Smartphone Galaxy S24 Ultra eine geringere Latenz, einen geringeren Speicherverbrauch und bessere Benchmarkergebnisse als etwa gleichgroße Transformer-Modelle.

Die Architektur wurde mit einem von Liquid AI entwickelten Framework (Synthesis of Tailored Architectures, STAR) entworfen. STAR benutzt eine breite Palette von Operator-Kompositionen, die in der mathematischen Theorie spezieller linearer Systeme verwurzelt sind, um mehrere hardwarespezifische Ziele wie Latenz, Speicherverbrauch und Qualität zu optimieren.

Hyena Edge wurde auf 100 Milliarden Token trainiert und mit Standard-Benchmarks für kleine Sprachmodelle evaluiert, darunter Wikitext, Lambada, PiQA, HellaSwag, Winogrande, ARC-easy und ARC-challenge. Dabei war es durchweg ebenso gut oder besser als vergleichbare Transformer-Modelle.

Liquid AI plant, eine Reihe von Liquid-Foundation-Modellen, darunter Hyena Edge, in den kommenden Monaten als Open Source zu veröffentlichen. Das Ziel des Unternehmens ist es, leistungsfähige und effiziente Allzweck-KI-Systeme zu entwickeln, die von Cloud-Rechenzentren bis hin zu persönlichen Endgeräten skaliert werden können.

ELLIS forscht in NRW an Open-Source-KI

Nordrhein-Westfalen wird Standort einer neuen Einheit innerhalb des European Laboratory for Learning and Intelligent Systems (ELLIS), einem der führenden europäischen Netzwerke für KI-Forschung. Die neu genehmigte ELLIS Unit NRW vernetzt führende KI-Forschende und leistungsstarke...

Mastodon 4.6 bringt neue Features

Als Highlight des Updates auf Mastodon 4.6 sehen die Entwickler die Funktion Collections, mit denen Nutzer kuratierte Profilsammlungen erstellen und teilen können.

SFC gibt Empfehlungen für generative KI auf Basis von LLMs

Die Software Freedom Conservancy (SFC) hat Empfehlungen zur Nutzung von LLM-gestützten generativen KI-Systemen für FOSS-Beiträge veröffentlicht. Das Copyleft- und Software-Right-to-Repair-Team der SFC hat diese Richtlinienempfehlungen in Zusammenarbeit mit einem Team von Freiwilligen aus der...

Mozilla gibt Einblick in die Zukunft von Firefox

Mozilla hat eine öffentliche Entwicklungs-Roadmap für den Browser Firefox vorgestellt. Nach Angaben des Projekts soll die Übersicht Nutzern und Entwicklern zeigen, an welchen Funktionen derzeit gearbeitet wird und welche Neuerungen in den kommenden Monaten geplant sind.

Project Myna: Speech-to-Text kommt auf Ubuntu Desktop

Der Gesangvogel Mynah imitiert menschliche Sprache.

Das für Ubuntu 26.10 geplante Diktiertool ist ein wichtiger Schritt für die Barrierefreiheit und nebenbei auch ein nützliches Werkzeug zur Produktivität. Dabei legt Ubuntu besonderen Wert auf Sicherheit und Datenschutz.

Sicherheitslücken: Nginx braucht Updates

Der Webserver Nginx weist zwei kritische Sicherheitslücken auf. Das Unternehmen F5 schließt diese mit Updates.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung