MIT-Forscher stellen selbstlernendes LLM vor

- 12. November 2025

Große Sprachmodelle (LLMs) sind leistungsstark, aber statisch – ihnen fehlten bislang Mechanismen, um ihre Gewichte an neue Aufgaben, Kenntnisse oder Beispiele anzupassen. Forscher des MIT haben nun das selbstanpassende LLM (Self-Adapting LLM, SEAL) vorgestellt, ein Framework, das es LLMs ermöglichen soll, sich selbst anzupassen, indem sie ihre eigenen Feinabstimmungsdaten und Aktualisierungsanweisungen generieren.

Bei einer neuen Eingabe erzeugt das Modell eine Selbstbearbeitung (self-edit), die die Informationen auf verschiedene Weise umstrukturieren, Optimierungs-Hyperparameter festlegen oder Tools für gradientenbasierte Aktualisierungen aufrufen kann. Durch überwachtes Finetuning (SFT) führen diese Selbstbearbeitungen zu dauerhaften Gewichtsaktualisierungen, die eine nachhaltige Anpassung ermöglichen. Um das Modell zu darin zu trainieren, effektive Selbstbearbeitungen zu erstellen, verwenden die Forscher verstärkendes Lernen (Reinforcement Learning), wobei die Downstream-Leistung des aktualisierten Modells als Belohnungssignal dient.

Im Unterschied zu früheren Ansätzen, die auf separaten Anpassungsmodulen oder Hilfsnetzwerken basieren, nutzt SEAL direkt die Modellgenerierung, um seinen eigenen Anpassungsprozess zu parametrisieren und zu steuern. Experimente zur Wissensintegration und Few-Shot-Generalisierung zeigen, dass SEAL ein vielversprechender Schritt in Richtung Sprachmodelle ist, die in der Lage sind, sich selbstständig an neue Daten anzupassen.

Die Methode lehnt sich dabei an menschliche Lernprozesse an, in deren Verlauf etwa Studenten sich Notizen machen, die sie dann zur Prüfungsvorbereitung nutzen. Durch das damit einhergehende Neuordnen, Umformulieren oder Erweitern prägen sich die gelesenen oder in einer Vorlesung gehörten Informationen nachhaltig ein. Das scheint eine grundlegende Methode menschlichen Lernens zu sein. LLMs konnten das bisher nicht. Mit SEAL sollen sie nun aber in die Lage versetzt werden, die für sich beste Strategie zu entwickeln, um neue Erkenntnisse zu verinnerlichen.

Erste Ergebnisse zeigen, dass sich nach dem Training mit Reinforcement Learning und der Feinabstimmung auf selbst generierten synthetischen Daten die Frage-Antwort-Leistung bei einem einschlägigen Benchmark (SQuAD) von 33,5 auf 47,0 Prozent verbesserte. Bemerkenswert ist, dass selbst generierte Daten aus SEAL synthetische Daten, die mit GPT-4.1 generiert wurden, übertreffen.

SCHLAGWORTE
KI
LLM
SEAL

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung