MIT-Forscher lehren KI-Agenten 50mal effizienter

- 22. November 2024

KI-Agenten werden derzeit für eine Vielzahl von Aufgaben entwickelt, bei denen sie selbstständig Entscheidungen treffen sollen.

Ein Beispiel ist die Regelung des Verkehrs in einer Stadt durch Ampelsteuerung und Geschwindigkeitsbegrenzungen. In vielen Fällen erweist es sich aber noch als Problem, wenn die Aufgabe, die der KI-Agent lösen soll, im Detail immer ein wenig von der trainierten Situation abweicht – wenn sich also im Beispiel die Kreuzungen bei der Verkehrsregelung voneinander unterscheiden. In diesem Fall könnte man die Agenten jeweils für eine bestimmte Kreuzung anlernen, aber das wäre sehr aufwändig und datenintensiv. Die Forscher fanden nun einen Mittelweg: Statt jede Aufgabe einzeln zu trainieren, benutzen sie einen Algorithmus für alle Situationen und trainieren davon ausgehend nur diejenigen Abweichungen zusätzlich, die den größten Beitrag zum Lernfortschritt versprechen.

Dafür entwickelten die Forscher den Algorithmus Model-Based Transfer Learning (MBTL). Er besteht aus zwei Teilen: Zum einen wird modelliert, wie gut die einzelnen Algorithmen abschneiden würden, wenn sie unabhängig voneinander für eine Aufgabe trainiert würden. Dann wird modelliert, wie stark sich die Leistung der einzelnen Algorithmen verschlechtern würde, wenn sie auf jede andere Aufgabe übertragen würden, ein Konzept, das als Generalisierungsleistung bekannt ist. Durch die explizite Modellierung der Generalisierungsleistung kann MBTL den Wert des Trainings für eine neue Aufgabe abschätzen. MBTL geht dabei sequentiell vor, indem es zunächst die Aufgabe auswählt, die den höchsten Leistungszuwachs bringt, und dann weitere Aufgaben auswählt, die in der Folge die größten Verbesserungen der Gesamtleistung bringen.

Damit soll sich die Effizienz des Trainings um den Faktor 50 verbessern lassen. Das Training an nur 2 Aufgaben kann damit also genauso gute Ergebnisse bringen wie das herkömmliche Training mit 100 Aufgaben. Ganze 98 der nicht speziell herausgesuchten Aufgaben waren für das Training also unnötig und haben den KI-Agenten eher verwirrt. In der Zukunft planen die Forscher die Entwicklung von MBTL-Algorithmen, die sich auf komplexere Probleme, wie hochdimensionale Aufgabenräume, ausweiten lassen. Sie sind auch daran interessiert, ihren Ansatz auf reale Probleme anzuwenden, insbesondere in Mobilitätssystemen der nächsten Generation

SCHLAGWORTE
KI

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...

Bundestag beschließt Recht auf Reparatur

Das Recht auf Reparatur soll für weniger Elektroschrott sorgen. Ein neuer Paragraf im BGB setzt es in deutsches Recht um.

Preview für GPT-5.6-Modelle startet für handverlesene Kunden

OpenAI startet eine Preview-Phase für seine Modelle ChatGPT-5.6 Sol, Terra und Luna auf Weisung der US-Regierung für speziell ausgesuchte, besonders vertrauenswürdige Kunden.

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung