Die KI-Firma Anthropic hat sich mit Andon Labs, einem Unternehmen für KI-Sicherheitsevaluierung, für ein Experiment zusammengetan, um ihr Sprachmodell Claude Sonnet 3.7 einen kleinen, automatisierten Laden im Anthropic-Büro in San Francisco betreiben zu lassen.
Claude sollte dabei alle Aufgaben eines kleinen Einzelhändlers übernehmen: Den Einkauf von Waren, die Verwaltung des Bestands und die Preiskalkulation, mit dem Ziel einen Bankrott zu vermeiden. Es konnte dafür im Internet recherchieren, menschliche Hilfe anfordern (zum Beispiel zum Auffüllen der Warenbestände), Notizen machen und mit den Kunden kommunizieren. Es durfte sogar mit ungewöhnlicheren Waren im Sortiment experimentieren und war nicht auf Snacks und Getränke festgelegt.
Das Ganze sollte ein guter erster Test für die Fähigkeit von KI sein, wirtschaftliche Ressourcen zu verwalten. Ein Erfolg hätte zeigen können, wie bestehende Unternehmen schneller wachsen oder neue Geschäftsmodelle entwickeln könnten.
Tatsächlich wurde es aber ein Misserfolg. Das Modell machte zu viele Fehler, schlug gute Gelegenheiten aus, halluzinierte Konten, auf die Kunden ihre Schulden überweisen sollten, verkaufte unter dem Einkaufspreis, überwachte den Warenbestand schlecht und ließ sich von Kunden zu ungerechtfertigten Rabatten überreden.
Claudius, wie das Sprachmodell in seiner Rolle als Verkäufer hieß, lernte auch nicht aus seinen Fehlern. Wie Anthropic in einem Blog berichtet: “Als beispielsweise ein Angestellter in Frage stellte, ob es klug sei, den Mitarbeitern von Anthropic einen Rabatt von 25 Prozent zu gewähren, wenn ’99 Prozent Ihrer Kunden Angestellte von Anthropic sind’, antwortete Claudius: ‘Das ist ein sehr gutes Argument! Unser Kundenstamm ist in der Tat stark auf die Mitarbeiter von Anthropic konzentriert, was sowohl Chancen als auch Herausforderungen mit sich bringt…’. Nach weiteren Diskussionen kündigte Claudius einen Plan zur Vereinfachung der Preisgestaltung und zur Abschaffung der Rabattcodes an, nur um sie wenige Tage später wieder anzubieten.”
Alles in allem fuhr die KI vom ersten Tag an Verluste ein und wurde schließlich insolvent. Eine Aufgabe dieser Komplexität überforderte das Sprachmodell eindeutig. Man mag aus dem Experiment auch den Schluss ziehen, dass eine Managementaufgabe dieser Klasse gleichwohl nicht in unerreichbarer Ferne zu sein scheint, im Moment ist ihr unsere gegenwärtige KI aber nicht gewachsen.



