Claude scheitert als Verkäufer

- 30. Juni 2025

Die KI-Firma Anthropic hat sich mit Andon Labs, einem Unternehmen für KI-Sicherheitsevaluierung, für ein Experiment zusammengetan, um ihr Sprachmodell Claude Sonnet 3.7 einen kleinen, automatisierten Laden im Anthropic-Büro in San Francisco betreiben zu lassen.

Claude sollte dabei alle Aufgaben eines kleinen Einzelhändlers übernehmen: Den Einkauf von Waren, die Verwaltung des Bestands und die Preiskalkulation, mit dem Ziel einen Bankrott zu vermeiden. Es konnte dafür im Internet recherchieren, menschliche Hilfe anfordern (zum Beispiel zum Auffüllen der Warenbestände), Notizen machen und mit den Kunden kommunizieren. Es durfte sogar mit ungewöhnlicheren Waren im Sortiment experimentieren und war nicht auf Snacks und Getränke festgelegt.

Das Ganze sollte ein guter erster Test für die Fähigkeit von KI sein, wirtschaftliche Ressourcen zu verwalten. Ein Erfolg hätte zeigen können, wie bestehende Unternehmen schneller wachsen oder neue Geschäftsmodelle entwickeln könnten.

Tatsächlich wurde es aber ein Misserfolg. Das Modell machte zu viele Fehler, schlug gute Gelegenheiten aus, halluzinierte Konten, auf die Kunden ihre Schulden überweisen sollten, verkaufte unter dem Einkaufspreis, überwachte den Warenbestand schlecht und ließ sich von Kunden zu ungerechtfertigten Rabatten überreden.

Claudius, wie das Sprachmodell in seiner Rolle als Verkäufer hieß, lernte auch nicht aus seinen Fehlern. Wie Anthropic in einem Blog berichtet: “Als beispielsweise ein Angestellter in Frage stellte, ob es klug sei, den Mitarbeitern von Anthropic einen Rabatt von 25 Prozent zu gewähren, wenn ’99 Prozent Ihrer Kunden Angestellte von Anthropic sind’, antwortete Claudius: ‘Das ist ein sehr gutes Argument! Unser Kundenstamm ist in der Tat stark auf die Mitarbeiter von Anthropic konzentriert, was sowohl Chancen als auch Herausforderungen mit sich bringt…’. Nach weiteren Diskussionen kündigte Claudius einen Plan zur Vereinfachung der Preisgestaltung und zur Abschaffung der Rabattcodes an, nur um sie wenige Tage später wieder anzubieten.”

Alles in allem fuhr die KI vom ersten Tag an Verluste ein und wurde schließlich insolvent. Eine Aufgabe dieser Komplexität überforderte das Sprachmodell eindeutig. Man mag aus dem Experiment auch den Schluss ziehen, dass eine Managementaufgabe dieser Klasse gleichwohl nicht in unerreichbarer Ferne zu sein scheint, im Moment ist ihr unsere gegenwärtige KI aber nicht gewachsen.

SCHLAGWORTE
Anthropic
Claude
KI

"Half a Second": Kostenloses E-Book arbeitet XZ-Backdoor auf

Eine Backdoor im kleinen Kompressionsprogramm XZ sorgte 2024 für ein großes weltweites Sicherheitsproblem und stieß eine Diskussion um überlastete Maintainer an. Den kompletten Vorfall arbeitet jetzt Adrian Mastronardi penibel in seinem kostenlosen E-Book auf.

Weltklassemodell aus China vorgestellt

Das chinesische Start-up Moonshot hat mit Kimi K3 ein neues Modell mit 2,8 Billionen Parametern vorgestellt, das auch in unabhängigen Tests mit den besten Modellen von OpenAI oder Anthropic mithalten kann. Damit schließt das Modell die Lücke, die bisher noch zwischen den amerikanischen...

Forgejo 16.0 ist da

Die neue Version 16.0 des leichtgewichtigen Tools für Code-Hosting und -Kollaboration ist am 16. Juli 2026 erschienen.

Klarstellung: Linus Torvalds erlaubt KI bei Kernel-Entwicklung

Der Einsatz von Künstlicher Intelligenz ist bei der Kernel-Entwicklung explizit erlaubt – das Linus Torvalds im Rahmen einer Diskussion noch einmal klargestellt. Für KI-Kritiker findet er darin zudem drastische Worte.

frame: vollständig in Assembler geschriebener X-Server

Der Norweger Geir Isene hat einen X-Server komplett in Assembler geschrieben. Der soll nicht nur deutlich ressourcenschonender arbeiten als das Pendant von X.org, er besteht derzeit auch nur aus rund 20.000 Zeilen Code. Es gibt aber auch ein paar Haken.

OpenShift 4.22 bringt Updates für Sicherheit, Virtualisierung und KI

Red Hat hat die Version 4.22 seiner Plattform OpenShift veröffentlicht. Das Update bringt Neuerungen für die Sicherheit, die Verwaltung virtueller Maschinen, die Automatisierung von Cloud-Infrastrukturen und den Betrieb von Anwendungen mit Künstlicher Intelligenz.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Was ist die beliebteste Linux-Distro? Zum Einstieg nehmen wir das DistroWatch-Ranking auseinander und erklären, warum Seitenaufrufe keine Popularität messen. Im Hauptthema geht es um Open Source Funding: Wie im XKCD 2347 ruht unsere digitale Infrastruktur auf Komponenten, die oft von Einzelnen...