Anthropic bezichtigt die chinesischen Konkurrenten DeepSeek, Moonshot und MiniMax in 16 Millionen Anfragen an sein Spitzenmodell Claude, die von rund 24 000 Fake-Accounts ausgingen, Fähigkeiten extrahiert zu haben, mit denen deren eigene Modelle verbessert wurden.
SWE-bench Verified war lange ein führender KI-Benchmark, der die Leistung der Modelle beim autonomen Programmieren messen sollte. Nun erklärt Anthropic den Benchmark für nicht länger verwendbar und empfiehlt stattdessen SWE-bench Pro.
Nvidias NeMo Framework ist eine Plattform zum Entwickeln, Orchestrieren und Betreiben von KI-Modellen und Agenten, während Megatron Bridge Werkzeuge und Bausteine fürs Training großer Sprachmodelle bereitstellt. Wer mit einem der beiden Tools arbeitet, sollte die Anwendungen möglichst schnell...
Bislang galt als ausgemacht, dass die immensen Investitionen in KI-Infrastruktur ein Wachstumsmotor für die amerikanische Wirtschaft seien. Aber eine wachsende Anzahl prominenter Beobachter, meinen nun, dieser Effekt sei überschätzt. Joseph Briggs, Leiter der Wirtschafts- und Anlageforschung bei...
Einerseits senkt das Vibe Coding die Eintrittsschwelle und ermöglicht auch weniger erfahrenen Entwicklern die Mitarbeit, andererseits wächst der Aufwand in der Qualitätskontrolle und beim Betreuen der Software.
Das Wettrennen um die Spitzenplätze in den Benchmark-Ranglisten, wo sich in kurzer Folge die Modelle ablösen, geht weiter: Nun behauptet Gemini 3.1 Pro in vielen Charts den ersten Platz.
OpenClaw ist ein Open-Source-System, das KI-Agenten direkten Zugriff auf Betriebssystemfunktionen gewährt, um Aufgaben weitgehend autonom auszuführen. Dazu zählt etwa das eigenständige Installieren zusätzlicher Software oder das Bedienen externer Anwendungen wie Mail-Programme. Weil die...
Das neueste Update von xAIs Sprachmodell Grok enthält 16 spezialisierte Untermodelle mit menschlichen Vornamen, die sich jeweils Fragen aus einem ganz bestimmten Fachgebiet annehmen. Eine Grok genannte Instanz koordiniert die einzelnen Submodelle und führt ihre Ausgaben in einer Antwort zusammen.
Google hat eine Erweiterung der Gemini-App veröffentlicht, die mit Hilfe des generativen Modells Lyra 3 Musik komponieren kann.
Die deutsche Wikipedia hat eine Regelung beschlossen, derzufolge alle enzyklopädischen Texte ausschließlich von menschlichen Autoren stammen müssen, von LLMs erzeugte Texte sind ausdrücklich verboten.
Anthropic hat sein Modell Claude Sonnet auf die Version 4.6 upgedatet. Das ist nun für alle Nutzer der Free- und Pro-Abos das Standardmosell in Claude.ai und Cowork. Es bringt verbesserte Fähigkeiten in den Bereichen Programmierung, Computernutzung, langfristiges Denken, Agentenplanung,...
Nachdem Amazon am 5. Februar angekündigt hatte, in diesem Jahr 200 Milliarden Dollar in KI investieren zu wollen, wurden die Anlieger nervös. Der Börsenkurs fiel neun Tage hintereinander um über 18 Prozent, was einem Verlust an Börsenwert von rund 450 Milliarden Dollar entspricht.
Micron ist nach eigener Aussage der erste Hersteller der Welt, der mit der Micron 9650 eine SSD der 6ten PCIe-Generation in Massenproduktion herstellt.
Einem hybriden Angriff, etwa durch gezielte Sabotage der Infrastruktur oder durch Ransomware, könnten deutsche Unternehmen im Schnitt nur 20 Stunden standhalten.
Der KI-Agent OpenClaw hat in den letzten Wochen hohe Wellen geschlagen - wegen seiner Fähigkeiten, aber auch wegen zunehmender Sicherheitsbedenken. Nun hat sich OpenAI die Mitarbeit seines Entwicklers Peter Steinberger gesichert.

