In den USA ist der erste von der Firma Weave produzierte Heimroboter bestellbar, der mehr oder weniger autonom Wäsche falten kann.
Google hat den Schlussfolgerungsmodus seines Spitzenmodells Gemini 3 mit einem wichtigen Update aufgewertet, dass nach eigener Aussage die Grenzen der künstlichen Intelligenz weiter verschieben soll.
Der ehemalige Chef von Microsofts Entwicklerplattform Github, Thomas Dohmke, plant mit seinem Start-up Entire eine neue Plattform, speziell für die Zusammenarbeit zwischen menschlichen Entwicklern und KI-Agenten.
OpenAI berichtet in einem Blog von einem Projekt, bei dem eine nicht näher bezeichnete komplexe Software für die interne Verwendung ausschließlich von Codex-Agenten programmiert wurde und keine einzige Zeile Code von Menschen beigesteuert wurde.
Ein neuer Benchmark will untersuchen, ob sich KI-Agenten auch dann an Vorgaben halten, wenn sie durch Verstöße leichter ans Ziel kommen können.
Forscher der École Polytechnique Fédérale de Lausanne, des Tübinger ELLIS Institute, des Max-Planck-Instituts für Intelligente Systeme und des Tübinger AI Center haben einen Benchmark entwickelt, der Halluzinationen von Sprachmodellen misst.
Fehler in KI-Benchmarks sind nicht ungewöhnlich, können aber die Bewertungen verzerren. Forscher der Universität Stanford haben nun ein Framework entwickelt, das mit messtheoretischen Methoden falsche Fragen und Antworten in KI-Benchmarks mit einer Genauigkeit von 84 Prozent findet.
Die großen US-Tech-Konzerne haben für dieses Jahr schwindelerregende Investitionen in KI angekündigt. So will Google bis zu 185 Milliarden investieren, Amazon sogar 200 Milliarden. Das Geld fließt vor allem in den Bau neuer Rechenzentren, zu den Hardwareherstellern und zunehmend auch in die...
Die Sicherheitsfirma Virus Total hat Hunderte sogenannte Skills entdeckt, die vorgeben die Fähigkeiten des populären KI-Agenten OpenClaw zu erweitern, tatsächlich aber Malware-Schleudern sind.
Kurz nachdem OpenAI angekündigt hat, für die Nutzer der kostenlosen Zugänge Werbung einzublenden, betont Anthropic, dass man das niemals tun werde.
Mehrere Produkte des Netzwerkausrüsters Cisco, die in Unternehmen für Netzwerkverwaltung, Zusammenarbeit und IT-Sicherheit eingesetzt werden, sind von Sicherheitslücken betroffen. Der Evolved Programmable Network Manager dient zur zentralen Steuerung und Automatisierung komplexer Netzwerke.
Anthropic hat ein Team aus 16 Claude-Opus-4.6-Agenten dazu gebracht, einen C-Compiler in der Programmiersprache Rust zu entwickeln, der am Ende den Linux-Kernel erfolgreich kompilieren konnte.
Anthropic hat sein Spitzenmodell auf die Version 4.6 upgedatet. Es kommt erstmals mit einem Kontextfenster von einer Million Token und verbesssert vor allem die Programmier- und Debuggingfähigkeiten noch weiter.
Im Münchner Tucherpark hat die Telekom eine der größten KI-Fabriken Europas und das größte deutsche KI-Rechenzentrum offiziell in Betrieb genommen.
Das französische KI-start-up Mistral hat mit Voxtral Transcribe 2 zwei neue KI-Modelle für die Übertragung von gesprochener Sprache in Text vorgestellt.

