Ein Kommentar von Michal Kohútek Ende April 2026 hat Jon Seager, Canonicals VP of Engineering, die Pläne für die kommenden Ubuntu-Releases vorgestellt, darunter auch zusätzliche KI-Funktionen und entsprechende Schnittstellen . Verständlicherweise fielen die Reaktionen der Community wie üblich...
LLM
Das amerikanische Start-up Inception mit Sitz in Palo Alto hat mit Mercury 2 ein superschnelles Reasoning-Modell vorgestellt, das über 1000 Token in der Sekunde verarbeiten kann.
Während multimodale LLMs heute Textaufgaben auf Doktorandenniveau lösen können, versagen sie bei visuellen Aufgaben, die Kleinkinder im Alter von drei bis fünf Jahren beherrschen.
Mit Open Responses gibt es nun erstmals einen Vorschlag für einen Open-Source-Standard für ein herstellerunabhängiges JSON-API, über das Clients mit LLMs kommunizieren können.
Europa will und muss auch in Sachen KI souveräner werden und plant ein eigenes LLM zu entwickeln. An die amerikanische Konkurrenz wird es aber nicht heranreichen.
Agentische LLM-Systeme stellen besondere Herausforderungen an die Sicherheit. Insbesondere besteht das Risiko, dass ein Angriff über versteckte Anweisungen erfolgt und das LLM dadurch sensible Daten weitergibt. Es gilt, dieses Risiko durch explizite Maßnahmen zu mindern.
Clem Delangue, der Mitbegründer und CEO von Hugging Face, der bekannten Plattform für KI-Modelle, sieht die Gefahr, dass bereits im nächsten Jahr eine Blase platzt. Aber er glaubt, dass das keine allgemeine KI-Blase sei, sondern eine der LLMs, erklärte er auf einer Veranstaltung der...
Große Sprachmodelle (LLMs) sind leistungsstark, aber statisch - ihnen fehlten bislang Mechanismen, um ihre Gewichte an neue Aufgaben, Kenntnisse oder Beispiele anzupassen. Forscher des MIT haben nun das selbstanpassende LLM (Self-Adapting LLM, SEAL) vorgestellt, ein Framework, das es LLMs...
Das 2022 gegründete chinesische KI-Startup MiniMax sorgt mit seinem Modell M2 für Aufsehen, das sich auf Anhieb unter die Top-5 aller Sprachmodelle einreiht und nur 8 Prozent dessen kosten soll, was für Claude Sonnet von Anthropic veranschlagt wird, aber doppelt so schnell sein soll.
Anthropic hat sein neues Sprachmodell Claude Haiku 4.5 vorgestellt. Es soll eine ähnliche Coding-Performance wie das Spitzenmodell Claude Sonnet 4 aufweisen, aber nur ein Drittel kosten und doppelt so schnell sein.
Mehr als ein Viertel aller kann sich eine Freundschaft mit einer KI vorstellen und bei den 16 - 29-Jährigen würde sogar mehr als die Hälfte bei bestimmten Themen lieber mit einer KI sprechen als mit Freunden und Bekannten. Das ergab eine Telefonumfrage von Bitkom Research unter mehr als 1000...
Eine neue, von Huawei entwickelte und unter Apache-2.0-Lizenz veröffentlichte Kompressionsmethode macht es möglich, dass große Sprachmodelle auf deutlich kleineren und billigeren Rechnern laufen.
Die EPFL (École polytechnique fédérale de Lausanne), die ETH Zürich und das Schweizerische Supercomputing-Zentrum CSCS haben ein von ihnen entwickeltes Sprachmodell namens Apertus vorgestellt.
Forscher der University of California San Diego und von Meta haben in einem Papier eine neue Methode vorgestellt, um schlussfolgernde Sprachmodelle so zu optimieren, dass sie bessere Antworten mit weniger Rechenpower generieren.
Forscher von Apple haben herausgefunden, dass einzelne unter den Milliarden Parametern eines LLM, sogenannte Super Weights, die Sprachfähigkeit des Modells entscheidend beeinflussen oder sogar zerstören können.



