LLM Archive - Seite 2 von 4

News

19. November 2025

Clem Delangue, der Mitbegründer und CEO von Hugging Face, der bekannten Plattform für KI-Modelle, sieht die Gefahr, dass bereits im nächsten Jahr eine Blase platzt. Aber er glaubt, dass das keine allgemeine KI-Blase sei, sondern eine der LLMs, erklärte er auf einer Veranstaltung der...

Blase, Hugging Face, KI, LLM

News

12. November 2025

Große Sprachmodelle (LLMs) sind leistungsstark, aber statisch - ihnen fehlten bislang Mechanismen, um ihre Gewichte an neue Aufgaben, Kenntnisse oder Beispiele anzupassen. Forscher des MIT haben nun das selbstanpassende LLM (Self-Adapting LLM, SEAL) vorgestellt, ein Framework, das es LLMs...

KI, LLM, SEAL

News

28. Oktober 2025

Das 2022 gegründete chinesische KI-Startup MiniMax sorgt mit seinem Modell M2 für Aufsehen, das sich auf Anhieb unter die Top-5 aller Sprachmodelle einreiht und nur 8 Prozent dessen kosten soll, was für Claude Sonnet von Anthropic veranschlagt wird, aber doppelt so schnell sein soll.

KI, LLM, Minimax

News

17. Oktober 2025

Anthropic hat sein neues Sprachmodell Claude Haiku 4.5 vorgestellt. Es soll eine ähnliche Coding-Performance wie das Spitzenmodell Claude Sonnet 4 aufweisen, aber nur ein Drittel kosten und doppelt so schnell sein.

Anthropic, Haiku 4.5, KI, LLM

News

10. Oktober 2025

Mehr als ein Viertel aller kann sich eine Freundschaft mit einer KI vorstellen und bei den 16 - 29-Jährigen würde sogar mehr als die Hälfte bei bestimmten Themen lieber mit einer KI sprechen als mit Freunden und Bekannten. Das ergab eine Telefonumfrage von Bitkom Research unter mehr als 1000...

Beziehungen, KI, LLM

News

06. Oktober 2025

Eine neue, von Huawei entwickelte und unter Apache-2.0-Lizenz veröffentlichte Kompressionsmethode macht es möglich, dass große Sprachmodelle auf deutlich kleineren und billigeren Rechnern laufen.

KI, Kompression, LLM

News

04. September 2025

Die EPFL (École polytechnique fédérale de Lausanne), die ETH Zürich und das Schweizerische Supercomputing-Zentrum CSCS haben ein von ihnen entwickeltes Sprachmodell namens Apertus vorgestellt.

Apertus, KI, LLM, Schweiz

News

04. September 2025

Forscher der University of California San Diego und von Meta haben in einem Papier eine neue Methode vorgestellt, um schlussfolgernde Sprachmodelle so zu optimieren, dass sie bessere Antworten mit weniger Rechenpower generieren.

KI, LLM, Optimierung

News

26. August 2025

Forscher von Apple haben herausgefunden, dass einzelne unter den Milliarden Parametern eines LLM, sogenannte Super Weights, die Sprachfähigkeit des Modells entscheidend beeinflussen oder sogar zerstören können.

KI, Kompression, LLM, Super Weight

News

21. August 2025

Der TikTok-Mutterkonzern ByteDance hat mit Seed-OSS-36B ein weiteres chinesisches LLM als Open Source veröffentlicht. Es erschien unter der Apache-2.0-Lizenz.

China, KI, LLM, Open Source

News

17. Juli 2025

Eine neue Studie von Google und dem University College London untersucht, warum große Sprachmodelle einerseits felsenfest von einer einmal gefundenen Antwort überzeugt sind, sich dann aber sehr leicht durch ein Gegenargument verunsichern lassen, auch wenn das falsch ist.

KI, LLM

News

09. Juli 2025

Die Forscher verschiedener führender Institute, darunter der Shanghai Jiao Tong University oder des Institute for Advanced Algorithms Research, Shanghai, konstatieren, dass das Fehlen einer gut organisierten Speicherverwaltung, eines Gedächtnisses der KI, heutige Systeme daran hindere,...

Gedächtnis, KI, LLM, Memory

News

04. Juli 2025

Ein Sprachmodell unterstützt Programmierer besser, ein anderes ist ein Mathe-Ass, ein drittes läuft beim kreativen Schreiben zur Hochform auf - jedes hat seine Stärken und Schwächen. Forscher des japanischen Unternehmens Sakana AI wollen aus diesem Umstand nun einen Vorteil ziehen, indem sie mit...

KI, Kooperation, LLM

News

17. Juni 2025

Das chinesische Startup MiniMax, bekannt vor allem durch seinen KI-Videogenerator Hailuo, hat nun mit MiniMax-M1 ein großes Sprachmodell unter der Apache-2-Lizenz veröffentlicht, das über ein Kontextfenster von 1 Million Input-Tokens und bis zu 80 000 Output-Tokens verfügt.

KI, Kontextfenster, LLM, Minimax

News

10. Juni 2025

Im Vorfeld seiner Entwicklerkonferenz WWDC veröffentliche Apple eine Studie unter dem Titel "The Illusion of Thinking", die prinzipielle Zweifel an der "Denkfähigkeit" moderner Reasoning Modelle begründet.

KI, LLM, LRM, Reasoning

Hugging Face CEO: KI-Blase ist eine LLM-Blase

MIT-Forscher stellen selbstlernendes LLM vor

Neues Open-Source-KI-Modell aus China sorgt für Aufsehen

Anthropic stelle neues kostengünstiges Sprachmodell Haiku 4.5 vor

Rund die Hälfte der Jugendlichen würde bei bestimmten Themen am liebsten mit einer KI sprechen

Neue Kompressionsmethode bringt LLMs auf billigere Hardware

Schweiz stellt eigenes, vollkommen offenes LLM vor

Mit weniger Aufwand zu besseren Antworten

Einzelne Parameter können ein LLM zerstören

TikTok-Mutter ByteDance veröffentlicht Open-Source-LLM

Warum LLMs zwischen Zweifel und Selbstvertrauen schwanken können

Chinesische Forscher schlagen Memory-OS für KI vor

Verschiedene LLMs bilden Teams - eine Idee aus Japan

Neues Open-Source-LLM aus China mit sehr großem Kontextfenster

Apple-Studie: Reasoning Modelle doch dümmer als geglaubt

LMP004 Von Nebraska nach Brüssel