LLM

News

Eine neue Studie von Google und dem University College London untersucht, warum große Sprachmodelle einerseits felsenfest von einer einmal gefundenen Antwort überzeugt sind, sich dann aber sehr leicht durch ein Gegenargument verunsichern lassen, auch wenn das falsch ist.

News

Die Forscher verschiedener führender Institute, darunter der Shanghai Jiao Tong University oder des Institute for Advanced Algorithms Research, Shanghai, konstatieren, dass das Fehlen einer gut organisierten Speicherverwaltung, eines Gedächtnisses der KI, heutige Systeme daran hindere,...

News

Ein Sprachmodell unterstützt Programmierer besser, ein anderes ist ein Mathe-Ass, ein drittes läuft beim kreativen Schreiben zur Hochform auf - jedes hat seine Stärken und Schwächen. Forscher des japanischen Unternehmens Sakana AI wollen aus diesem Umstand nun einen Vorteil ziehen, indem sie mit...

News

Themis AI, eine Ausgründung aus dem MIT, hat Software entwickelt, die es beliebigen Sprachmodellen ermöglichen soll, zu erkennen, was sie nicht wissen oder wo sie zumindest unsicher sind. Das ist wichtig, weil LLMs dazu tendieren, auf jeden Fall eine Antwort zu generieren, egal ob sie über die...

News

Wissenschaftler der Princeton Universität und von Google DeepMind haben nun in einem Forschungsbericht  gezeigt, warum sich viele Sprachmodelle dazu bringen lassen, gefährliche Inhalte zu generieren: Ihre Sicherheitschecks beziehen sich nur auf die ersten paar Ausgabe-Token. Der Bericht wurde im...

News

Das französische KI-Unternehmen Mistral AI hat ein neues Sprachmodell namens Mistral Small 3.1 vorgestellt, dass mit einem Bruchteil an Parametern (24 Milliarden) die amerikanischen Konkurrenten höherer Gewichtsklassen von Google und OpenAI schlagen soll.

Nach oben