Neue Sprachmodelle zum Jahresende

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com

In der Zeit vor dem Jahresende stellen einige namhafte KI-Firmen neue Versionen Ihrer Sprachmodelle vor.

So hat Google die neueste, nach eigener Aussage bisher leistungsstärkste Version Gemini 2.0 seines Modells freigegeben. Fortschritte werden bei der Multimodalität vermeldet, also dem Umgang mit Bildern und Audio neben der Sprachverarbeitung. Zudem soll das Modell neue Agenten ermöglichen, die dem Ideal des universellen Assistenten wieder ein Stück näher kommen. Ein neues Feature namens Deep Research soll mit fortgeschrittenem Schlussfolgern und der Fähigkeit umfangreichen Kontext zu verarbeiten, komplexe Sachverhalte ergründen und Berichte darüber verfassen können. Das soll sich auch in den AI Overviews der Google Suche niederschlagen, die es im kommenden Jahr in noch mehr Ländern geben wird. Das Training und der Betrieb von Gemini 2.0 basierten auf den von Google selbst entwickelten Spezial-Proszessor (Tensor Processing Unit, TPU) Trillium, den es nun in sechster Generation gibt.

Auch Anthropic stellt mit Claude 3.5 Haiku zum Jahresende ein neues Sprachmodell vor. Es ist kleiner, schneller, billiger und dennoch auf Augenhöhe mit größeren Modellen. Es verfügt über ein Kontextfenster mit 200 000 Token – mehr als das 128 000-Token-Fenster von OpenAIs GPT-4 und GPT-4o – und kann so auch umfangreiche Eingaben problemlos verarbeiten. Der Claude-Chatbot bringt dank Haiku jetzt Funktionen mit, die seine Vielseitigkeit erhöhen. Benutzer können Bilder und Dateianhänge analysieren, was ihn für Multimedia-Aufgaben und Arbeitsabläufe mit großen Dokumentenmengen nützlich macht. Im Unterschied zu den OpenAI-Modellen GPT-4o und GPT-4, unterstützt es im Moment allerdings kein Web-Browsing und keine Bilderzeugung.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben