Meta gibt Llama 3.3 frei

- 09. Dezember 2024

Metas Vice President of generative AI, Ahmad Al-Dahle, hat auf X die Verfügbarkeit des neuen Sprachmodells Llama 3.3 bekanntgegeben.

Llama 3.3 ist ein 70B-Modell, verfügt also über 70 Milliarden Parameter, soll aber so leistungsfähig sein wie das 405B-Modell aus gleichem Haus. Damit legt das neue Release den Schwerpunkt auf Effizienz und Kostenersparnis. Während Llama 3.3 in diversen Benchmarks auf Augenhöhe mit GPT-4o operiert, liegt es bei den Kosten pro Million Input-Token mit 0,1 Dollar deutlich hinter GPT-4o mit 2,5 Dollar. Noch größer ist der Unterschied pro Million Output-Token, wo für Llama 3.3 nur 0,4 Dollar anfallen, für GPT-4o aber 10 Dollar. Al-Dahle schreibt: “Durch die Nutzung der neuesten Fortschritte im Bereich der Post-Training-Techniken, einschließlich der Online-Präferenzoptimierung, verbessert dieses Modell die Kernleistung zu deutlich geringeren Kosten und macht es für die gesamte Open-Source-Gemeinschaft noch leichter zugänglich.”

Das multi-linguale Text-only-Modell, das mit einem neuen Mix aus rund 15 Billionen Token nicht näher bestimmter, öffentlich zugänglicher Daten trainiert wurde, unterstützt Englisch, Deutsch, Französisch, Italienisch, Portugiesisch, Hindi, Spanisch, und Thai. Es verarbeitet eine Kontextgröße von 128k. Sein Wissen um aktuelle Begebenheiten reicht bis Dezember 2023. Die Llama 3.3 Community License erlaubt die Nutzung für kommerzielle und für Forschungszwecke.

SCHLAGWORTE
LLama
LLM

US-Regierung gibt auch das aktuellste ChatGPT nur für ausgewählte Kunden frei

Nach dem Exportverbot für Anthropics Spitzenmodelle Mythos 5 und Fable 5 weist die US-Regierung nun auch den Konkurrenten OpenAI an, sein neuestes Modell ChatGPT-5.6 vorerst nur handverlesenen Kunden zugänglich zu machen.

Suse und Openchip planen europäischen Technologie-Stack mit RISC-V

Der Linux-Anbieter Suse und das spanische Unternehmen Openchip & Software Technologies haben eine Absichtserklärung zur Entwicklung eines europäischen Technologie-Stacks unterzeichnet.

IBM-Forscher wollen Miniaturisierungstrend bei Chips noch zehn Jahre fortsetzen

Manche Wissenschaftler glaubten nicht mehr daran, dass sich der Trend zu immer weiterer Verkleinerung der Bauelemente auf Computerchips noch länger aufrechterhalten ließe. Nun aber stellten Forscher von IBM, das zwar selbst keine Chips mehr herstellt, aber weiter an der Technologie forscht,...

Red Hat macht Ansible fit für KI-Agenten

Red Hat baut die Red Hat Ansible Automation Platform zum zentralen „Trusted Execution Layer“ für KI-gestützte Prozesse aus. Damit können KI-Agenten kontrolliert und skalierbar in vorhandene Workflows und Infrastrukturen integriert werden.

Operation Endgame: Behörden zerschlagen Schadsoftware-Netzwerken**

m Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Im Rahmen der internationalen Operation Endgame haben Strafverfolgungs- und Cybersicherheitsbehörden mehrere Schadsoftware-Familien vom Netz genommen.

Cloud Tag: KI als Partner im Gruppenchat

Anthropic hat seine jüngste Entwicklung Claude Tag vorgestellt, die sich in einen Slack-Gruppenchat einbinden lässt und dann von Teammitgliedern via @Claude Aufgaben übertragen bekommt. Claude Tag soll sich dabei Kontext-Informationen aus den Channels besorgen, in denen es eingebunden ist.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Wir melden uns mit einer kurzen Folge direkt von den Chemnitzer Linux-Tagen 2026. Es war wieder ein aufregendes CLT-Wochenende – und wir hoffen, dass euch unsere Kurz-Interviews einen guten Eindruck von der Veranstaltung vermitteln.