LLaMA: Facebooks Einstieg in die KI-Forschung

- 27. Februar 2023

Der Facebook-Mutterkonzern Meta hat LLaMA eine Sammlung von grundlegenden Sprachmodellen vorgestellt. Die seien auf Milliarden von Tokens trainiert und würden zeigen, dass es möglich ist, Modelle ausschließlich mit öffentlich verfügbaren Datensätzen zu trainieren, ohne proprietäre und unzugängliche Daten.

Wie Meta in seinem Entwicklerblog berichtet, soll der Datensatz LLaMA-13B den von GPT-3 (175B) bei den meisten Benchmarks übertreffen. Alle Modelle wolle man öffentlich zur Verfügung stellen.

Mark Zuckerberg schreibt auf Facebook, das LLaMA Forschern helfen soll, ihre Arbeit voranzubringen. LLMs (Large Language Models) hätten sich als vielversprechend erwiesen, wenn es darum gehe, Texte zu generieren, Gespräche zu führen, schriftliches Material zusammenzufassen und kompliziertere Aufgaben zu lösen, wie etwa mathematische Theoreme. Meta habe sich diesem offenen Forschungsmodell verschrieben und man werde das neue Modell der KI-Forschungsgemeinschaft zur Verfügung stellen, schreibt Zuckerberg.

Meta zufolge soll LLaMA derzeit nicht in den sozialen Netzen des Konzerns wie Faceook und Instagram eingesetzt werden, sondern eben in der KI-Forschung seinen Beitrag leisten. Eine Publikation der Meta-Forscher erläutert die KI von LLaMA näher.

SCHLAGWORTE
Facebook
KI
Meta

Collabora portiert Arch Linux für die Arm64-Plattform von Steam

Collabora arbeitet gemeinsam mit Valve an „Holo Core“, einer auf die Arm64-Architektur zugeschnittenen Portierung von Arch Linux. Sie soll als Grundlage für das Betriebssystem des kommenden Steam Frame dienen, der einen Prozessor mit Arm64-Architektur nutzt.

"Half a Second": Kostenloses E-Book arbeitet XZ-Backdoor auf

Eine Backdoor im kleinen Kompressionsprogramm XZ sorgte 2024 für ein großes weltweites Sicherheitsproblem und stieß eine Diskussion um überlastete Maintainer an. Den kompletten Vorfall arbeitet jetzt Adrian Mastronardi penibel in seinem kostenlosen E-Book auf.

Weltklassemodell aus China vorgestellt

Das chinesische Start-up Moonshot hat mit Kimi K3 ein neues Modell mit 2,8 Billionen Parametern vorgestellt, das auch in unabhängigen Tests mit den besten Modellen von OpenAI oder Anthropic mithalten kann. Damit schließt das Modell die Lücke, die bisher noch zwischen den amerikanischen...

Forgejo 16.0 ist da

Die neue Version 16.0 des leichtgewichtigen Tools für Code-Hosting und -Kollaboration ist am 16. Juli 2026 erschienen.

Klarstellung: Linus Torvalds erlaubt KI bei Kernel-Entwicklung

Der Einsatz von Künstlicher Intelligenz ist bei der Kernel-Entwicklung explizit erlaubt – das Linus Torvalds im Rahmen einer Diskussion noch einmal klargestellt. Für KI-Kritiker findet er darin zudem drastische Worte.

frame: vollständig in Assembler geschriebener X-Server

Der Norweger Geir Isene hat einen X-Server komplett in Assembler geschrieben. Der soll nicht nur deutlich ressourcenschonender arbeiten als das Pendant von X.org, er besteht derzeit auch nur aus rund 20.000 Zeilen Code. Es gibt aber auch ein paar Haken.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung