Das französische Unternehmen Mistral AI hat eine neue Version seines LLM Mistral unter Apache-2.0-Lizenz veröffentlicht.
Mistral 3 erscheint in drei kleineren Spielarten (14B, 8B und 3B), jeweils mit Base-, Instruct- und Reasoning-Variante sowie als Mistral Large 3, dem bislang leistungsfähigsten Modell der Firma. Es verfolgt einen Mixture-of-Experts-Ansatz, der mit 41 Milliarden aktiven und insgesamt 675 Milliarden Parametern trainiert wurde.
Vergleiche zeigen Mistral Large 3 auf Augenhöhe mit DeepSeek 3.1 und Kimi-K2 in Benchmarks wie MMMLU, GPQA-Diamond oder Live-Code Bench. Allerdings erschien ja ebenfalls in dieser Woche auch eine neue, noch leistungsfähigere DeepSeek-Version, die dabei noch nicht berücksichtigt werden konnte.
Unter den Open-Weight-Modellen gehört Mistral 3 aber fraglos zur Spitzenklasse. Es wurde auf 3000 of NVIDIA GPUs H200 trainiert und reklamiert für sich die Weltspitze in seiner Klasse bei mehrsprachigen Chats. Eine spezielle Reasoning-Version soll bald folgen.
Mistral arbeitet mit der Open-Source-Community und speziell mit Red Hat und dem vllm-Projekt zusammen, das eine Open-Source-Inferenz-Engine entwickelt, die große Sprachmodelle deutlich schneller und speichereffizienter ausführt, ohne selbst ein eigenes Sprachmodell zu sein. Das Projekt zielt darauf ab, mit derselben GPU-Hardware mehr Anfragen parallel zu bedienen, die Latenz zu senken und damit die Betriebskosten für KI-Anwendungen zu reduzieren. Mit dieser Engine ist Mistral 3 Large auf Blackwell NVL72-Racks oder einzelnen Systemen mit 8×A100 or 8×H100 Nvidia-GPUs lauffähig.




