Gerade einmal nur drei Tage lagen zwischen den beiden Ollama-Versionen 0.6.5 und 0.6.4. Beide verbessern die Unterstützung des Gemma-3-Modells. Des Weiteren kann das Werkzeug zum Ausführen von Sprachmodellen mit Mistral Small 3.1 umgehen.
Ollama 0.6.5 lädt das Gemma-3-Modell jetzt flotter, wenn die Daten auf Netzwerkdateisystemen wie Google Cloud Storage FUSE liegen. Bereits die Version 0.6.4 behob einen Speicherfehler, der bei parallelen Anfragen an Gemma 3 auftrat. Obendrein bricht die Qualität nicht mehr nach rund 512 verarbeiteten Token ein.
Ebenfalls über die Version 0.6.4 kam die Unterstützung für die RDNA4-Schnittstelle von AMD mit. Abschließend verrät in der REST-Schnittstelle der Endpoint „/api/show“ jetzt die Fähigkeiten des Modells, wie etwa „vision“.




