Alibaba Cloud stellt KI-Modelle als Open Source bereit

libaba Cloud öffnet den Zugang zu seinen KI-Modellen für die Videogenerierung. Quelle: Alibaba Cloud

Quelle: Alibaba Cloud

Alibaba Cloud öffnet den Zugang zu seinen KI-Modellen für die Videogenerierung und will damit nach eigenem Bekunden die Open-Source-Community unterstützen.

Das Unternehmen hat angekündigt, vier Versionen seiner Modelle der Wan2.1-Serie mit 14 Milliarden (14B) und 1,3 Milliarden (1.3B) Parametern als Open Source bereitzustellen. Dabei handelt es sich um die neueste Version des Video-Grundlagenmodells Tongyi Wanxiang (Wan).

Die vier Modelle – T2V-14B, T2V-1.3B, I2V-14B-720P und I2V-14B-480P – generieren hochwertige Bilder und Videos aus Text- und Bildeingaben. Entwickler, Forscher und Unternehmen weltweit können sie über die KI-Modell-Community Model Scope von Alibaba Cloud sowie auf der Plattform Hugging Face herunterladen und direkt einsetzen, teilt das Unternehmen mit.

Die Anfang des Jahres vorgestellte Wan2.1-Serie ist laut Alibaba Cloud das erste Videogenerierungsmodell, das Texteffekte sowohl in Chinesisch als auch in Englisch unterstützt. Die Modelle sollen durch realistische Darstellungen überzeugen , indem sie komplexe Bewegungen präzise erfassen die Pixelqualität steigern, physikalische Prinzipien einhalten und die Ausführung von Anweisungen optimieren. Die Wan2.1-Seri sei das einzige Open-Source-Modell unter den Top fünf der VBench-Bestenliste von Hugging Face für die Videogenerierung. Mit einer Gesamtbewertung von 86,22 Prozent übertreffe die Serie andere Modelle in zentralen Bereichen wie Dynamik, räumliche Beziehungen, Farbqualität und Interaktion zwischen mehreren Objekten, heißt es in der Ankündigung.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Nach oben