Microsoft, das in Sachen Sprachmodelle bislang vor allem auf seine Beteiligung an OpenAI setzte, in das man bis zu 13 Milliarden US-Dollar investierte, hat nun erstmals zwei große, selbst entwickelte Modelle vorgestellt.
Präsentiert wurden zunächst zwei Modelle: Zum einen MAI-Voice-1, ein Modell, das mit gesprochener Sprache umgeht und nach Angaben des Unternehmens eines der effizientesten in der Branche ist. Es läuft auf einer einzigen GPU und kann eine Minute Audio in weniger als einer Sekunde produzieren. Zum anderen das Textmodell MAI-1-preview, das zukünftige Versionen von Copilot, dem in Windows- und Office-Produkte integrierten KI-Assistenten des Unternehmens, unterstützen könnte. Beide Modelle sind auf Kosteneffizienz ausgerichtet. MAI-1-preview wurde auf etwa 15 000 Nvidia H-100-GPUs trainiert, im Vergleich zu Modellen wie Grok von xAI, das auf mehr als 100 000 solcher Chips trainiert wurde.
Der Leiter von Microsofts AI Division, Mustafa Suleyman, betonte gegenüber der Nachrichtenplattform Semafor: “Wir sind eines der größten Unternehmen der Welt. Wir müssen in der Lage sein, das interne Fachwissen aufzubringen, um die stärksten Modelle der Welt zu entwickeln.” Ein mögliches Zerwürfnis mit OpenAI spielte er herunter: “Unser Ziel ist es, die Partnerschaft zu vertiefen und sicherzustellen, dass wir für viele, viele Jahre eine großartige Zusammenarbeit mit OpenAI haben”, sagte er. “Ich hoffe und bin mir sicher, dass das so bleibt.”




