Kurz nach der Veröffentlichung des aufsehenerregenden Videogenerators Sora 2 von OpenAI, kontert Google mit einer neuen Version des Videomodells Veo 3.1, das die Basis seines Videogenerators Flow bildet.
Das Modell erzeugt fotorealistische Videos mit einer Länge von bis zu 30 Sekunden. Neben einer verbesserten Audio-Engine bringt es eine Reihe weiterer neuer Features mit: Mit “Ingredients to Video” kann der Anwender nun mehrere Referenzbilder vorgeben, um die Charaktere, Objekte und den Stil zu kontrollieren. Das Modell verwendet diese Zutaten, um eine endgültige Szene nach den visuellen Vorgaben des Nutzer zu erstellen.
Mit “Frames to Video” lässt sich ein ein Start- und ein Endbild einstellen. Der Generator erzeugt daraufhin ein nahtloses Video, das die beiden Bilder miteinander verbindet.
Mit der Funktion “Erweitern” lassen sich längere Videos berechnen, die sogar eine Minute oder länger dauern und an die Handlung des ursprünglichen Clips anknüpfen und diese fortsetzen. Jedes Video wird auf der Grundlage der letzten Sekunde des vorherigen Clips generiert und eignet sich daher besonders für die Erstellung einer längeren Einspielung.
Mithilfe der Funktion “Einfügen” kann der Nutzer alles einfügen, was er sich vorstellen kann, von realistischen Details bis hin zu fantastischen Kreaturen. Der Videogenerator soll dabei komplexe Details wie Schatten und Szenenbeleuchtung beachten, sodass das Hinzufügen natürlich aussieht. In ähnlicher Weise sollen sich bald auch Dinge aus der Szene entfernen lassen, wobei der Bildhintergrund und die Umgebung so modifiziert werden, dass es aussieht, als sei der entfernte Gegenstand nie dagewesen.
Mit dem neuen Videomodell platziert sich Google mindestens auf Augenhöhe zu OpenAI.





