Das Unternehmen OpenAI hat eine neue Video-Generator-App namens Sora 2 vorgestellt, die auch KI-generierten Sound zur Verfügung stellt. Außerdem sollen sich mit einem neuen Cameo-Feature eigene Bilder oder die von Freunden in die Videos einfügen und bearbeiten lassen. OpenAI verlautbart es gäbe robuste Schutzmechanismen, die verhindern würden, dass jemand ungefragt in einem Video auftauche.
Die neue App gibt es vorerst nur für iOS, eine Version für Android ist aber genauso in Arbeit wie eine API, mit der dann Dritthersteller den Videogenerator in eigene Video-Editoren und Schnittprogramme integrieren können.
Unter den ChatGPT-Anwendern werden zuerst diejenigen in den USA und Kanada Zugriff auf das neue Modell haben. Auch hier sollen Nutzer in weiteren Ländern im Lauf der nächsten Tage und Wochen dazukommen.
Sora 2 ist kostenlos mit Nutzungsbeschränkungen für alle Benutzer verfügbar, während ChatGPT Pro-Abonnenten Zugang zu einem höherwertigen “Sora 2 Pro”-Modell erhalten; ChatGPT Plus-Benutzer erhalten keine zusätzlichen Vorteile über die kostenlose Stufe hinaus.
Bereits das ursprüngliche Sora-Modell hatte im Jahr 2024 die Welt mit realistischen Videos begeistert. Seitdem ist die Technik aber noch viel weiter fortgeschritten und inzwischen erschienene Modelle von Startups wie Runway, Luma, Kling oder Higgsfield boten bessere Qualität in Bild und Ton. Das neue Modell holt nun wieder auf und kann komplexe Aktionen wie wie Turnübungen oder Paddelboard-Tricks bewältigen und dabei physikalische Regeln wie Schwungkraft und Auftrieb beachten. Im Gegensatz zu früheren Systemen, die einen Basketball in einen Korb “teleportieren” konnten, erzeugt Sora 2 einen realistischen Abpraller, wenn ein Wurf daneben geht. Außerdem werden Dialoge, Hintergrundgeräusche und Soundeffekte synchronisiert, so dass ein kohärentes Video-Audio-Erlebnis entsteht, das von fotorealistischen bis zu Anime-Stilen reicht.
Das neue Cameo-Feature ist für den Identitätsschutz auf der Plattform von zentraler Bedeutung. Es soll so funktionieren: Um ein Cameo zu erstellen, nehmen die Nutzer in der App zunächst ein kurzes Video und eine dynamische Audioprobe auf. Die Systeme von OpenAI validieren die Probe mit Audio-Challenges, um die Authentizität sicherzustellen und Nachahmungen zu verhindern. Nach der Verifizierung wählt ein Nutzer aus, wer sein Cameo in den generierten Videos verwenden darf: nur er selbst, ausgewählte Kontakte, gemeinsame Freunde oder alle. Diese Berechtigungen können jederzeit in den Cameo-Einstellungen bearbeitet werden. Ein Cameo-Besitzer kann den Zugriff jederzeit widerrufen. Er hat auch das Recht, jedes Video zu löschen, in dem sein Konterfei zu sehen ist – auch Entwürfe, die von anderen erstellt wurden. OpenAI beschreibt dies als eine eigentumsähnliche Kontrolle der Identität durch die Nutzer.
Daneben bringt das Modell eine Reihe weiterer Sicherheitsmaßnahmen mit, einige speziell für Minderjährige. So ist für Nutzer unter 18 Jahren ist das unendliche Scrollen in der App standardmäßig deaktiviert. Stattdessen wird der Feed nach einer bestimmten Anzahl von Videos angehalten und fordert eine Abkühlphase, bevor er fortgesetzt werden kann. Sogar erwachsene Nutzer werden darauf hingewiesen, wenn sie in einem langen passiven Scrollen gefangen sind. Wenn ein Minderjähriger in einer hochgeladenen Cameo-Aufnahme oder einem Bild erkannt wird, gelten strengere Schwellwerte für die Filter, die vor schädlichen oder unangemessenen Inhalten schützen sollen. Eltern können die mit ChatGPT verknüpften Tools verwenden, um die Beschränkungen für Teenager anzupassen. Diese Kontrollen können Feed-Limits außer Kraft setzen, die algorithmische Personalisierung deaktivieren, Cameo-Berechtigungen verwalten und Direktnachrichten einschränken.





