OpenAI verschärft die Sicherheitsvorkehrungen für sein KI-Video-Modell Sora 2. Dadurch soll es wesentlich schwerer werden, Deepfakes zu erzeugen und unerkannt zu verbreiten.
Zu den konkreten Schutzmaßnahmen gehören beispielsweise sichtbare und unsichtbare Herkunftskennzeichen. Alle Sora-Videos werden sogenannte C2PA-Metadaten in sich tragen. Dieser Industriestandard ermöglicht die zuverlässige Rückverfolgung von Video- und Audio-Daten zu Sora.
Zwar erlaubt es Sora weiterhin, Videos aus Fotos von Familie und Freunden zu erstellen, die Sicherheitsrichtlinien dafür werden jedoch insbesondere bei Kindern oder jüngere Personen verschärft. Diese Videos werden beim Teilen immer mit einem Wasserzeichen versehen. Bei mit Sora erzeugten Charakteren, also virtuellen Abbildern des Nutzers, muss immer eine ausdrückliche Zustimmung vorliegen. Die Charaktere können nur von dafür befugten Nutzern verwendet werden und diese Zustimmung kann jederzeit zurückgezogen werden.
Teenager will OpenAI besonders schützen, auch in Hinblick auf den Kontakt mit Videomaterial für Erwachsene. Inhalte, die schädlich, unsicher oder altersunangemessen sein könnten, werden bei Konten von Jugendlichen herausgefiltert. Accounts von Teens werden Erwachsenen nicht empfohlen und Erwachsene können zu ihnen keinen Kontakt aufnehmen. Die Eltern können bestimmen, ob Teenager Direct Messages senden und empfangen dürfen. Auch das kontinuierliche Scrollen in der Sora App wird für junge Nutzer limitiert.
Unsicherer Inhalt, darunter sexuelles Material, terroristische Propaganda und die Verherrlichung von Selbstverletzung, soll schon bei der Erzeugung blockiert werden. Über die Erstellung hinaus überprüfen automatisierte Systeme alle Feed-Inhalte anhand OpenAIs globaler Nutzungsrichtlinien und filtern unsichere Inhalte heraus. Diese Systeme werden fortlaufend aktualisiert, sobald neuen Risiken bekannt werden. Ergänzend soll es manuelle Kontrollen geben, die sich auf die Schäden mit den größten Auswirkungen konzentrieren.
Jedes Video, jedes Profil, jede Direktnachricht, jeder Kommentar und jeder Charakter kann wegen Missbrauch gemeldet werden, wobei bei Verstößen gegen die Richtlinien klare Rechtsmittel zur Verfügung stehen. Jeder Nutzer kann Konten außerdem jederzeit sperren, wodurch andere sein Profil oder seine Beiträge nicht mehr sehen, seinen Charakter nicht mehr verwenden und ihn nicht mehr per Direktnachricht kontaktieren können.





