Generativer KI-Videogenerator: OpenAI veröffentlicht Text-zu-Video-System Sora
Lange wurde es erwartet, nun kommt es im Rahmen der Dezember-Reihe: OpenAI hat das Text-zu-Video-System Sora offiziell auf den Markt gebracht. Bislang konnten es nur Tester nutzen, jetzt steht für alle Nutzer zur Verfügung – zumindest für alle außerhalb von Europa.
Sora nur im Abo
Wer Sora nutzen will, benötigt ein kostenpflichtiges ChatGPT-Abonnement. Nutzer der Plus-Variante für 20 US-Dollar im Monat erhalten die Möglichkeit, monatlich bis zu 50 Priority-Videos mit 480p-Auflösung oder einige weniger in 720p zu erstellen. Das Limit liegt bei 1.000 Credits. Die Laufzeit der Videos ist auf fünf Sekunden begrenzt.
Nutzer der kürzlich vorgestellten Abonnement ChatGPT Pro für 200 US-Dollar im Monat können bis zu 500 Priority-Videos erstellen (10.000 Credits). Die normale Video-Generierung ist nicht begrenzt. Die Auflösung geht hoch bis 1080p, die Laufzeit liegt bei 20 Sekunden und es lassen sich bis zu fünf Videos gleichzeitig generieren. Die per Sora erstellten Videos lassen sich dann auch ohne Wasserzeichen herunterladen.
Das gilt aber nur für Nutzer außerhalb der EU und somit auch Deutschland sowie UK. Hierzulande ist Sora vorerst noch nicht verfügbar.
Generierte Videos lassen sich anpassen
Mit dem nun veröffentlichten Tool ist es nicht nur möglich, neue Videos basierend auf einer Text- oder Bild-Eingabe zu generieren. Mit Prompts lassen sich die Videos etwa weiterentwickeln. Im Blog-Beitrag demonstriert OpenAI das anhand einer Szene, bei der sich die Tür zu einer Bibliothek öffnet. Bei der ersten Fassung ist das Setting klassisch, der Stil erinnert an das 19. oder 20. Jahrhundert. Mit der ersten Anpassung wurde dann die Tür ersetzt, mit der zweiten das komplette Setting in ein Raumschiff verlagert.
Mit einem integrierten Schnittprogramm ist es zudem möglich, bestimmte Szenen oder Frames auszuschneiden. Diese sind dann die Grundlage, um Videos weiterzuentwickeln.
Realistischer Look, aber mit Fehlern
Einige der Videos gingen in den sozialen Medien viral. Gefeiert wurden diese oftmals für den realistischen Look, allerdings zeigten sich auch Schwächen. Beeindruckend wirkte etwa ein Video, das eine Ameise auf dem Weg durch das Innere eines Ameisenbaus zeigte. Der Haken war nur, dass die Ameise zu wenig Beine hatte.
Unrealistische Physik ist ein weiteres, oft beobachtetes Problem, das OpenAI auch nach wie vor als Limitierung beschreibt. In den letzten Monaten wurde unter anderem an den Sicherheitsmechanismen gearbeitet. So will OpenAI etwa verhindern, dass mit Sora Missbrauchsdarstellungen oder sexuelle Deepfakes erstellt werden.
Insbesondere in der Filmbranche erntet OpenAI aber auch Kritik. Zuletzt führte das zu einem Leak einer Vorab-Version von Sora. Filmschaffende, die gegen OpenAIs Entwicklungsbedingungen protestieren wollten, hatten den Zugang auf Hugging Face veröffentlicht.
Konkurrenz zu Runway und Adobe
Im Markt vertreten ist bereits das Tool Runway. Und der Platzhirsch Adobe hat die Creative Cloud ebenfalls schon um generative KI-Videofunktionen ergänzt. Text- und Bild-zu-Video-Modelle sind schon seit dem Herbst als Beta verfügbar.
Für OpenAI ist es derweil die dritte Ankündigung in der Dezember-Reihe. Insgesamt hat OpenAI zwölf große und kleine Neuheiten in Aussicht gestellt. Den Anfang machte das finale o1-Modell samt dem ChatGPT-Pro-Abo. Die zweite Vorstellung war ein Reinforcement-Fine-Tuning-Programm, das es ermöglichen soll, Modelle besser für spezifische Aufgaben zu trainieren.