KI-Videoerzeugung: OpenAIs Sora-API wird Teil von Microsofts Azure AI Foundry
Auch wenn Microsofts Azure AI Foundry den Entwicklern Zugang zu mehr als 1.900 KI-Modellen bietet, fehlte bislang eine Lösung zur Erzeugung von Videos aus Texteingaben, wie sie bei der Konkurrenz von AWS oder Google Cloud bereits vorhanden ist. Das soll sich nun ändern.
Bisher nur für begrenzte Nutzerzahl
Das hat Microsoft im Rahmen der aktuell stattfindenden Build 2025 angekündigt. Bisher mussten Nutzer auf das Sora-Videogenerierungsmodell von OpenAI verzichten, da dieses bislang noch nicht als API für Entwickler bereitgestellt wurde. Aufgrund der erheblichen GPU-Ressourcen, die für die Erstellung eines Videos mit dem Generator notwendig sind, war der Zugriff auf die Funktion bislang lediglich Anwendern mit einem Premium-Abonnement von ChatGPT vorbehalten. Dies dürfte auch der Grund sein, weshalb OpenAI die neue Funktion zwar bereits im Dezember 2024 vorgestellt, sie jedoch bislang noch nicht breit verfügbar gemacht hatte.
Entwickler erhalten neue Funktionen
Nun hat der Software-Konzern mitgeteilt, dass Sora ab nächster Woche Teil der Azure-AI-Foundry-Familie sein wird. Die Ankündigung erfolgte zeitgleich mit der Vorstellung des „Video Playground“-Bereichs in der Azure AI Foundry, in dem Entwickler mit verschiedenen KI-Modellen zur Videogenerierung wie Sora experimentieren können. Dabei lässt sich nicht nur die Auflösung und das Seitenverhältnis der zu erzeugenden Videos festlegen, sondern auch deren Länge bestimmen. Darüber hinaus wird der Video-Generator über den OpenAI-Service von Azure zugänglich sein, wodurch Entwickler den Generator auch in eigene Anwendungen einbinden können.
Video-Generator bereits in Nutzung
Microsoft wies zudem darauf hin, dass die Media-Agentur T&Pm, die zur WPP-Unternehmensgruppe gehört – einem britischen Konzern aus Werbedienstleistern und Medienunternehmen –, Sora bereits über den bereitgestellten Zugang einsetzt, um den eigenen Workflow zu optimieren. Das KI-Modell wird dabei unter anderem dafür verwendet, um frühe Konzepte schnell zu visualisieren und diese bis zur Produktion zu skalieren.