OpenAI stellt Sora 2 Modell und gleichnamige Social-Media-App vor: KI-Videogenerierung erreicht Ära der Audio-Video-Synchronisation
Zusammenfassung
OpenAI hat am 30. September offiziell sein KI-Videogenerierungsmodell der nächsten Generation, Sora 2, veröffentlicht und gleichzeitig die dazugehörige iOS-Social-App Sora eingeführt. Das neue Modell ermöglicht erstmals die Synchronisation von KI-generierten Videos und Audio, einschließlich der automatischen Generierung von Dialogen und Soundeffekten. Die App verwendet ein Kurzvideo-Feed-Design, ähnlich dem von TikTok, ist derzeit nur in den USA und Kanada verfügbar und wird auf Einladung angeboten.
Technologischer Durchbruch: Deutliche Verbesserung der physikalischen Genauigkeit
Sora 2 hat erhebliche Verbesserungen in Bezug auf physikalische Simulation, Realismus und Kontrollierbarkeit erzielt. Im Gegensatz zu früheren Videomodellen, bei denen Objekte oft deformiert wurden oder physikalische Gesetze verletzt wurden, kann Sora 2 komplexe Bewegungsszenen wie Turnübungen, Skateboard-Tricks und Tauchgänge verarbeiten und dabei die physikalischen Regeln der realen Welt befolgen.
Die OpenAI-Forschungsteammitglieder Bill Peebles, Rohan Sahai und Thomas Dimson demonstrierten die Fähigkeiten des Modells in einem YouTube-Livestream. Die Demo-Videos umfassten Szenen wie Beachvolleyballspiele, Skateboard-Trick-Performances und Turnübungen, die eine beispiellose Flüssigkeit und Realitätstreue zeigten.
Audio-Video-Synchronisation: Eine entscheidende Lücke geschlossen
Die bemerkenswerteste Neuerung ist, dass Sora 2 erstmals die KI-Audiogenerierung unterstützt, die zum Videomaterial passt, einschließlich synchronisierter Dialoge und Soundeffekte. Diese Funktion schließt eine wichtige Lücke des ursprünglichen Sora-Modells. Als OpenAI das Sora-Modell Anfang 2024 erstmals vorstellte, sorgte dies für Aufsehen in der Branche, doch erst im Dezember 2024 wurde es der Öffentlichkeit zugänglich gemacht. In der Zwischenzeit haben Konkurrenten wie Runway, Luma und Kling Videomodelle mit Audio-Generierungsfunktionen auf den Markt gebracht.
Social App: Herausforderung für Kurzvideoplattformen
Gleichzeitig mit Sora 2 wurde auch die iOS-App namens Sora veröffentlicht, die ein algorithmisch empfohlenes Kurzvideo-Feed-Design verwendet. Die herausragendste Funktion der App ist "Cameo", die es Benutzern ermöglicht, nach entsprechender Autorisierung ihr eigenes Bild und das ihrer Freunde in KI-generierte Videos einzufügen. OpenAI hat erklärt, strenge Identitätsschutzmaßnahmen etabliert zu haben, um die unautorisierte Nutzung von Bildern anderer Personen zu verhindern.
Die App ist derzeit kostenlos, was laut OpenAI dazu dienen soll, den Benutzern die freie Erkundung ihrer Funktionen zu ermöglichen. Der einzige geplante Kostenpunkt ist die Gebühr für zusätzliche Videogenerierungen während Spitzenzeiten.
Urheberrechtsstreitigkeiten treten auf
Bereits am ersten Tag der Veröffentlichung der Sora-App generierten Nutzer Videos mit urheberrechtlich geschützten Spielfiguren wie Mario und Pikachu, was Bedenken bei Urheberrechtsexperten auslöste. Mark McKenna, Professor für Rechtswissenschaften an der UCLA, wies darauf hin, dass, wenn OpenAI die Ausgabe von urheberrechtlich geschützten Inhalten zulässt, dies möglicherweise nicht den Bestimmungen des Urheberrechts entspricht, es sei denn, Nutzer entscheiden sich aktiv dagegen.
Darüber hinaus generierten Nutzer ein Video, das OpenAI-CEO Sam Altman beim Diebstahl von Computerteilen in einem Geschäft zeigte, was das potenzielle Risiko der Technologie bei der Erstellung von Falschinformationen hervorhebt. Um diesen Problemen zu begegnen, hat OpenAI erklärt, dass alle über die Sora-App oder Website generierten Videos ein bewegliches Wasserzeichen tragen und in den Metadaten als KI-generiert gekennzeichnet werden.
Nutzer-Kreativitätswelle und Parodie-Phänomen
Nach der Veröffentlichung von Sora 2 löste dies in den chinesischen sozialen Medien einen Boom der KI-Videokreation aus. Nutzer generierten Videos zu verschiedenen Themen, darunter historische Dramen, moderne Stadtdramen und Sportveranstaltungen. Einige Netizens erstellten sogar fiktive Szenen, in denen die chinesische Fußballnationalmannschaft die Weltmeisterschaft gewinnt, sowie verschiedene Parodie-Videos, die sich gegen Sam Altman richteten.
Marktpositionierung: Modell-plus-Produkt-Kombination
Analysten weisen darauf hin, dass sich die Strategie von OpenAI von einem reinen Modellwettbewerb zu einer "Modell-plus-Produkt"-Kombination entwickelt hat. Sobald eine Technologie einen kritischen Punkt der Nutzbarkeit überschreitet, bringt OpenAI schnell begleitende Anwendungen auf den Markt, um Nutzer durch Produktbarrieren zu binden. Diese Strategie hat sich bereits bei ChatGPT und dem Code-Generierungstool Codex bewährt.
Die Sora-App ist derzeit die meist heruntergeladene Anwendung in der Kategorie Fotos & Videos im iOS App Store. OpenAI hat erklärt, dass es beabsichtigt, den Dienst so schnell wie möglich auf weitere Länder und Regionen auszudehnen.
Nutzer sollten bei der Verwendung dieser Technologie darauf achten, relevante Gesetze und Vorschriften einzuhalten sowie die Privatsphäre und das geistige Eigentum anderer zu respektieren.