xAI stellt Imagine v0.9 Videogenerierungsmodell vor: 15 Sekunden zur Erstellung, kostenlos für alle Benutzer
Zusammenfassung
xAI hat am 7. Oktober 2025 (US-Ostküstenzeit) offiziell das Video-Generierungs-KI-Modell Imagine v0.9 veröffentlicht und es allen Nutzern kostenlos zugänglich gemacht. Dies ist das erste große Upgrade seit der Einführung von Imagine v0.1 im Juli dieses Jahres. Die neue Version bietet erhebliche Verbesserungen in Bezug auf visuelle Qualität, dynamische Bewegung und Audio-Generierung und kann Audioeffekte erzeugen, die mit den Videoaktionen synchronisiert sind.
Technische Durchbrüche und Kernfunktionen
Imagine v0.9 hat umfassende Upgrades in den Bereichen visuelle Qualität, Bewegungseffekte und Audio-Generierung erfahren. Eines der bemerkenswertesten Merkmale des Modells ist seine native integrierte Audio-Video-Generierungsfähigkeit, die es ermöglicht, direkt filmreife Videos mit synchronisierten Soundeffekten zu erstellen, ohne dass eine Nachbearbeitung erforderlich ist.
In den offiziellen Demo-Videos erzeugt ein generierter Drache realistische Brüllgeräusche, wenn er sein Maul öffnet und schließt, Roboter können lippensynchron mit Menschen sprechen, und es können sogar ausdrucksstarke Gesangsinhalte generiert werden.
Bewegungssteuerung und Bildeffekte
Die Version v0.9 hat erhebliche Fortschritte bei der Bewegungssteuerung gemacht und kann komplexe dynamische Aktionen wie Skisprünge flüssig und ohne Verformung oder Verzerrung vom Absprung bis zur Landung wiedergeben. Darüber hinaus unterstützt das Modell dynamische Kameraeffekte wie intelligente Fokusverschiebung, die Straßenansichten unscharf machen kann, um Personen hervorzuheben, basierend auf Änderungen der Kameraposition.
Vorteil bei der Generierungsgeschwindigkeit
Elon Musk erklärte auf der sozialen Plattform X, dass Imagine v0.9 die Video-Generierung innerhalb von 15 Sekunden abschließen kann. Diese Geschwindigkeit stellt einen deutlichen Vorteil gegenüber dem Konkurrenten OpenAI Sora 2 dar. Berichten zufolge kann die Generierung eines einzelnen Videos mit Sora 2 ein bis zwei Minuten dauern.
Zugänglichkeit und Produktintegration
Imagine v0.9 wurde in die Video-Generierungsfunktion von Grok integriert und ist allen Nutzern, einschließlich kostenlosen Nutzern, kostenlos zugänglich. Nutzer können die Funktion unter grok.com/imagine nutzen.
Musk ermutigte die Nutzer auch, die sprachgesteuerte Oberfläche von Grok auszuprobieren. Durch die Aktivierung der Funktion "Sprachmodus zum Öffnen der App" in den Einstellungen können Nutzer Videos, Bilder und Texte direkt per Spracheingabe erstellen, ohne tippen zu müssen.
Kontroverse Funktionen bleiben erhalten
Es ist bemerkenswert, dass die Video-Generierungsfunktion von Grok einen "Spicy"-Modus enthält, der die Erstellung von Inhalten ermöglicht, die möglicherweise von Video-Generierungs-KIs von Google oder OpenAI blockiert würden. Diese Funktion bleibt in der v0.9-Version erhalten und hat Diskussionen über Deepfake-Risiken und Inhaltsregulierung ausgelöst.
Ein wichtiges Upgrade von v0.9 ist die Möglichkeit für Nutzer, Videos benutzerdefinierte Stimmen hinzuzufügen. Sobald diese Technologie ausgereift ist, könnten Nutzer Fotos von Persönlichkeiten des öffentlichen Lebens hochladen und realistische Videos erstellen, in denen diese bestimmte Inhalte sprechen, was ein Deepfake-Risiko birgt.
Marktwettbewerbsumfeld
Die Veröffentlichung von Imagine v0.9 erfolgt inmitten eines sich verschärfenden Wettbewerbs im Bereich der KI-Video-Generierung. OpenAI hatte am 30. September sein Flaggschiff-Modell zur Video- und Audio-Generierung, Sora 2, veröffentlicht. Das aktuelle Update von xAI wird als direkte Antwort auf Sora 2 angesehen.
Im Gegensatz zum Einladungssystem von Sora 2 ist Imagine v0.9 allen Nutzern kostenlos zugänglich und zieht durch den kostenlosen Zugang eine große Menge an Traffic an.
Aktuelle Einschränkungen
Tests haben gezeigt, dass Imagine v0.9 im praktischen Einsatz einige Probleme aufweist, darunter das Missverstehen von Prompts, Inkonsistenzen zwischen Video und Audio, das Fehlen von Warnungen vor Deepfake-Risiken und die Unfähigkeit, Chinesisch zu verarbeiten. Darüber hinaus berichteten einige Nutzer, dass die Webversion vorübergehend nicht richtig funktioniert.
Trotz dieser Einschränkungen stellt Imagine v0.9 einen wichtigen Fortschritt in der KI-Video-Generierungstechnologie dar und bietet Content-Erstellern ein schnelles und kostenloses Tool zur Videoproduktion. Mit der kontinuierlichen Weiterentwicklung der Technologie wird erwartet, dass das Modell seine Fähigkeiten und Qualität in den kommenden Monaten weiter verbessern wird.