xAI lance le modèle de génération de vidéos Imagine v0.9 : création en 15 secondes, gratuit pour tous les utilisateurs
Résumé
xAI a officiellement lancé son modèle d'IA de génération de vidéo, Imagine v0.9, le 7 octobre 2025 (heure de la côte Est des États-Unis), le rendant accessible gratuitement à tous les utilisateurs. Il s'agit de la première mise à jour majeure depuis le lancement d'Imagine v0.1 en juillet de cette année. La nouvelle version apporte des améliorations significatives en termes de qualité visuelle, de mouvement dynamique et de génération audio, permettant de produire des effets audio synchronisés avec les actions de la vidéo.
Avancées technologiques et fonctionnalités clés
Imagine v0.9 a bénéficié d'une mise à niveau majeure en ce qui concerne la qualité visuelle, les effets de mouvement et la génération audio. L'une des caractéristiques les plus remarquables du modèle est sa capacité de génération audio-vidéo native et intégrée, permettant de créer directement des vidéos de qualité cinématographique avec des effets sonores synchronisés, sans nécessiter de post-édition.
Dans les vidéos de démonstration officielles, les dragons générés émettent des rugissements réalistes en ouvrant et fermant la bouche, les robots peuvent parler en synchronisation labiale avec les humains, et le modèle est même capable de générer des contenus chantés expressifs.
Contrôle des mouvements et effets visuels
La version v0.9 a fait des progrès considérables en matière de contrôle des mouvements, capable de reproduire avec fluidité des actions dynamiques complexes telles que les sauts à ski, sans déformation ni distorsion du décollage à l'atterrissage. De plus, le modèle prend en charge des effets de caméra dynamiques tels que le transfert intelligent de la mise au point, permettant de flouter l'arrière-plan urbain pour mettre en évidence le sujet principal en fonction des changements de position de la caméra.
Avantage en termes de vitesse de génération
Elon Musk a déclaré sur la plateforme sociale X qu'Imagine v0.9 est capable de générer une vidéo en 15 secondes. Cette vitesse représente un avantage significatif par rapport à son concurrent, Sora 2 d'OpenAI. Selon les rapports, Sora 2 pourrait prendre une à deux minutes pour générer une seule vidéo.
Accessibilité et intégration produit
Imagine v0.9 est désormais intégré à la fonction de génération de vidéo de Grok et est accessible gratuitement à tous les utilisateurs, y compris les utilisateurs gratuits. Les utilisateurs peuvent accéder à cette fonctionnalité en visitant grok.com/imagine.
Musk a également encouragé les utilisateurs à essayer l'interface vocale prioritaire de Grok ; en activant la fonction "Ouvrir l'application en mode vocal" dans les paramètres, les utilisateurs peuvent créer directement des vidéos, des images et du texte par la voix, sans avoir besoin de saisir du texte.
Fonctionnalités controversées maintenues
Il est à noter que la fonction de génération de vidéo de Grok inclut un mode "Spicy", qui permet de générer du contenu susceptible d'être bloqué par les IA de génération de vidéo de Google ou d'OpenAI. Cette fonctionnalité a été maintenue dans la version v0.9, suscitant des discussions sur les risques de deepfake et la régulation du contenu.
Une mise à niveau importante de la v0.9 est la possibilité pour les utilisateurs d'ajouter des voix personnalisées aux vidéos. Une fois cette technologie mature, les utilisateurs pourraient télécharger des photos de personnalités publiques et générer des vidéos réalistes les montrant dire des choses spécifiques, ce qui présente un risque de deepfake.
Contexte de la concurrence sur le marché
Le lancement d'Imagine v0.9 intervient alors que la concurrence dans le domaine de la génération de vidéo par IA est féroce. OpenAI a lancé son modèle phare de génération de vidéo et d'audio, Sora 2, le 30 septembre. Cette mise à jour de xAI est considérée comme une réponse directe à Sora 2.
Contrairement au système sur invitation de Sora 2, Imagine v0.9 est accessible gratuitement à tous les utilisateurs, attirant un trafic considérable grâce à cette offre d'accès gratuit.
Limitations actuelles
Les tests ont révélé qu'Imagine v0.9 présente certaines limitations en utilisation réelle, notamment une mauvaise interprétation des invites, des incohérences entre la vidéo et l'audio, l'absence d'avertissements concernant les risques de deepfake, et l'incapacité à traiter le chinois, entre autres. De plus, certains utilisateurs ont signalé que la version web ne fonctionnait pas correctement temporairement.
Malgré ces limitations, Imagine v0.9 représente une avancée significative dans la technologie de génération de vidéo par IA, offrant aux créateurs de contenu un outil de production vidéo rapide et gratuit. Avec l'itération continue de la technologie, le modèle devrait encore améliorer ses capacités et sa qualité dans les mois à venir.