Gen-4.5 de Runway revendique la première place dans la génération de vidéos par IA, surpassant les géants de la technologie

December 05, 2025
Runway
6 min

Résumé de l'actualité

Runway, une société de développement d'IA, a annoncé la sortie de Gen-4.5, un modèle de génération vidéo révolutionnaire qui a revendiqué la première place sur les benchmarks indépendants, surpassant à la fois Sora 2 d'OpenAI et Veo 3 de Google. Le modèle a obtenu un score Elo sans précédent de 1 247 points sur le classement Artificial Analysis Text-to-Video, s'imposant comme le système de génération vidéo le mieux noté au monde.

Runway Gen-4.5 Surpasse les Géants de l'Industrie

Le 1er décembre 2025, Runway a dévoilé Gen-4.5, marquant une étape importante dans la technologie de génération vidéo par intelligence artificielle. Le modèle a détrôné Veo 3 de Google, qui occupe désormais la deuxième place, tout en reléguant Sora 2 Pro d'OpenAI à la septième position du classement indépendant Video Arena. Cette réalisation est particulièrement remarquable compte tenu de la petite équipe de Runway, composée d'environ 100 employés, qui rivalise avec des entreprises technologiques pesant des milliers de milliards de dollars.

Supériorité Technique et Innovation

Gen-4.5 représente des avancées substantielles tant en termes d'efficacité des données de pré-entraînement que de techniques de post-entraînement. Le modèle excelle dans la compréhension des séquences complexes de mouvements, du travail de caméra détaillé, du timing des événements et des changements atmosphériques subtils. Selon l'annonce officielle de Runway, le système atteint une précision physique sans précédent, avec des objets se déplaçant avec un poids, un élan et une force réalistes. Les liquides s'écoulent avec une dynamique appropriée et les détails de surface sont rendus avec une fidélité exceptionnelle.

Le modèle a été entièrement développé sur des GPU NVIDIA, utilisant à la fois les puces des séries Hopper et Blackwell pour optimiser les performances à travers les étapes initiales de recherche et développement, de pré-entraînement, de post-entraînement et d'inférence. Cette collaboration avec NVIDIA a repoussé les limites de l'optimisation des modèles de diffusion vidéo, équilibrant l'efficacité de l'entraînement avec la vitesse d'inférence sans compromettre la qualité.

Capacités et Fonctionnalités Avancées

Gen-4.5 démontre des capacités supérieures de compréhension des invites, interprétant et intégrant avec précision des instructions complexes dans les vidéos générées. Le système maintient une cohérence temporelle tout au long des séquences vidéo, assurant des récits cohérents et une simulation physique réaliste. Contrairement aux modèles précédents qui présentaient un comportement trop optimiste, Gen-4.5 respecte les principes de la physique du monde réel. Par exemple, si un joueur de basket-ball rate un tir, le ballon rebondit naturellement sur le panneau plutôt que de se téléporter dans le panier.

Le modèle produit des sorties cinématographiques et très réalistes en qualité haute définition, offrant aux créateurs une fidélité visuelle et un contrôle créatif sans précédent. Malgré ce bond en avant en termes de capacités, Gen-4.5 conserve la vitesse et l'efficacité de son prédécesseur, Gen-4, offrant une qualité révolutionnaire sans compromettre les performances.

Impact sur l'Industrie et Adoption Précoce

Parmi les premiers partenaires de Gen-4.5 figurent des organisations majeures telles que Target, l'agence de publicité Wieden+Kennedy, la BBC et le développeur de jeux Ubisoft. Le modèle est déployé progressivement auprès des utilisateurs, sa disponibilité s'étendant à tous les clients dans les jours suivant l'annonce. Runway prévoit d'intégrer tous les modes de contrôle existants, y compris Image-to-Video, Keyframes et Video-to-Video, dans Gen-4.5.

Le PDG Cristóbal Valenzuela a souligné l'importance de cette réalisation, déclarant que l'équipe avait réussi à surpasser des entreprises pesant des milliers de milliards de dollars grâce à un travail ciblé et diligent. Le modèle a été nommé en interne "David", en référence à l'histoire biblique de David et Goliath, symbolisant la capacité de la startup à défier les géants de l'industrie. Valenzuela a également exprimé son enthousiasme à l'idée de s'assurer que le développement de l'IA n'est pas monopolisé par une poignée de grandes entreprises.

Paysage Concurrentiel

La sortie de Gen-4.5 intensifie la concurrence sur le marché de la génération vidéo par IA. Sora 2 d'OpenAI, sorti en septembre 2025, met l'accent sur un mouvement physiquement plausible et une génération audio synchronisée, avec un accent sur l'intégration des médias sociaux via une application iOS dédiée. Veo 3 de Google propose une intégration audio native et des capacités de génération vidéo plus longues, ciblant les applications d'entreprise grâce à l'intégration avec Google Cloud et YouTube.

Gen-4.5 de Runway se distingue par une meilleure adhésion aux invites, une qualité de mouvement et une précision de la simulation physique supérieures, comme validé par des tests à l'aveugle indépendants sur le classement Video Arena. La capacité du modèle à gérer divers modes de génération tout en maintenant une qualité visuelle élevée le positionne comme le premier choix pour les créateurs à la recherche de sorties cinématographiques.

Limitations Techniques et Développement Futur

Malgré ses avancées, Runway reconnaît que Gen-4.5 présente des limitations communes aux modèles de génération vidéo. Celles-ci incluent des problèmes occasionnels de raisonnement causal où les effets peuvent précéder les causes, comme une porte qui s'ouvre avant que la poignée ne soit enfoncée. L'entreprise travaille activement à relever ces défis et à améliorer les capacités de raisonnement du modèle concernant les environnements physiques.

Position sur le Marché et Valorisation

Runway, fondée en 2018, a atteint une valorisation de 3,55 milliards de dollars selon PitchBook. Les investisseurs de la société comprennent General Atlantic, Baillie Gifford, NVIDIA et Salesforce Ventures. Runway a obtenu une place sur la liste Disruptor 50 de CNBC cette année, reconnaissant son impact sur l'industrie technologique. L'entreprise mène des recherches sur l'IA et développe des modèles vidéo et mondiaux entraînés sur des données d'observation pour mieux refléter le fonctionnement du monde physique.

Accessibilité et Tarification

Gen-4.5 est disponible à des prix comparables dans tous les plans d'abonnement, rendant la génération vidéo de pointe accessible aux créateurs et aux organisations de toutes tailles. Le modèle maintient une rentabilité tout en offrant une qualité supérieure, ce qui représente une démarche stratégique visant à démocratiser la technologie vidéo IA avancée. L'approche de déploiement progressif permet à Runway de gérer les demandes d'infrastructure tout en recueillant les commentaires des utilisateurs pour une amélioration continue.

Implications Futures

Le succès de Gen-4.5 démontre que des équipes de recherche en IA plus petites et spécialisées peuvent rivaliser efficacement avec de grandes entreprises technologiques grâce à une innovation ciblée et des méthodologies de recherche efficaces. Ce développement suggère que le paysage de la génération vidéo par IA pourrait évoluer au-delà de la consolidation autour de quelques acteurs majeurs, favorisant une plus grande diversité et innovation dans le domaine.

La réalisation de Runway avec Gen-4.5 établit de nouvelles normes pour la génération d'actions dynamiques et contrôlables, la cohérence temporelle et la contrôlabilité précise dans divers modes de génération. À mesure que la technologie continue de mûrir, l'intégration des capacités de génération vidéo dans les flux de travail créatifs devrait transformer la création de contenu dans les domaines du divertissement, de la publicité, de l'éducation et des applications d'entreprise. Le modèle représente une étape importante vers des systèmes d'IA plus sophistiqués capables de comprendre et de simuler la physique et la dynamique du monde réel.