Runway 的 Gen-4.5 声称在人工智能视频生成领域名列前茅,超越科技巨头

2025-12-05
Runway
6 min

新闻摘要

人工智能开发公司Runway宣布发布Gen-4.5,这是一款突破性的视频生成模型,已在独立基准测试中占据领先地位,超越了OpenAI的Sora 2和谷歌的Veo 3。该模型在Artificial Analysis Text-to-Video排行榜上获得了前所未有的1,247分Elo评分,确立了其作为全球最高评级视频生成系统的地位。

Runway Gen-4.5超越行业巨头

2025年12月1日,Runway发布了Gen-4.5,标志着人工智能视频生成技术的一个重要里程碑。该模型已经取代了谷歌的Veo 3,后者现在排名第二,同时将OpenAI的Sora 2 Pro推至独立Video Arena排行榜的第七位。考虑到Runway相对较小的团队(约100名员工)与万亿美元级的科技公司竞争,这一成就尤其引人注目。

技术优势与创新

Gen-4.5在预训练数据效率和后训练技术方面都取得了显著进展。该模型擅长理解复杂的运动序列、细致的摄影技巧、事件时序和微妙的大气变化。根据Runway的官方公告,该系统实现了前所未有的物理精度,物体以真实的重量、动量和力运动。液体以适当的动力学流动,表面细节以卓越的保真度呈现。

该模型完全在NVIDIA GPU上开发,利用Hopper和Blackwell系列芯片,优化了初始研发、预训练、后训练和推理阶段的性能。与NVIDIA的合作推动了视频扩散模型优化的边界,在不牺牲质量的前提下,平衡了训练效率和推理速度。

高级功能和特性

Gen-4.5展示了卓越的提示理解能力,能够准确地解释并将复杂的指令融入到生成的视频中。该系统在整个视频序列中保持时间一致性,确保连贯的叙事和逼真的物理模拟。与之前表现出过度乐观行为的模型不同,Gen-4.5尊重现实世界的物理原理。例如,如果一名篮球运动员投篮不中,球会自然地从篮板上弹回,而不是瞬间移动到篮筐里。

该模型以高清质量生成电影级和高度逼真的输出,为创作者提供前所未有的视觉保真度和创作控制。尽管在功能上实现了飞跃,Gen-4.5仍保持了其前身Gen-4的速度和效率,在不影响性能的前提下实现了突破性的质量。

行业影响和早期应用

Gen-4.5的早期合作伙伴包括Target、广告公司Wieden+Kennedy、BBC和游戏开发商Ubisoft等主要组织。该模型正在逐步向用户推广,将在发布后的几天内扩展到所有客户。Runway计划将所有现有的控制模式,包括图像到视频、关键帧和视频到视频,集成到Gen-4.5中。

首席执行官Cristóbal Valenzuela强调了这一成就的重要性,他表示,该团队通过专注、勤奋的工作,成功地超越了万亿美元级的公司。该模型内部代号为“David”,指的是圣经中大卫和歌利亚的故事,象征着这家初创公司挑战行业巨头的能力。Valenzuela还表达了对确保人工智能开发不被少数大型公司垄断的兴奋之情。

竞争格局

Gen-4.5的发布加剧了人工智能视频生成市场的竞争。OpenAI的Sora 2于2025年9月发布,强调物理上合理的运动和同步音频生成,重点是通过专门的iOS应用程序进行社交媒体集成。谷歌的Veo 3具有原生音频集成和更长的视频生成能力,通过与Google Cloud和YouTube集成,面向企业应用。

Runway的Gen-4.5通过卓越的提示遵循、运动质量和物理模拟精度脱颖而出,这已通过Video Arena排行榜上的独立盲测得到验证。该模型能够处理多种生成模式,同时保持高视觉质量,使其成为寻求电影级输出的创作者的首选。

技术局限性和未来发展

尽管取得了进展,Runway承认Gen-4.5存在视频生成模型常见的局限性。这些包括因果推理方面偶尔出现的问题,例如门在把手被按下之前就打开。该公司正在积极努力解决这些挑战,并增强模型对物理环境的推理能力。

市场地位和估值

Runway成立于2018年,根据PitchBook的数据,其估值已达到35.5亿美元。该公司的投资者包括General Atlantic、Baillie Gifford、NVIDIA和Salesforce Ventures。Runway今年荣登CNBC的Disruptor 50榜单,表彰其对科技行业的影响。该公司进行人工智能研究,并开发基于观测数据训练的视频和世界模型,以更好地反映物理世界的运作方式。

可访问性和定价

Gen-4.5在所有订阅计划中均以相当的价格提供,使世界领先的视频生成技术能够被各种规模的创作者和组织所使用。该模型在保持成本效益的同时提供卓越的质量,代表着一种将先进人工智能视频技术民主化的战略举措。逐步推广的方法使Runway能够在管理基础设施需求的同时收集用户反馈,以实现持续改进。

未来影响

Gen-4.5的成功表明,规模较小、专业化的人工智能研究团队可以通过专注的创新和高效的研究方法与大型科技公司有效竞争。这一发展表明,人工智能视频生成领域可能会超越围绕少数主要参与者的整合,从而促进该领域更大的多样性和创新。

Runway凭借Gen-4.5取得的成就,为动态、可控的动作生成、时间一致性和跨多种生成模式的精确可控性设定了新标准。随着技术的不断成熟,视频生成能力与创意工作流程的集成预计将改变娱乐、广告、教育和企业应用领域的内容创作。该模型代表着朝着更复杂的人工智能系统迈出的重要一步,这些系统能够理解和模拟现实世界的物理和动力学。