Runway 的 Gen-4.5 聲稱在 AI 影片生成中名列前茅,超越科技巨頭

December 05, 2025
Runway
6 min

新聞摘要

Runway,一家人工智慧開發公司,宣布推出 Gen-4.5。這是一個突破性的影片生成模型,聲稱在獨立基準測試中名列前茅,超越了 OpenAI 的 Sora 2 和 Google 的 Veo 3。該模型在 Artificial Analysis Text-to-Video 排行榜上獲得了前所未有的 1,247 分 Elo 評分,確立了其作為世界上評級最高的影片生成系統的地位。

Runway Gen-4.5 超越產業巨頭

2025 年 12 月 1 日,Runway 公布了 Gen-4.5,標誌著人工智慧影片生成技術的一個重要里程碑。該模型已將 Google 的 Veo 3 擠下王座,Veo 3 現在排名第二,同時將 OpenAI 的 Sora 2 Pro 推至獨立 Video Arena 排行榜的第七位。考慮到 Runway 相對較小的團隊(約 100 名員工)與萬億美元級別的科技公司競爭,這項成就尤其引人注目。

技術優勢與創新

Gen-4.5 代表了在預訓練資料效率和後訓練技術方面的重大進步。該模型擅長理解複雜的運動序列、細緻的攝影技巧、事件時序和微妙的氛圍變化。根據 Runway 的官方聲明,該系統實現了前所未有的物理準確性,物體以逼真的重量、動量和力量移動。液體以適當的動力學流動,並且表面細節以卓越的保真度呈現。

該模型完全在 NVIDIA GPU 上開發,利用 Hopper 和 Blackwell 系列晶片,以優化初始研發、預訓練、後訓練和推論階段的效能。與 NVIDIA 的這次合作推動了影片擴散模型優化的界限,在訓練效率和推論速度之間取得了平衡,而沒有犧牲品質。

先進功能與特色

Gen-4.5 展示了卓越的提示理解能力,能夠準確地解釋複雜的指令並將其納入生成的影片中。該系統在整個影片序列中保持時間一致性,確保連貫的敘事和逼真的物理模擬。與之前表現出過於樂觀行為的模型不同,Gen-4.5 尊重真實世界的物理原理。例如,如果籃球運動員投籃不中,球會自然地從籃板上彈回,而不是傳送到籃框中。

該模型以高畫質產生電影級且高度逼真的輸出,為創作者提供前所未有的視覺保真度和創作控制。儘管在功能上有了飛躍,Gen-4.5 仍保持了其前身 Gen-4 的速度和效率,在不影響效能的情況下提供了突破性的品質。

產業影響與早期採用

Gen-4.5 的早期合作夥伴包括 Target、廣告公司 Wieden+Kennedy、BBC 和遊戲開發商 Ubisoft 等主要組織。該模型正在逐步向用戶推出,並將在公告發布後的幾天內擴展到所有客戶。Runway 計劃將所有現有的控制模式(包括圖像轉影片、關鍵影格和影片轉影片)整合到 Gen-4.5 中。

執行長 Cristóbal Valenzuela 強調了這項成就的重要性,他表示,該團隊透過專注、勤奮的工作,成功地超越了萬億美元的公司。該模型在內部被命名為「David」,指的是聖經中大衛和歌利亞的故事,象徵著這家新創公司挑戰產業巨頭的能力。Valenzuela 還對確保人工智慧開發不會被少數大型企業壟斷表示興奮。

競爭態勢

Gen-4.5 的發布加劇了人工智慧影片生成市場的競爭。OpenAI 的 Sora 2 於 2025 年 9 月發布,強調物理上合理的運動和同步音訊生成,重點是透過專用的 iOS 應用程式進行社群媒體整合。Google 的 Veo 3 具有原生音訊整合和更長的影片生成功能,透過與 Google Cloud 和 YouTube 的整合,鎖定企業應用。

Runway 的 Gen-4.5 透過卓越的提示遵循度、運動品質和物理模擬準確性脫穎而出,這已透過 Video Arena 排行榜上的獨立盲測得到驗證。該模型能夠處理多樣化的生成模式,同時保持高視覺品質,使其成為尋求電影級輸出的創作者的首選。

技術限制與未來發展

儘管取得了進展,Runway 承認 Gen-4.5 存在影片生成模型常見的限制。這些限制包括偶爾出現的因果推理問題,即效果可能先於原因,例如門在把手被按下之前打開。該公司正在積極努力解決這些挑戰,並增強模型對物理環境的推理能力。

市場地位與估值

Runway 成立於 2018 年,根據 PitchBook 的數據,其估值已達到 35.5 億美元。該公司的投資者包括 General Atlantic、Baillie Gifford、NVIDIA 和 Salesforce Ventures。Runway 今年在 CNBC 的 Disruptor 50 強榜單上佔據一席之地,表彰其對科技產業的影響。該公司進行人工智慧研究,並開發基於觀測數據訓練的影片和世界模型,以更好地反映物理世界的運作方式。

可訪問性與定價

Gen-4.5 在所有訂閱方案中均以相當的價格提供,使世界領先的影片生成技術能夠為各種規模的創作者和組織所用。該模型在保持成本效益的同時提供卓越的品質,代表著一種將先進人工智慧影片技術民主化的戰略舉措。逐步推出的方法使 Runway 能夠管理基礎設施需求,同時收集用戶回饋以進行持續改進。

未來影響

Gen-4.5 的成功表明,規模較小、專業化的人工智慧研究團隊可以透過專注的創新和高效的研究方法與大型科技公司有效競爭。這一發展表明,人工智慧影片生成領域可能會超越圍繞少數主要參與者的整合,從而在該領域促進更大的多樣性和創新。

Runway 在 Gen-4.5 方面的成就為動態、可控的動作生成、時間一致性和跨多樣化生成模式的精確可控性設定了新標準。隨著技術的不斷成熟,影片生成功能與創意工作流程的整合預計將改變娛樂、廣告、教育和企業應用中的內容創作。該模型代表著朝著更複雜的人工智慧系統邁出的重要一步,這些系統能夠理解和模擬真實世界的物理和動力學。