OpenAI 推出 Sora 2 模型與同名社交應用 AI 影片生成迎來音視頻同步時代

October 03, 2025
OpenAI
4 min

摘要

OpenAI於9月30日正式發布新一代AI影片生成模型Sora 2,同時推出配套的iOS社交應用程式Sora。新模型首次實現了AI生成影片與音訊的同步,包括對話和音效的自動生成。該應用程式採用類似TikTok的短影片資訊流設計,目前僅在美國和加拿大上線,並採用邀請制。


技術突破:物理準確性大幅提升

Sora 2在物理模擬、真實感和可控性方面實現了顯著提升。與早期影片模型常常出現物體變形、違反物理規律的問題不同,Sora 2能夠處理複雜的動作場景,如體操動作、滑板技巧和跳水等,並遵循真實世界的物理規則。

OpenAI研究團隊成員Bill Peebles、Rohan Sahai和Thomas Dimson在YouTube直播中展示了模型的各項能力。演示影片包括沙灘排球比賽、滑板技巧表演、體操動作等場景,展現出前所未有的流暢度和真實感。

影音同步:補齊關鍵短板

最引人注目的更新是Sora 2首次支援與影片畫面匹配的AI音訊生成,包括同步對話和音效。這一功能填補了初代Sora模型的重要缺陷。2024年初OpenAI首次公開Sora模型時曾引發業界轟動,但直到2024年12月才向公眾開放。在此期間,Runway、Luma、Kling等競爭對手紛紛推出具備音訊生成能力的影片模型。

社交應用程式:挑戰短影片平台

與Sora 2同步發布的還有名為Sora的iOS應用程式,採用演算法推薦的短影片資訊流設計。該應用程式最具特色的功能是「Cameo」(客串),允許用戶在經過授權後,將自己和朋友的形象插入AI生成的影片中。OpenAI表示已建立嚴格的身份保護措施,防止未經同意使用他人形象。

該應用程式目前採取免費模式,OpenAI表示這是為了讓用戶自由探索其功能。唯一的收費計畫是在高峰期對額外影片生成進行收費。

版權爭議浮現

Sora應用程式發布首日,即有用戶生成了瑪利歐、皮卡丘等受版權保護的遊戲角色影片,引發了版權專家的擔憂。加州大學洛杉磯分校法學教授Mark McKenna指出,如果OpenAI允許輸出受版權保護的內容,除非用戶選擇退出,這種做法可能不符合版權法規定。

此外,有用戶生成了OpenAI CEO Sam Altman在商店盜竊電腦零件的影片,凸顯出該技術在製作虛假內容方面的潛在風險。為應對這些問題,OpenAI表示所有透過Sora應用程式或網站生成的影片都將帶有移動浮水印,並在元資料中標註AI生成來源。

用戶創作熱潮與惡搞現象

Sora 2發布後,中國社交媒體上掀起了AI影片創作熱潮。用戶生成了各類題材的影片,包括古裝劇、現代都市劇、體育賽事等。部分網友甚至製作了中國男足奪得世界盃的虛構場景,以及各種針對Sam Altman的惡搞影片。

市場定位:模型+產品組合拳

分析人士指出,OpenAI的策略已從單純的模型競爭轉向「模型+產品」的組合。當某個技術跨越可用性臨界點後,OpenAI會迅速推出配套應用程式,利用產品壁壘鎖定用戶。這一策略此前已在ChatGPT和程式碼生成工具Codex中得到驗證。

目前Sora應用程式已成為iOS App Store照片與影片類別中下載量最高的應用程式。OpenAI表示希望盡快將服務擴展到更多國家和地區。


讀者在使用該技術時,應注意遵守相關法律法規,尊重他人隱私和智慧財產權。