DeepMind 發布 SIMA 2:Gemini 賦能的虛擬世界 AI 智能體實現推理與自主學習突破

November 15, 2025
Google DeepMind
6 min

摘要

Google DeepMind 於 2025 年 11 月 13 日(美東時間)推出了 SIMA 2(可擴展可指令多世界智能體),這是一款由 Gemini 模型驅動的新一代 AI 智能體。該系統不僅能在 3D 虛擬世界中執行指令,還具備推理、對話和自我學習能力,標誌著通用人工智慧(AGI)研究的重要進展。SIMA 2 的任務完成率相比前代有顯著提升,並能夠在從未訓練過的遊戲環境中運作,為未來機器人技術奠定了基礎。


技術突破:從指令跟隨到推理決策

SIMA 的首個版本於 2024 年 3 月推出,能夠在多款商業遊戲中執行超過 600 項基本技能,例如「向左轉」、「爬梯子」、「打開地圖」等。該系統透過「觀看」螢幕並使用虛擬鍵盤和滑鼠進行操作,模擬人類玩家的遊戲方式。

SIMA 2 透過整合 Gemini 2.5 Flash-Lite 模型實現了質的飛躍。根據 DeepMind 資深研究科學家 Joe Marino 在媒體發布會上的介紹,SIMA 2 相比前代在能力上實現了「階躍式變化和改進」。該系統不再僅僅回應指令,而是能夠理解高層次目標,進行複雜推理,並向使用者說明其行動意圖與執行步驟。

在測試中,SIMA 2 的表現顯著優於前代。針對複雜任務,SIMA 1 的成功率僅為 31%,而人類玩家達到 71%。SIMA 2 大幅縮小了這一差距,在多項評估任務中的表現已接近人類水準。

跨環境泛化能力

SIMA 2 最引人注目的特性之一是其出色的泛化能力。該系統不僅能在訓練過的 8 款商業遊戲(包括《無人深空》、《英靈神殿》、《山羊模擬器 3》等)中運作,還能在從未見過的遊戲環境中成功執行任務。

在對維京生存遊戲 ASKA 和 Minecraft 研究實現版本 MineDojo 的測試中,SIMA 2 展現了強大的遷移學習能力。它能將在一個遊戲中學到的「採礦」概念應用到另一個遊戲的「收穫」場景中,這種概念遷移能力是實現類人認知的關鍵基礎。

更令人印象深刻的是,當 SIMA 2 與 DeepMind 另一項研究成果 Genie 3(能夠根據單張圖片或文字提示生成即時 3D 模擬世界的系統)結合時,它能在全新生成的虛擬環境中快速定位、理解指令並執行有意義的行動。

自我改進機制

SIMA 2 的革命性創新在於其自我學習能力。與完全依賴人類遊戲數據訓練的 SIMA 1 不同,SIMA 2 在初始訓練階段使用人類示範作為基線後,能夠轉向自主學習模式。

該系統透過讓另一個 Gemini 模型創建新任務,再由獨立的獎勵模型對智能體的表現進行評分。利用這些自生成的經驗數據,SIMA 2 能夠從自身錯誤中學習,並透過試錯不斷改進,本質上是在 AI 回饋的引導下自我教學新行為,而非依賴人類回饋。

這種自我改進循環為未來人工智慧的發展鋪平了道路,使智能體能在最小人類干預的情況下學習和成長,成為具身 AI 領域的開放式學習者。

多模態互動體驗

SIMA 2 支援多種互動方式,使用者可透過文字聊天、語音對話或在遊戲螢幕上繪圖來控制智能體。系統能理解不同語言的指令,甚至能正確解讀表情符號的含義以執行任務。

DeepMind 資深研究科學家 Jane Wang 在接受 TechCrunch 採訪時表示,SIMA 2 的應用遠超遊戲領域。研究團隊認為,這項工作是實現更通用智能體和改善現實世界機器人的重要一步。

通往機器人技術的橋樑

DeepMind 將 SIMA 2 視為開發下一代智能體的關鍵,這些智能體能夠在比網頁瀏覽器更複雜的環境中執行開放式任務。長遠來看,該技術旨在驅動現實世界的機器人系統。

資深研究工程師 Frederic Besse 在媒體發布會上解釋說,SIMA 2 應被視為高階決策者,而非底層運動控制器。「從機器人學角度思考,它解決的是『做什麼以及為什麼』,而不是『如何控制關節扭力』。」這種分層架構反映了當前許多實驗室建構系統的方式:規劃層在上,感知與控制層在下。

SIMA 2 所學習的技能——導航、工具使用與協作任務執行——正是未來現實世界機器人夥伴所需的基本構建模組。

當前局限與未來方向

儘管取得顯著進展,SIMA 2 仍面臨一些挑戰。該系統在需要大量多步推理與目標驗證的長期複雜任務上仍有困難。此外,它的互動記憶相對較短,必須使用有限的上下文視窗以實現低延遲互動。透過虛擬鍵盤與滑鼠介面執行精確的底層操作,以及實現複雜 3D 場景的穩健視覺理解,仍是整個領域持續探索的開放性挑戰。

開發路徑

DeepMind 特別強調了負責任開發 SIMA 2 的承諾。該團隊與負責任發展與創新團隊密切合作,將 SIMA 2 作為限量研究預覽版發布,僅向少數學者與遊戲開發者提供早期存取權限。此方法旨在收集關鍵回饋與跨學科觀點,在探索這一新領域的同時,持續建立對風險及其適當緩解措施的理解。

根據官方資訊,完整技術報告將於近期發布。該項目獲得包括 Coffee Stain、Hello Games、Thunderful Games 等多家遊戲開發商的合作支援,並已在《無人深空》、《英靈神殿》、《山羊模擬器 3》、《Teardown》等多款商業遊戲中進行訓練與評估。

SIMA 2 的推出標誌著 AI 研究從專業化系統向通用智能體的重要轉變,為未來數位助手與實體機器人的智慧化發展奠定了堅實基礎。