DeepMind、SIMA 2を発表:Gemini搭載の仮想世界AIエージェントが推論と自律学習でブレークスルーを達成

November 15, 2025
Google DeepMind
4 min

概要

Google DeepMindは、米国東部時間2025年11月13日、「SIMA 2(Scalable Instructable Multiworld Agent:スケーラブルで指示可能なマルチワールドエージェント)」を発表した。これはGeminiモデルを基盤とする次世代AIエージェントであり、3D仮想世界内で指示を実行できるだけでなく、推論・対話・自己学習能力も備えている。これは汎用人工知能(AGI)研究における重要な進展を示しており、SIMA 2は前世代と比べてタスク達成率が大幅に向上し、これまで訓練したことのないゲーム環境でも動作可能となり、将来のロボット技術の基盤を築いている。


技術的ブレークスルー:指示追従から推論・意思決定へ

SIMAの初版は2024年3月にリリースされ、『左に曲がる』『はしごを登る』『マップを開く』といった600以上の基本スキルを複数の商用ゲーム内で実行できた。このシステムは画面を「視聴」し、仮想キーボードおよびマウスを操作することで、人間プレイヤーと同様の方法でゲームをプレイしていた。

SIMA 2はGemini 2.5 Flash-Liteモデルを統合することで質的な飛躍を遂げた。DeepMind上級研究科学者のジョー・マリノ氏がメディア向け発表会で述べたところによると、SIMA 2は前世代と比べて「段階的な変化と改善」を実現している。このシステムは単に指示に応答するだけでなく、高次の目標を理解し、複雑な推論を行い、ユーザーに対して自らの行動意図や実行手順を説明することも可能となった。

テストにおいて、SIMA 2は前世代を大きく上回る性能を示した。複雑なタスクに対する成功率は、SIMA 1が31%だったのに対し、人間プレイヤーは71%を記録していたが、SIMA 2はこのギャップを大幅に縮め、複数の評価タスクで人間レベルに近いパフォーマンスを達成した。

環境横断的な汎化能力

SIMA 2が最も注目される特徴の一つは、その卓越した汎化能力である。このシステムは、訓練済みの8つの商用ゲーム(『No Man’s Sky(ノーマンズスカイ)』『Valheim(ヴァルヘイム)』『Goat Simulator 3(山羊シミュレーター3)』など)だけでなく、一度も見たことのないゲーム環境でもタスクを成功裏に実行できる。

バイキング生存ゲーム『ASKA』およびMinecraftの研究用実装版『MineDojo』を用いたテストでは、SIMA 2は強力な転移学習能力を示した。例えば、あるゲームで学んだ「採掘」という概念を、別のゲームの「収穫」シーンに応用できる。このような概念の転移能力は、ヒトのような認知機能を実現する上で極めて重要な基盤となる。

さらに印象深いのは、SIMA 2がDeepMindのもう一つの研究成果であるGenie 3(単一画像またはテキストプロンプトからリアルタイム3Dシミュレーションワールドを生成できるシステム)と組み合わされた際、新たに生成された仮想環境内で迅速に位置を特定し、指示を理解して意味のある行動を実行できることだ。

自己改善メカニズム

SIMA 2の画期的な革新点は、その自己学習能力にある。人間のゲームプレイデータに完全に依存して訓練されていたSIMA 1とは異なり、SIMA 2は初期訓練段階で人間によるデモンストレーションをベースラインとして利用した後、自律学習モードに移行できる。

このシステムでは、別のGeminiモデルが新しいタスクを生成し、独立した報酬モデルがエージェントのパフォーマンスを評価する。これらの自己生成された経験データを活用し、SIMA 2は自らの失敗から学び、試行錯誤を通じて継続的に改善していく。本質的には、人間のフィードバックではなくAIからのフィードバックに基づいて、自ら新しい行動を教える仕組みとなっている。

このような自己改善のループは、将来的な人工知能の発展への道を切り開き、最小限の人間介入で学習・成長できるエージェント、すなわちエンボディドAI分野におけるオープンエンド学習者を実現する。

マルチモーダルインタラクション体験

SIMA 2は多様なインタラクション方式をサポートしており、ユーザーはテキストチャット、音声対話、あるいはゲーム画面上への描画を通じてエージェントを制御できる。このシステムは複数言語の指示を理解でき、絵文字の意味を正しく解釈してタスクを実行することさえ可能だ。

TechCrunchの取材に対し、DeepMind上級研究科学者のジェーン・ワン氏は、SIMA 2の応用範囲はゲーム領域をはるかに超えるものだと述べた。研究チームは、この取り組みがより汎用的なエージェントの実現や、現実世界のロボット技術の向上に向けて重要な一歩であると考えている。

ロボット工学への架け橋

DeepMindはSIMA 2を、次世代エージェント開発の鍵と位置づけており、これらエージェントはウェブブラウザよりも複雑な環境でオープンエンドなタスクを実行できることが期待されている。長期的には、この技術は現実世界のロボットシステムを駆動することを目指している。

メディア発表会で、上級研究エンジニアのフレデリック・ベス氏は、SIMA 2は低レベルな運動制御器ではなく、高次の意思決定者として捉えるべきだと説明した。「ロボティクスの観点から見ると、これは『何を、なぜ行うか』を解決するものであり、『関節トルクをどう制御するか』ではない。」このような階層構造は、現在多くの研究室で採用されているシステム設計アプローチ——上位に計画層、下位に知覚・制御層を置く——を反映している。

SIMA 2が学習するナビゲーション、ツール使用、協調タスク実行といったスキルは、まさに将来の現実世界におけるロボットパートナーに求められる基本的な構成要素である。

現在の限界と今後の方向性

顕著な進展を遂げたものの、SIMA 2には依然としていくつかの課題が残っている。特に、多段階にわたる高度な推論と目標検証を必要とする長期的かつ複雑なタスクでは困難を伴う。また、インタラクション時の記憶が比較的短く、低遅延インタラクションを実現するために限定されたコンテキストウィンドウを使用せざるを得ない。仮想キーボードとマウスインターフェースを通じて精密な低レベル操作を行うことや、複雑な3Dシーンにおける堅牢な視覚理解を達成することは、この分野全体で引き続き探求が続くオープンな課題である。

開発方針

DeepMindは、SIMA 2の責任ある開発へのコミットメントを特に強調している。チームは「責任ある開発・イノベーションチーム」と緊密に連携し、SIMA 2を限定的な研究プレビュー版としてリリースし、少数の研究者およびゲーム開発者のみに早期アクセスを提供している。このアプローチにより、この新領域を探索しながらも、リスクとその適切な緩和策に関する理解を深めるための重要なフィードバックおよび学際的視点を集めることを目的としている。

公式情報によると、完全版の技術レポートは近日中に公開される予定である。このプロジェクトはCoffee Stain、Hello Games、Thunderful Gamesなど複数のゲーム開発会社の協力を得ており、『No Man’s Sky』『Valheim』『Goat Simulator 3』『Teardown』などの商用ゲームを用いて訓練および評価が行われている。

SIMA 2の登場は、AI研究が専門特化型システムから汎用エージェントへと向かう重要な転換点を示しており、将来のデジタルアシスタントおよび物理的ロボットの知能化発展に向けた堅固な基盤を築いている。