知能革命:Google DeepMindのデュアルモデルAIシステムがロボットに推論能力と検索能力を付与
概要
Google DeepMindは先日、新しいGemini Robotics 1.5とGemini Robotics-ER 1.5モデルを発表しました。これは、AI技術が初めて物理的なロボットの世界に本格的に進出したことを示しています。これら2つのモデルはデュアルアーキテクチャ設計を採用しており、ロボットは指示を実行するだけでなく、推論、計画、そして自律的なツール使用が可能になり、より高度な物理世界とのインタラクション能力を実現します。
画期的なデュアルモデルアーキテクチャ
Gemini Robotics-ER 1.5とGemini Robotics 1.5は、革新的なデュアルアーキテクチャ設計を採用しており、両者が連携して強力なロボットAIシステムを形成します。Gemini Robotics-ER 1.5は「高レベルの脳」として計画と物理空間での意思決定を担当し、Gemini Robotics 1.5は視覚と言語理解を具体的な行動に変換します。このアーキテクチャにより、ロボットは、オンラインで検索した地域のゴミ分別ルールに基づいてゴミを分類したり、天気予報に基づいて荷造りしたりするなど、複雑な多段階タスクを実行できるようになります。
反応から推論への大きな転換
Google DeepMindのロボティクス部門責任者であるCarolina Parada氏は、新しいシステムが「単一のステップに集中するだけでなく、複数のステップを先読みして考える」ことを可能にすると指摘しています。単純な指示しか実行できなかった前世代の製品とは異なり、新しいシステムは、まず計画を立ててから行動するという、人間の思考方法により近いロボットの行動を可能にします。
クロスロボット学習能力
今回のアップデートがもたらすもう一つの画期的な変化は、「クロスロボット学習」機能です。DeepMindは、双腕ロボットALOHA2が習得したスキルが、追加設定なしでFrankaロボットやApptronikのApolloヒューマノイドロボットに適用できることを実証しました。これは、同じモデルセットが異なる種類のロボットを制御し、経験を伝達できることを意味し、ロボット技術の発展速度を大幅に加速させます。
インテリジェントなウェブ検索とツール使用
Gemini Robotics-ER 1.5は、複雑な課題を評価し、ネイティブにツール(Google検索など)を呼び出して情報を検索し、問題を克服するための詳細な段階的計画を作成することができます。これにより、ロボットは人間のように情報を検索し、実際のタスクに応用できるようになり、ロボットの能力範囲が大幅に拡大します。
安全性と透明性の向上
DeepMindは開発プロセスにおいて安全性を最優先事項としています。両モデルには、ロボットの行動をより予測可能で説明可能にするための安全対策と説明可能性機能が搭載されています。Googleはまた、セマンティックな安全性を評価・改善するためのASIMOVベンチマークのアップグレード版をリリースしており、Gemini Robotics-ER 1.5は安全性評価において最先端のパフォーマンスを示しました。
開発者向け利用可能性
今回のアップデートは開発者向けに公開されており、Gemini Robotics-ER 1.5はGoogle AI StudioのGemini APIを通じてテスト可能ですが、Gemini Robotics 1.5は現在、特定のパートナーにのみ提供されています。これは、より広範なロボット技術の革新とアプリケーション開発を促進するでしょう。
汎用人工知能に向けた重要なマイルストーン
Google DeepMindは、今回の発表を物理世界における汎用人工知能(AGI)の解決に向けた重要な一歩と位置付けています。自律的な能力を導入することで、Googleは単にコマンドに応答するだけのモデルを超え、真に推論し、計画し、自律的にツールを使用し、汎化できるシステムを構築しています。
業界への影響と将来の展望
この画期的な技術は、複数の産業を再構築する可能性を秘めています。医療分野では、アシスタントロボットが患者の様々なニーズに応じて支援を提供でき、家庭環境では、よりスマートなパーソナルアシスタントとなることができます。ロボット技術はまだ初期段階にありますが、今回の発表は、未来が単に「より賢いAI」だけでなく、「私たちと共に生活し、行動できるAI」に関するものであることを示しています。
Google DeepMindがロボット技術と人工知能の融合を推進し続けるにつれて、仮想知能と物理世界との間のギャップをさらに縮める、より多くの革新的なアプリケーションの出現が期待されます。