DeepMind تُطلق SIMA 2: عامل ذكاء اصطناعي في العوالم الافتراضية مدعوم بـ Gemini يحقق تقدماً في الاستنتاج والتعلّم الذاتي

November 15, 2025
Google DeepMind
5 min

الملخص

أطلقت Google DeepMind في 13 نوفمبر 2025 (بتوقيت شرق الولايات المتحدة) نظام SIMA 2 (الوكلاء الذكية القابلة للتوسعة والقابلة للتوجيه عبر عوالم متعددة)، وهو جيل جديد من الوكلاء الاصطناعيين المدعوم بنموذج Gemini. لا يقتصر هذا النظام على تنفيذ الأوامر في عوالم افتراضية ثلاثية الأبعاد فحسب، بل يتمتع أيضًا بقدرات الاستدلال والحوار والتعلّم الذاتي، مما يمثل تقدمًا مهمًا في أبحاث الذكاء الاصطناعي العام (AGI). وقد سجّل SIMA 2 تحسنًا ملحوظًا في معدل إنجاز المهام مقارنة بالإصدار السابق، كما أظهر قدرته على العمل في بيئات ألعاب لم يُدرَّب عليها من قبل، مما يمهّد الطريق لتقنيات الروبوتات المستقبلية.


الاختراق التقني: من اتباع الأوامر إلى اتخاذ القرارات بالاستدلال

صدر الإصدار الأول من SIMA في مارس 2024، وكان قادرًا على تنفيذ أكثر من 600 مهارة أساسية في ألعاب تجارية متعددة، مثل "الدوران يسارًا" و"تسلق السلم" و"فتح الخريطة". يعمل هذا النظام من خلال "مشاهدة" الشاشة واستخدام لوحة مفاتيح وفأرة افتراضيتين لتنفيذ الإجراءات، مُحاكيًا طريقة لعب البشر.

حقق SIMA 2 قفزة نوعية من خلال دمج نموذج Gemini 2.5 Flash-Lite. ووفقًا لما ذكره جو مارينو، الباحث العلمي الرئيسي في DeepMind، خلال المؤتمر الصحفي، فإن SIMA 2 يمثل "تحسنًا وتغييرًا نوعيًّا" مقارنة بالإصدار السابق. لم يعد النظام يكتفي بالاستجابة للأوامر فقط، بل أصبح بإمكانه فهم الأهداف عالية المستوى، وإجراء استدلالات معقدة، وشرح نيّاته وخطوات تنفيذه للمستخدم.

في الاختبارات، أظهر SIMA 2 أداءً أفضل بكثير من سابقه. ففي المهام المعقدة، حقق SIMA 1 نسبة نجاح بلغت 31% فقط، بينما وصل أداء اللاعبين البشريين إلى 71%. أما SIMA 2 فقد قلّص هذه الفجوة بشكل كبير، ليقترب أداؤه من مستوى البشر في عدة مهام تقييمية.

القدرة على التعميم عبر البيئات المختلفة

تتميّز SIMA 2 بأحد أبرز خصائصها: قدرتها الاستثنائية على التعميم. فالنظام لا يعمل فقط في الألعاب التجارية الثمانية التي تم تدريبه عليها (مثل No Man’s Sky وValheim وGoat Simulator 3)، بل يستطيع أيضًا تنفيذ المهام بنجاح في بيئات ألعاب جديدة تمامًا لم يسبق له رؤيتها.

في اختبارات أجريت على لعبة البقاء الفايكينغية ASKA وعلى النسخة البحثية من ماينكرافت المعروفة باسم MineDojo، أظهر SIMA 2 قدرة قوية على التعلّم المنقول (Transfer Learning). فعلى سبيل المثال، استطاع تطبيق مفهوم "التعدين" الذي تعلّمه في لعبة ما على سيناريو "الحصاد" في لعبة أخرى، وهذه القدرة على نقل المفاهيم تُعد حجر الأساس لتحقيق الإدراك المشابه للبشر.

والأكثر إثارة للإعجاب هو أن SIMA 2، عند دمجه مع نظام Genie 3 (وهو نظام آخر من أبحاث DeepMind قادر على إنشاء عوالم افتراضية ثلاثية الأبعاد تفاعلية انطلاقًا من صورة واحدة أو نص توجيهي)، يستطيع تحديد موقعه بسرعة في بيئات افتراضية جديدة تمامًا، وفهم التعليمات، وتنفيذ إجراءات ذات معنى.

آلية التحسين الذاتي

تكمن الابتكارات الثورية في SIMA 2 في قدرته على التعلّم الذاتي. فخلافًا لـ SIMA 1 الذي اعتمد كليًّا على بيانات ألعاب بشرية للتدريب، يستخدم SIMA 2 في مرحلته الأولى أمثلة بشرية كخط أساس، ثم ينتقل بعد ذلك إلى وضع التعلّم الذاتي.

يعمل النظام من خلال استخدام نموذج آخر من Gemini لإنشاء مهام جديدة، ثم يقوم نموذج مكافآت مستقل بتقييم أداء الوكيل. وباستخدام هذه البيانات التجريبية التي يولدها بنفسه، يستطيع SIMA 2 التعلّم من أخطائه وتحسين أدائه باستمرار عبر المحاولة والخطأ، أي أنه يُعلّم نفسه سلوكيات جديدة تحت إشراف تغذية راجعة من الذكاء الاصطناعي، وليس من البشر.

يمهّد هذا الدوران التحسيني الذاتي الطريق أمام تطور الذكاء الاصطناعي المستقبلي، إذ يصبح بإمكان الوكلاء التعلّم والنمو بأقل قدر ممكن من التدخل البشري، ليصبحوا متعلّمين مفتوحين في مجال الذكاء الاصطناعي المُجسّد (Embodied AI).

تجربة التفاعل متعددة الوسائط

يدعم SIMA 2 طرق تفاعل متعددة، حيث يمكن للمستخدم التحكم بالوكيل عبر الدردشة النصية أو المحادثة الصوتية أو حتى رسم تعليمات مباشرة على شاشة اللعبة. ويمكن للنظام فهم الأوامر بلغات مختلفة، بل وحتى تفسير الرموز التعبيرية (Emojis) بشكل صحيح لتنفيذ المهام.

صرّحت جين وانغ، الباحثة العلمية الرائدة في DeepMind، في مقابلة مع TechCrunch أن تطبيقات SIMA 2 تتجاوز بكثير مجال الألعاب. وترى فريق البحث أن هذا العمل يمثل خطوة مهمة نحو تحقيق وكلاء أكثر عمومية وتحسين الروبوتات في العالم الحقيقي.

جسرٌ نحو تقنيات الروبوتات

تعتبر DeepMind أن SIMA 2 مفتاح تطوير الجيل التالي من الوكلاء القادرين على تنفيذ مهام مفتوحة في بيئات أكثر تعقيدًا من متصفحات الويب. وعلى المدى الطويل، يهدف هذا التكنولوجيا إلى تشغيل أنظمة روبوتات في العالم الحقيقي.

وخلال المؤتمر الصحفي، أوضح المهندس البحثي الرئيسي فريديريك بيس أن SIMA 2 يجب اعتباره "صانع قرارات رفيع المستوى" وليس وحدة تحكم حركية منخفضة المستوى. وأضاف: "من منظور الروبوتيات، فإنه يعالج سؤالي 'ماذا نفعل ولماذا'، وليس 'كيف نتحكم في عزم الدوران للمفاصل'." ويعكس هذا التدرّج النهج المتبع حاليًّا في العديد من المختبرات لبناء الأنظمة: طبقة التخطيط في الأعلى، وطبقة الإدراك والتحكم في الأسفل.

المهارات التي يتعلّمها SIMA 2—مثل التنقّل واستخدام الأدوات وتنفيذ المهام التعاونية—هي بالضبط اللبنات الأساسية التي ستحتاجها روبوتات المستقبل المرافقة لنا في الحياة الواقعية.

القيود الحالية والتوجهات المستقبلية

رغم التقدم الكبير، لا يزال SIMA 2 يواجه بعض التحديات. فما زال النظام يعاني من صعوبات في المهام طويلة الأمد المعقدة التي تتطلب استدلالًا متعدد الخطوات والتحقق من الأهداف. بالإضافة إلى ذلك، فإن ذاكرة التفاعل لديه قصيرة نسبيًّا، ويجب أن يعمل ضمن نافذة سياق محدودة لتحقيق تفاعل منخفض التأخير. كما أن تنفيذ العمليات الدقيقة من خلال واجهة لوحة المفاتيح والفأرة الافتراضية، وتحقيق فهم بصري قوي للمشاهد ثلاثية الأبعاد المعقدة، يظلّان من التحديات المفتوحة التي لا تزال تُستكشف في هذا المجال.

مسار التطوير

شدّدت DeepMind بشكل خاص على التزامها بتطوير SIMA 2 بطريقة مسؤولة. وتعاون الفريق بشكل وثيق مع فريق التطوير والابتكار المسؤول، وأطلق SIMA 2 كنسخة أولية محدودة للأبحاث، متاحة فقط لعدد صغير من الباحثين ومطوري الألعاب. ويهدف هذا النهج إلى جمع ملاحظات حاسمة ووجهات نظر متعددة التخصصات، مع الاستمرار في بناء فهمٍ أعمق للمخاطر وسبل التخفيف المناسبة منها أثناء استكشاف هذا المجال الجديد.

وبحسب المعلومات الرسمية، سيُنشر التقرير التقني الكامل قريبًا. وقد حظي المشروع بدعم تعاوني من عدة شركات تطوير ألعاب، من بينها Coffee Stain وHello Games وThunderful Games، وتم تدريبه وتقييمه على ألعاب تجارية متعددة مثل No Man’s Sky وValheim وGoat Simulator 3 وTeardown.

يمثّل إطلاق SIMA 2 تحولًا مهمًّا في أبحاث الذكاء الاصطناعي من الأنظمة المتخصصة إلى الوكلاء العامين، ويوطّد الأسس لتطوير المساعدات الرقمية والروبوتات الفيزيائية الذكية في المستقبل.