Anthropic تكشف عن Claude Opus 4.6: فرق وكلاء ثورية وسياق بمليون رمز يحولان مشهد الذكاء الاصطناعي للمؤسسات
ملخص الأخبار
كشفت شركة Anthropic عن Claude Opus 4.6 يوم الخميس 5 فبراير 2026 (بتوقيت المحيط الهادئ)، مما يمثل تقدمًا كبيرًا في قدرات الذكاء الاصطناعي للمؤسسات. يتميز النموذج الرائد الجديد بنافذة سياق ثورية تبلغ مليون رمز، ووظيفة "فرق الوكلاء" الثورية، وأداءً متطورًا عبر معايير البرمجة والتحليل المالي والعمل المعرفي، مما يضعه كمنافس مباشر لنموذج GPT-5.2 من OpenAI.
Anthropic تطلق Claude Opus 4.6: الذكاء الاصطناعي للمؤسسات يقفز قفزة نوعية مع فرق الوكلاء وسياق المليون رمز
سان فرانسيسكو، 5 فبراير 2026 — أطلقت شركة Anthropic نموذج Claude Opus 4.6 صباح يوم الخميس (بتوقيت المحيط الهادئ)، مقدمة ما تصفه الشركة بأنه تحول نموذجي في الذكاء الاصطناعي للمؤسسات. يقدم الإصدار الأخير من نموذجها الرائد قدرات غير مسبوقة في التنفيذ المستقل للمهام، والاستدلال الممتد، وسير العمل التعاوني للذكاء الاصطناعي.
نافذة السياق الثورية توسع قدرات الذكاء الاصطناعي
يصبح Claude Opus 4.6 أول نموذج في عائلة Opus من Anthropic يدعم نافذة سياق تبلغ مليون رمز، مما يضعه جنبًا إلى جنب مع نماذج Gemini من Google في فئة السياق الطويل للغاية. يسمح هذا التوسع الهائل للنموذج بمعالجة ما يقرب من 1500 صفحة من النصوص، أو 30 ألف سطر من التعليمات البرمجية، أو أكثر من ساعة من محتوى الفيديو في استعلام واحد.
أظهر النموذج أداءً استثنائيًا على معيار MRCR v2، محققًا دقة بنسبة 76٪ في مهام استرجاع المعلومات "الإبرة في كومة قش"، مقارنة بـ 18.5٪ فقط لسلفه Claude Sonnet 4.5. وفقًا لشركة Anthropic، يمثل هذا تحولًا نوعيًا في القضاء على "تدهور السياق" - وهو تدهور أداء النموذج عبر المحادثات الممتدة.
فرق الوكلاء: معالجة متوازية لسير العمل المعقد
يمثل تقديم "فرق الوكلاء" تغييرًا معماريًا أساسيًا في كيفية تعامل Claude مع المهام المعقدة. بدلاً من التنفيذ المتسلسل للمهام بواسطة وكيل واحد، يمكن لـ Opus 4.6 الآن نشر وكلاء متخصصين متعددين يعملون بالتوازي، كل منهم يتعامل مع مكونات مميزة مع التنسيق مباشرة مع بعضهم البعض.
شبه سكوت وايت، رئيس قسم المنتجات للمؤسسات في Anthropic، هذه الوظيفة بإدارة فريق بشري موهوب. وأوضح وايت في مقابلة مع TechCrunch: "يمكنك تقسيم العمل عبر وكلاء متعددين - كل منهم يمتلك جزءه وينسق مباشرة مع الآخرين". هذه القدرة متاحة حاليًا في معاينة بحثية لمستخدمي واجهة برمجة التطبيقات وعملاء الاشتراك.
هيمنة المعايير عبر المجالات المهنية
وضع Claude Opus 4.6 سجلات أداء جديدة عبر العديد من التقييمات القياسية للصناعة:
التميز في البرمجة: سجل النموذج 65.4٪ على Terminal-Bench 2.0، وهو أعلى درجة تم تسجيلها على الإطلاق في هذا التقييم البرمجي الوكيل. كما أنه يتفوق على المنافسين في معيار استخدام الكمبيوتر الوكيل OSWorld، مسجلاً 72.7٪ مقارنة بـ 66.3٪ لـ Opus 4.5.
التحليل المالي والقانوني: على GDPval-AA، الذي يقيس الأداء في العمل المعرفي ذي القيمة الاقتصادية، حقق Opus 4.6 1606 نقطة Elo - متفوقًا على GPT-5.2 من OpenAI بحوالي 144 نقطة Elo وعلى سلفه بـ 190 نقطة. كما وصل النموذج إلى 90.2٪ على BigLaw Bench، وهي أعلى درجة لأي نموذج Claude في مهام الاستدلال القانوني.
حل المشكلات الجديدة: ربما الأكثر إثارة للإعجاب، سجل Opus 4.6 نسبة 68.8٪ على معيار ARC AGI 2، الذي يختبر المشكلات التي يسهل على البشر حلها ولكنها صعبة للغاية على أنظمة الذكاء الاصطناعي. يمثل هذا تحسنًا بنسبة 83٪ مقارنة بنتيجة Opus 4.5 البالغة 37.6٪.
استرجاع المعلومات: حقق النموذج أعلى درجة في الصناعة على BrowseComp، مما يدل على قدرة فائقة على تحديد المعلومات التي يصعب العثور عليها عبر الويب.
تكامل Microsoft Office يتعمق
أعلنت شركة Anthropic عن ترقيات كبيرة لتكاملاتها مع مجموعة Office. يمكن لـ Claude في Excel الآن التعامل مع مهام أطول وأكثر تعقيدًا وتطبيق تحويلات متعددة الخطوات في عملية واحدة دون الحاجة إلى تفسيرات هيكلية صريحة.
كشفت الشركة أيضًا عن Claude في PowerPoint كمعاينة بحثية، مما يمكّن الذكاء الاصطناعي من قراءة تخطيطات الشرائح الحالية والخطوط والقوالب الخاصة بالشركات، ثم إنشاء أو تحرير العروض التقديمية التي تحافظ على اتساق العلامة التجارية. هذا التكامل متاح في الإصدار التجريبي لعملاء خطط Max و Team و Enterprise.
ضوابط API متقدمة لمرونة المطورين
يقدم Opus 4.6 العديد من الميزات المتطورة لمطوري واجهة برمجة التطبيقات:
التفكير التكيفي: يمكن للنموذج تحديد ما إذا كان سيستخدم استدلالًا أعمق مقابل استجابات سريعة بشكل مستقل، باستخدام أدلة السياق لموازنة الجودة مقابل زمن الاستجابة والتكلفة.
مستويات الجهد: يكتسب المطورون تحكمًا صريحًا من خلال أربعة إعدادات للجهد (منخفض، متوسط، مرتفع، وأقصى)، مما يسمح بمقايضات دقيقة بين الذكاء والسرعة والنفقات الحسابية.
ضغط السياق: ميزة تجريبية تلخص تلقائيًا أجزاء المحادثة الأقدم عند اقتراب حدود السياق، مما يتيح تفاعلات طويلة للغاية دون تدهور الأداء.
التأثير السوقي واعتماد المؤسسات
أثار الإصدار رد فعل كبير في السوق. شهدت أسهم البرمجيات تقلبات كبيرة في وقت سابق من هذا الأسبوع بعد إعلان Anthropic عن مكونات إضافية خاصة بالصناعة لأداة Cowork الخاصة بها. انخفضت Thomson Reuters بنسبة 15.83٪ يوم الثلاثاء، بينما انخفضت LegalZoom بنسبة تقارب 20٪، حيث قام المستثمرون بتقييم إمكانات الذكاء الاصطناعي في استبدال برامج البحث والتحليل المالي المتخصصة.
على الرغم من هذه المخاوف السوقية، يستمر اعتماد المؤسسات في التسارع. وفقًا لمسح حديث أجرته Andreessen Horowitz، تستخدم 44٪ من المؤسسات حاليًا Anthropic في بيئات الإنتاج - وهي أكبر زيادة حصة لأي مختبر ذكاء اصطناعي رائد منذ مايو 2025.
عمليات النشر الواقعية تبشر بالخير
أفاد شركاء الوصول المبكر بتحقيق مكاسب كبيرة في الإنتاجية. نشرت Rakuten Opus 4.6 لإدارة منظمة مكونة من 50 شخصًا بشكل مستقل، ونجحت في إغلاق 13 مشكلة في يوم واحد. وصفت سارة ساكس، رئيسة قسم الذكاء الاصطناعي في Notion، النموذج بأنه يتطور إلى ما هو أبعد من كونه أداة ليصبح "متعاونًا قادرًا حقًا".
لاحظ مايكل ترويل، الشريك المؤسس لمنصة البرمجة بالذكاء الاصطناعي Cursor، مثابرة النموذج على المشكلات الصعبة: "يتفوق Claude Opus 4.6 في أصعب المشكلات. إنه يُظهر مثابرة أكبر، ومراجعة أقوى للكود، والقدرة على البقاء في المهام الطويلة حيث تميل النماذج الأخرى إلى الاستسلام".
التسعير والتوافر
حافظت Anthropic على هيكل تسعيرها التنافسي عند 5 دولارات لكل مليون رمز إدخال و 25 دولارًا لكل مليون رمز إخراج. النموذج متاح فورًا من خلال claude.ai، و Claude API (معرف النموذج: claude-opus-4-6)، وجميع منصات الحوسبة السحابية الرئيسية بما في ذلك Amazon Web Services و Google Cloud و Microsoft Azure.
يتم أيضًا دمج النموذج في GitHub Copilot ويتم طرحه تدريجيًا لمستخدمي Copilot Pro و Pro+ و Business و Enterprise.
التزامات السلامة والمواءمة
وفقًا لبطاقة النظام الشاملة لشركة Anthropic، يحتفظ Opus 4.6 بملف تعريف سلامة إجمالي يساوي أو أفضل من أي نموذج رائد آخر، مع معدلات منخفضة للسلوك غير المتوافق عبر تقييمات السلامة. تؤكد الشركة أن السلامة لم يتم التضحية بها مقابل مكاسب الأداء.
سياق الصناعة والمنافسة
يأتي الإطلاق بعد 72 ساعة فقط من إصدار Codex من OpenAI، مما يؤكد تسارع وتيرة المنافسة في أدوات تطوير الذكاء الاصطناعي. قال وايت لوسائل الإعلام إن Anthropic حولت Claude من "نموذج يمكنك التحدث إليه لإنجاز مهمة صغيرة جدًا" إلى "شيء يمكنك تسليمه عملًا حقيقيًا مهمًا".
يضع هذا الإصدار شركة Anthropic في عصر "العمل عن بعد" الذي وصفه وايت، حيث يقوم العاملون المعرفيون بشكل متزايد بتفويض مهام مهنية جوهرية لأنظمة الذكاء الاصطناعي القادرة على التنفيذ المستقل بأقل قدر من الإشراف.
يمثل Claude Opus 4.6 عرض الذكاء الاصطناعي الأكثر طموحًا للمؤسسات من Anthropic حتى الآن، حيث يجمع بين التطورات التقنية في معالجة السياق، والتنسيق المتوازي للوكلاء، والخبرة المتخصصة في المجال لتحدي الافتراضات السائدة حول دور الذكاء الاصطناعي في سير العمل المهني.