أنثروبيك تقدم كلود سونيت 4.5: برمجة مستقلة لمدة 30 ساعة، وتحديث الحد الأقصى لقدرات كود الذكاء الاصطناعي

October 04, 2025
AnthropicC
5 min

ملخص

أصدرت Anthropic في 29 سبتمبر 2025، نموذج Claude Sonnet 4.5، وهو أقوى نموذج ذكاء اصطناعي للبرمجة للشركة حتى الآن. حقق النموذج 77.2% في اختبار SWE-bench Verified المعياري، متفوقًا على المنتجات المماثلة من OpenAI و Google في مهام هندسة البرمجيات الواقعية. يمكن لـ Claude Sonnet 4.5 العمل بشكل مستقل لأكثر من 30 ساعة، مع الحفاظ على التركيز في المهام المعقدة متعددة الخطوات، بينما كان نموذج Opus 4، الذي صدر في مايو، يعمل لمدة 7 ساعات فقط.

اختراقات الأداء التقني

في اختبار OSWorld المعياري، وصل Claude Sonnet 4.5 إلى 61.4%، وهو تحسن كبير مقارنة بـ 42.2% لـ Claude Sonnet 4 قبل أربعة أشهر. يقيم اختبار OSWorld أداء نماذج الذكاء الاصطناعي في مهام الكمبيوتر الحقيقية، بما في ذلك التنقل في مواقع الويب، وملء جداول البيانات، وإكمال مهام سطح المكتب.

صرح ديفيد هيرشي، باحث في Anthropic، أنه في التجارب المبكرة مع عملاء المؤسسات، لاحظ أن Claude Sonnet 4.5 قادر على البرمجة بشكل مستقل لمدة تصل إلى 30 ساعة، وخلال هذه الفترة لم يقم فقط ببناء التطبيقات، بل قام أيضًا بتكوين خدمات قواعد البيانات، وشراء أسماء النطاقات، وإجراء تدقيقات أمنية SOC 2.

يتفوق النموذج في تخطيط الكود وتصميم الأنظمة، ويتخذ قرارات معمارية وتنظيمية أفضل للكود، كما أظهر تحسينات في هندسة الأمن، مما يوفر ممارسات أمنية أقوى وقدرات اكتشاف الثغرات الأمنية.

التسعير والتوافر

ظل تسعير واجهة برمجة تطبيقات Claude Sonnet 4.5 دون تغيير، حيث يبلغ 3 دولارات لكل مليون رمز إدخال و 15 دولارًا لكل مليون رمز إخراج، وهو نفس سعر سابقه Claude Sonnet 4. لا تزال استراتيجية التسعير هذه أعلى مقارنة بالمنافس GPT-5 (1.25 دولار لكل مليون رمز إدخال، 10 دولارات لكل مليون رمز إخراج)، لكن Anthropic تسعى لتبرير سعرها المرتفع من خلال مزايا الأداء.

النموذج متاح الآن على منصات مثل واجهة الويب Claude.ai، وتطبيقات iOS و Android، و Claude API، و Amazon Bedrock، و Vertex AI من Google Cloud. يمكن للمطورين استدعائه باستخدام سلسلة النموذج claude-sonnet-4-5. تم دمج Claude Sonnet 4.5 أيضًا في GitHub Copilot، وهو متاح لمستخدمي Copilot Pro و Pro+ و Business و Enterprise.

تحديثات النظام البيئي للمنتج

أصدرت Anthropic بالتزامن العديد من ترقيات المنتجات، بما في ذلك ميزة نقاط الحفظ المرتقبة في Claude Code، والتي تسمح للمستخدمين بحفظ التقدم والعودة إلى الحالات السابقة في أي وقت؛ واجهة طرفية جديدة تمامًا؛ وامتداد VS Code الأصلي.

يدعم تطبيق Claude الآن تنفيذ الكود وإنشاء الملفات مباشرة في المحادثات، بما في ذلك جداول البيانات والعروض التقديمية والمستندات. أطلقت Anthropic أيضًا Claude Agent SDK، باستخدام نفس البنية التحتية لـ Claude Code، مما يمكن المطورين من بناء وكلاء الذكاء الاصطناعي الخاصة بهم.

أطلقت الشركة أيضًا مشروع معاينة بحثية لمدة 5 أيام بعنوان "Imagine with Claude" لمشتركي Max، والذي يعرض قدرة نموذج الذكاء الاصطناعي على إنشاء البرامج في الوقت الفعلي، دون الحاجة إلى تحديد الميزات مسبقًا أو كتابة الكود مسبقًا.

ردود فعل الصناعة وتطبيقات الشركات

صرح مايكل ترويل، الرئيس التنفيذي لشركة Cursor، أن Claude Sonnet 4.5 يتفوق في المهام طويلة الأجل، وهذا هو السبب في أن العديد من المطورين الذين يستخدمون Cursor يختارون Claude لحل المشكلات المعقدة. أظهرت التقييمات الأولية لفريق GitHub Copilot تحسينات كبيرة في التفكير متعدد الخطوات وفهم الكود، مما يمكن تجربة وكيل Copilot من التعامل بشكل أفضل مع المهام المعقدة عبر قواعد الكود.

فيما يتعلق بتطبيقات الشركات، أفادت منظمة الأمن HackerOne أن وقت الاستجابة للثغرات الأمنية انخفض بنسبة 44% بعد استخدام Claude Sonnet 4.5. تستخدم المؤسسات المالية مثل Norges Bank Investment Management النموذج أيضًا للتحليل المالي على مستوى الاستثمار، بينما يستخدمه المطورون في Netflix و GitHub للتعامل مع مهام قواعد الكود المعقدة.

تحسينات الأمان

تم إصدار Claude Sonnet 4.5 بموجب إجراءات حماية مستوى أمان الذكاء الاصطناعي 3 (ASL-3)، بما في ذلك مصنفات مصممة لاكتشاف المدخلات والمخرجات الخطرة المحتملة، خاصة المحتوى المتعلق بالأسلحة الكيميائية والبيولوجية والإشعاعية والنووية. وصف مايك كريجر، كبير مسؤولي المنتجات في Anthropic، هذا بأنه "أكبر تحسين أمني في العام ونصف العام الماضيين".

صرحت Anthropic أن هذا هو النموذج الرائد الأكثر توافقًا الذي أصدرته الشركة، وقد أحرز تقدمًا كبيرًا في تقليل السلوكيات المثيرة للقلق مثل التملق والخداع والسعي وراء السلطة وتشجيع التفكير الوهمي. كما تم تعزيز مقاومة النموذج لهجمات حقن الأوامر.

مشهد المنافسة في السوق

يأتي إصدار Claude Sonnet 4.5 بعد أقل من شهرين من نموذج Anthropic السابق Claude Opus 4.1، مما يعكس المنافسة السريعة الوتيرة في الابتكار في صناعة الذكاء الاصطناعي. تم إصدار النموذج قبل أيام قليلة من مؤتمر مطوري OpenAI السنوي، بينما أضافت Microsoft للتو نماذج Claude إلى Copilot 365 الأسبوع الماضي.

على مدار العام الماضي، أصبحت نماذج الذكاء الاصطناعي من Anthropic خيارًا مفضلاً للمطورين والشركات نظرًا لأدائها القوي في مهام هندسة البرمجيات. وبحسب ما ورد، تستخدم Apple و Meta نماذج Claude AI داخليًا، وقد حققت Anthropic إيرادات تجارية كبيرة من خلال بيع الوصول إلى واجهة برمجة التطبيقات لتطبيقات البرمجة بالذكاء الاصطناعي مثل Cursor و Windsurf و Replit.

صرحت Anthropic أن Claude Code يولد الآن أكثر من 500 مليون دولار من الإيرادات التشغيلية، مع نمو الاستخدام بأكثر من 10 أضعاف في الأشهر الثلاثة الماضية.

توقعات مستقبلية

كشف جاريد كابلان، كبير العلماء في Anthropic، أن الشركة تخطط لإصدار نموذج أو نموذجين آخرين قبل نهاية العام، ومن "المحتمل جدًا أن يشمل ذلك إصدارًا جديدًا من Opus". صرح كريجر أن Claude Sonnet 4.5 سيصبح الخيار الافتراضي للمستخدمين، وتوصي Anthropic باستخدام هذا النموذج "لجميع حالات الاستخدام تقريبًا".

ومع ذلك، يشير مراقبو الصناعة إلى أن هذا المجال يتطور بسرعة كبيرة، ومع اقتراب وصول Gemini 3 المشاع، فإنه من غير المؤكد إلى متى يمكن لـ Claude Sonnet 4.5 الاحتفاظ بلقب "أفضل نموذج برمجة".