كشفت شركة Anthropic في 22 مايو 2025 عن نماذج الذكاء الاصطناعي من الجيل الجديد، حيث قدمت Claude Opus 4 وClaude Sonnet 4 بقدرات تدفع حدود ما يمكن أن تحققه أنظمة الذكاء الاصطناعي دون تدخل بشري.
يُوصف نموذج Claude Opus 4 من قبل Anthropic بأنه "أفضل نموذج برمجة في العالم"، حيث حقق نتيجة رائدة بلغت 72.5% في اختبار SWE-bench، وهو معيار هندسة برمجيات صارم يقيس الأداء في مهام البرمجة الواقعية. وخلال اختباره في شركة Rakuten، أظهر النموذج قدرة مذهلة على التحمل من خلال العمل بشكل مستقل على مشروع مفتوح المصدر معقد لمدة تقارب سبع ساعات، وهو تقدم كبير مقارنة بنماذج الذكاء الاصطناعي السابقة التي كان تركيزها لا يتجاوز بضع دقائق.
أما نموذج Claude Sonnet 4، فقد صُمم كبديل أكثر كفاءة لـ Opus 4، ويوفر قدرات متقدمة في البرمجة والاستدلال مقارنة بسابقه Claude Sonnet 3.7. ومن المثير للدهشة أنه حقق نتيجة أعلى في اختبار SWE-bench بلغت 72.7%، متفوقًا على منافسين مثل Codex-1 من OpenAI (72.1%) وGemini 2.5 Pro من Google (63.2%).
تتميز النماذج الجديدة بقدرات هجينة في الاستدلال، حيث يمكنها التبديل بين الاستجابات الفورية والتفكير المطول للاستدلال الأعمق. كما يمكنها استخدام أدوات مثل البحث عبر الإنترنت أثناء عملية التفكير، وعند منحها حق الوصول إلى الملفات المحلية، تستطيع استخراج المعلومات الأساسية وحفظها للحفاظ على الاستمرارية وبناء المعرفة مع مرور الوقت.
تمثل هذه النماذج تحولًا جذريًا في وظائف الذكاء الاصطناعي، حيث انتقلت من روبوتات دردشة بسيطة إلى وكلاء عمل مستقلين قادرين على التعامل مع سير عمل معقد ومتعدد الخطوات عبر آلاف المراحل. ويتيح هذا التطور للذكاء الاصطناعي تنفيذ مشاريع تستغرق يومًا كاملًا من البداية إلى النهاية مع الحفاظ على السياق طوال الوقت.
يتوفر Claude Sonnet 4 لجميع مستخدمي Claude، بما في ذلك المشتركين في الخطة المجانية، بينما يتوفر Claude Opus 4 فقط لمشتركي خطط Pro وMax وTeam وEnterprise. كما تتوفر النماذج عبر واجهة برمجة تطبيقات Anthropic، ومنصة Amazon Bedrock، وVertex AI من Google Cloud، مع تسعير مماثل للنماذج السابقة: Opus 4 بسعر 15/75 دولار لكل مليون رمز (إدخال/إخراج) وSonnet 4 بسعر 3/15 دولار.