menu
close

أوبن إيه آي تكشف عن عائلة GPT-4.1 للهيمنة على سوق برمجة الذكاء الاصطناعي

أطلقت شركة أوبن إيه آي عائلة جديدة من النماذج تحت اسم GPT-4.1، والتي تشمل إصدارات عادية وميني ونانو، جميعها مُحسّنة للبرمجة واتباع التعليمات مع نافذة سياق ضخمة تصل إلى مليون رمز. هذه النماذج الحصرية عبر واجهة برمجة التطبيقات تتفوق على عروض أوبن إيه آي السابقة في اختبارات البرمجة، حيث يُظهر النموذج الرئيسي GPT-4.1 تحسناً بنسبة 21% مقارنة بـ GPT-4o. يأتي هذا الإطلاق في ظل احتدام المنافسة مع جوجل (Gemini 2.5 Pro) وأنثروبيك (Claude 3.7 Sonnet) على صدارة مجال برمجة الذكاء الاصطناعي.
أوبن إيه آي تكشف عن عائلة GPT-4.1 للهيمنة على سوق برمجة الذكاء الاصطناعي

أطلقت شركة أوبن إيه آي عائلة جديدة من النماذج تحت اسم GPT-4.1، والتي تشمل GPT-4.1 وGPT-4.1 mini وGPT-4.1 nano، وجميعها تتفوق في مجال البرمجة واتباع التعليمات. تم إصدار هذه النماذج الجديدة في 14 أبريل وهي متوفرة حصرياً عبر واجهة برمجة التطبيقات (API) الخاصة بأوبن إيه آي، وتتجاوز أداء نموذج GPT-4o الأكثر تقدماً من الشركة في جميع الجوانب.

تتميز النماذج بفهم سياقي محسن، حيث تدعم حتى مليون رمز (ما يعادل تقريباً 750,000 كلمة)، وتأتي مع معرفة محدثة حتى يونيو 2024. في اختبار SWE-bench Verified، الذي يقيس مهارات هندسة البرمجيات الواقعية، أكمل GPT-4.1 نسبة 54.6% من المهام، مقارنة بـ 33.2% لنموذج GPT-4o. ويعكس ذلك تحسناً في قدرة النموذج على استكشاف مستودعات الشيفرات، وإنجاز المهام، وإنتاج شيفرة تعمل وتنجح في الاختبارات.

وأوضح متحدث باسم أوبن إيه آي: "قمنا بتحسين GPT-4.1 للاستخدام الواقعي بناءً على ملاحظات مباشرة لتحسين الجوانب التي تهم المطورين أكثر: برمجة الواجهات الأمامية، تقليل التعديلات غير الضرورية، الالتزام بالتنسيقات، اتباع بنية وترتيب الاستجابة، استخدام الأدوات بشكل متسق، والمزيد." وأضاف: "هذه التحسينات تُمكّن المطورين من بناء وكلاء برمجة أكثر كفاءة في مهام هندسة البرمجيات الواقعية."

تقدم الإصدارات الأصغر توازناً مختلفاً بين الأداء والتكلفة. حيث أن GPT-4.1 mini وnano أكثر كفاءة وسرعة مقابل بعض التنازل في الدقة، وتقول أوبن إيه آي إن GPT-4.1 nano هو أسرع وأرخص نموذج لديها على الإطلاق. تختلف الأسعار بشكل كبير بين الإصدارات: GPT-4.1 يكلف 2 دولار لكل مليون رمز إدخال و8 دولارات لكل مليون رمز إخراج، وGPT-4.1 mini يكلف 0.40 دولار لكل مليون رمز إدخال و1.60 دولار لكل مليون رمز إخراج، أما GPT-4.1 nano فيكلف فقط 0.10 دولار لكل مليون رمز إدخال و0.40 دولار لكل مليون رمز إخراج.

في اختبارات تتجاوز البرمجة، اختبرت أوبن إيه آي نموذج GPT-4.1 باستخدام Video-MME، الذي يقيس قدرة النموذج على فهم محتوى الفيديوهات. حقق GPT-4.1 دقة بلغت 72% في فئة الفيديوهات الطويلة بدون ترجمات، متصدراً هذا المؤشر.

يتماشى هذا الإطلاق مع طموحات أوبن إيه آي الأوسع في مجال البرمجة. حيث ناقشت المديرة المالية للشركة، سارة فراير، مؤخراً رؤية الشركة لإنشاء "مهندس برمجيات وكيل" قادر على برمجة تطبيقات كاملة من البداية للنهاية. وقالت فراير: "يمكنه فعلياً بناء تطبيق لك — وليس فقط بناؤه، بل أيضاً إجراء اختبارات الجودة، واكتشاف الأخطاء، وكتابة التوثيق بنفسه."

مجال نماذج برمجة الذكاء الاصطناعي يشهد منافسة متزايدة. حيث يتصدر نموذج Gemini 2.5 Pro من جوجل حالياً اختبار SWE-bench Verified بنسبة 63.8%، بينما يحقق Claude 3.7 Sonnet من أنثروبيك نسبة 62.3% في الوضع القياسي وتصل إلى 70.3% في وضع التفكير الموسع. ورغم هذه النتائج المبهرة، تعترف أوبن إيه آي بأن حتى أفضل النماذج الحالية ما زالت تواجه صعوبة في مهام لا تشكل عائقاً للخبراء. وقد أظهرت العديد من الدراسات أن النماذج المنتجة للشيفرات غالباً ما تفشل في إصلاح الثغرات الأمنية والأخطاء البرمجية، بل وتقوم أحياناً بإدخالها. كما أن موثوقية GPT-4.1 تقل كلما زاد عدد رموز الإدخال التي يجب معالجتها.

Source: TechCrunch

Latest News