أعلنت جوجل رسميًا عن إطلاق Gemini 2.5 Flash-Lite، في خطوة تمثل تقدمًا كبيرًا نحو جعل تقنيات الذكاء الاصطناعي القوية أكثر سهولة وكفاءة للمطورين والشركات على حد سواء.
يُوصف النموذج الجديد بأنه "الأكثر كفاءة من حيث التكلفة والأسرع حتى الآن ضمن سلسلة 2.5"، حيث تم تحسينه للعمليات ذات الحجم الكبير والحساسة لزمن الاستجابة. يدخل Flash-Lite السوق بأقل زمن استجابة وتكلفة في عائلة نماذج 2.5، وقد تم تصميمه كترقية اقتصادية من نماذج Flash 1.5 و2.0 السابقة. ويوفر أداءً أفضل في معظم التقييمات، مع تقليل زمن الحصول على أول رمز وزيادة عدد الرموز المعالجة في الثانية، مما يجعله مثاليًا للمهام ذات الإنتاجية العالية مثل التصنيف أو التلخيص على نطاق واسع.
كنموذج للمنطق والاستدلال، يتيح Flash-Lite التحكم الديناميكي في ميزانية التفكير من خلال معلمة في واجهة البرمجة (API). وعلى عكس نماذج Gemini 2.5 الأخرى التي يتم تفعيل ميزة التفكير فيها افتراضيًا، يركز Flash-Lite على تقليل التكلفة وزمن الاستجابة من خلال إبقاء ميزة التفكير متوقفة ما لم يتم تفعيلها بشكل خاص. ورغم هذا التحسين، لا يزال يدعم جميع الأدوات الأصلية مثل الربط بنتائج بحث جوجل، وتنفيذ الشيفرات البرمجية، وسياق الروابط، واستدعاء الوظائف.
تُظهر اختبارات الأداء أن Flash-Lite أسرع بمقدار 1.5 مرة من Gemini 2.0 Flash وبتكلفة أقل، مما يجعله مناسبًا بشكل خاص لمهام مثل التصنيف، والترجمة، والتوجيه الذكي، وغيرها من العمليات واسعة النطاق والحساسة للتكلفة. وبينما قد تعتمد النماذج الأخرى بشكل افتراضي على أدوات منطقية أقوى (وأكثر تكلفة) للإجابة على الأسئلة، يمنح Flash-Lite المطورين القدرة على التحكم في هذه العملية. يمكن للمستخدمين تفعيل أو تعطيل ميزة التفكير حسب احتياجاتهم الخاصة، ورغم كفاءته العالية من حيث التكلفة، لا توجد حدود لما يمكن أن ينجزه Flash-Lite.
يتوفر الآن الإصدار التجريبي من Gemini 2.5 Flash-Lite في Google AI Studio وVertex AI، إلى جانب النسخ المستقرة من 2.5 Flash وPro. كما أن كلا من 2.5 Flash وPro متاحان أيضًا في تطبيق Gemini، وقد أضافت جوجل نسخًا مخصصة من Flash-Lite وFlash إلى خدمة البحث.
يمثل هذا التوسع الاستراتيجي في عائلة نماذج Gemini التزام جوجل بجعل الذكاء الاصطناعي متاحًا للجميع، من خلال توفير خيارات توازن بين الأداء والتكلفة والسرعة لمختلف حالات الاستخدام، بدءًا من مهام الاستدلال المعقدة وصولاً إلى معالجة البيانات على نطاق واسع.