وسّعت جوجل قدراتها في مجال الذكاء الاصطناعي بشكل كبير مع إطلاق Imagen 4، أحدث وأقوى نماذجها لتحويل النص إلى صورة، والمتوفر الآن في معاينة مدفوعة عبر Gemini API وGoogle AI Studio.
يمثل Imagen 4 تطوراً ملحوظاً مقارنة بالإصدارات السابقة، خاصة في جودة عرض النصوص داخل الصور المُولدة. يتوفر النموذج بنسختين: النسخة القياسية من Imagen 4 بسعر 0.04 دولار لكل صورة مُخرجة، وImagen 4 Ultra بسعر 0.06 دولار لكل صورة، والتي تقدم دقة أعلى في تنفيذ تعليمات المستخدم. كلا النموذجين مزودان بتقنية العلامة المائية SynthID غير المرئية للعين البشرية، والتي تساعد في تمييز المحتوى المُولد بالذكاء الاصطناعي.
يأتي هذا الإطلاق ضمن توسع جوجل الأكبر لعائلة نماذج Gemini 2.5. فقد أتاحت الشركة نماذج Gemini 2.5 Flash وPro بشكل عام بعد فترات معاينة ناجحة، كما قدمت Gemini 2.5 Flash-Lite في مرحلة المعاينة. ويُعد Flash-Lite النموذج الأسرع والأكثر توفيراً للتكلفة من جوجل ضمن عائلة 2.5، ومصمم خصيصاً للمهام ذات الحجم الكبير والحساسة للزمن مثل التصنيف، والترجمة، والتوجيه الذكي.
ورغم تركيزه على الكفاءة، يحتفظ Gemini 2.5 Flash-Lite بالقدرات الأساسية لعائلة 2.5، بما في ذلك نافذة سياق تصل إلى مليون رمز ودعم للأدوات المدمجة مثل تكامل بحث جوجل وتنفيذ الشيفرات البرمجية. وعلى عكس النماذج الأخرى في العائلة التي تكون قدرات "التفكير" مفعلة فيها بشكل افتراضي، يتيح Flash-Lite للمطورين التحكم في ميزانية التفكير عبر معلمات الـ API، حيث يكون التفكير معطلاً افتراضياً لتحقيق أعلى سرعة وأقل تكلفة.
ولتعزيز أدوات المطورين، أطلقت جوجل أيضاً Gemini CLI، وهو وكيل ذكاء اصطناعي مفتوح المصدر يتيح الوصول إلى Gemini مباشرة من الطرفية. تتيح هذه الأداة للمطورين استخدام Gemini 2.5 Pro عبر واجهة سطر الأوامر لأغراض البرمجة، وحل المشكلات، وإدارة المهام. وبفضل طبيعتها مفتوحة المصدر (تحت رخصة Apache 2.0)، يمكن للمطورين مراجعة الكود، والتحقق من الجوانب الأمنية، والمساهمة في تطوير الأداة.
تؤكد إصدارات جوجل الأخيرة في مجال الذكاء الاصطناعي التزامها بتزويد المطورين بأدوات قوية ومرنة بشكل متزايد، وبأسعار متنوعة تناسب مختلف حالات الاستخدام، بدءاً من توليد الصور عالية الجودة، مروراً بمعالجة النصوص بكفاءة، ووصولاً إلى المساعدة الذكية عبر الطرفية.