وسّعت جوجل قدراتها في مجال الذكاء الاصطناعي بشكل كبير مع إطلاق Imagen 4، أحدث وأقوى نماذجها لتحويل النصوص إلى صور، والمتوفر حالياً في نسخة مدفوعة عبر واجهة Gemini API وGoogle AI Studio.
يمثل Imagen 4 تطوراً ملحوظاً مقارنة بالإصدارات السابقة، خصوصاً فيما يتعلق بجودة عرض النصوص داخل الصور المولدة. يتوفر النموذج بنسختين: النسخة القياسية بسعر 0.04 دولار لكل صورة، وImagen 4 Ultra بسعر 0.06 دولار لكل صورة، والتي توفر دقة أعلى في تنفيذ تعليمات المستخدم. كلا النموذجين مزودان بتقنية SynthID لوضع العلامات المائية غير المرئية للعين البشرية، والتي تساعد في تمييز المحتوى المولّد بالذكاء الاصطناعي.
يأتي هذا الإطلاق ضمن توسع جوجل الأكبر لعائلة نماذج Gemini 2.5. فقد أتاحت الشركة الآن نماذج Gemini 2.5 Flash وPro بشكل عام بعد فترة تجريبية ناجحة، كما قدمت Gemini 2.5 Flash-Lite في نسخة معاينة. ويعد Flash-Lite النموذج الأكثر كفاءة وسرعة من حيث التكلفة في عائلة 2.5، وهو مُصمم خصيصاً للمهام ذات الحجم الكبير والحساسة للزمن مثل التصنيف والترجمة والتوجيه الذكي.
ورغم تركيز Flash-Lite على الكفاءة، إلا أنه يحتفظ بالقدرات الأساسية لعائلة 2.5، بما في ذلك نافذة سياق تصل إلى مليون رمز ودعم الأدوات الأصلية مثل تكامل بحث جوجل وتنفيذ الشيفرات البرمجية. وعلى عكس النماذج الأخرى في العائلة التي تتيح خاصية "التفكير" بشكل افتراضي، يتيح Flash-Lite للمطورين التحكم في ميزانية التفكير عبر معايير واجهة البرمجة، حيث يكون التفكير مغلقاً افتراضياً لتحقيق سرعة وأداء أعلى بتكلفة أقل.
ولتعزيز تجربة المطورين، أطلقت جوجل أداة Gemini CLI مفتوحة المصدر، والتي تتيح الوصول إلى Gemini مباشرة من خلال الطرفية. تتيح هذه الأداة للمطورين استخدام Gemini 2.5 Pro عبر واجهة سطر الأوامر للبرمجة وحل المشكلات وإدارة المهام. وبفضل كونها مفتوحة المصدر (برخصة Apache 2.0)، يمكن للمطورين مراجعة الكود والتحقق من الجوانب الأمنية والمساهمة في تطوير الأداة.
تعكس أحدث إصدارات جوجل في مجال الذكاء الاصطناعي التزامها بتوفير أدوات قوية ومرنة للمطورين عبر مستويات سعرية واستخدامات مختلفة، بدءاً من توليد الصور عالية الجودة وصولاً إلى معالجة النصوص بكفاءة والمساعدة الذكية عبر الطرفية.