أطلقت Google DeepMind رسميًا Imagen 4، وهو أكثر نماذجها تطورًا حتى الآن في مجال توليد الصور من النصوص، ليقدم للمطورين أدوات قوية لإنشاء صور مولدة بالذكاء الاصطناعي.
أصبح النموذج متاحًا في 15 يوليو عبر Gemini API وGoogle AI Studio، ويضم إصدارين مختلفين ضمن عائلة Imagen 4. النموذج القياسي Imagen 4، والذي يبلغ سعر الصورة الواحدة منه 0.04 دولار أمريكي، يمثل العرض الرئيسي لجوجل لمجموعة واسعة من مهام توليد الصور. أما للمهام الأكثر تطلبًا والتي تحتاج لدقة أكبر في تنفيذ التعليمات النصية، فيتوفر Imagen 4 Ultra بقدرات محسنة وسعر 0.06 دولار للصورة.
يمثل Imagen 4 تقدمًا ملحوظًا مقارنة بالإصدار السابق، حيث سلطت جوجل الضوء على "وضوح مذهل في التفاصيل الدقيقة" مثل الأقمشة المعقدة وقطرات الماء وفراء الحيوانات. يتفوق النموذج في الأنماط الواقعية والتجريدية على حد سواء، ويدعم نسب أبعاد ودقات تصل حتى 2K.
وربما الأهم من ذلك، أن Imagen 4 يعالج تحديًا مستمرًا في مجال توليد الصور بالذكاء الاصطناعي من خلال تحسين قدراته بشكل كبير في توليد النصوص داخل الصور. هذا التطور يجعل التقنية ذات قيمة خاصة في إنتاج مواد تسويقية، ملصقات، دعوات، قصص مصورة، وغيرها من التصاميم التي تجمع بين الصور والنصوص.
وقال جوش وودوارد، رئيس مجموعة Labs في جوجل: "Imagen 4 يمثل خطوة هائلة للأمام في الجودة. لقد أولينا اهتمامًا كبيرًا وأجرينا العديد من التحسينات على كيفية توليد النصوص والطباعة، لذا فهو رائع لإنشاء الشرائح أو الدعوات أو أي شيء آخر يحتاج إلى دمج الصور مع النصوص".
يأتي دمج هذه التقنية ضمن منظومة جوجل، بما في ذلك تطبيقات Workspace، ليعزز الإنتاجية في مختلف الأعمال الإبداعية والمهنية. وأشارت جوجل إلى أنه سيتم طرح شرائح تسعير إضافية خلال الأسابيع القادمة، مع إمكانية الحصول على حدود استخدام أعلى عند الطلب. كما تخطط الشركة لإطلاق إصدار أسرع من Imagen 4 قد يعمل بسرعة تصل إلى عشرة أضعاف مقارنة بـ Imagen 3.