أعلنت Google DeepMind رسميًا عن إطلاق Imagen 4، أكثر نماذجها تطورًا حتى الآن في مجال تحويل النصوص إلى صور، حيث توفر للمطورين أدوات قوية لإنشاء صور مولدة بالذكاء الاصطناعي.
أصبح النموذج متاحًا اعتبارًا من 15 يوليو من خلال كل من Gemini API وGoogle AI Studio، ويضم إصدارين مميزين ضمن عائلة Imagen 4. النموذج الأساسي Imagen 4، والذي يبلغ سعره 0.04 دولار لكل صورة ناتجة، يُعد العرض الرئيسي لجوجل لمجموعة واسعة من مهام توليد الصور. أما للمهام الأكثر تطلبًا والتي تحتاج إلى دقة أعلى في الالتزام بالتعليمات النصية، فيتوفر Imagen 4 Ultra بقدرات محسّنة وسعر 0.06 دولار لكل صورة.
يمثل Imagen 4 تطورًا كبيرًا مقارنة بالإصدار السابق، حيث أشارت جوجل إلى "وضوح مذهل في أدق التفاصيل" مثل الأقمشة المعقدة وقطرات الماء وفراء الحيوانات. ويتفوق النموذج في كل من الأساليب الواقعية والتجريدية، مع دعم لنسب أبعاد ودقات تصل إلى 2K.
وربما الأهم من ذلك، أن Imagen 4 يعالج تحديًا طويل الأمد في مجال توليد الصور بالذكاء الاصطناعي من خلال تحسين قدراته بشكل كبير في توليد النصوص داخل الصور. هذا التطوير يجعل التقنية ذات قيمة خاصة في إنتاج مواد تسويقية، ملصقات، دعوات، قصص مصورة وغيرها من التصاميم التي تجمع بين الصور والنصوص.
وقال جوش وودوارد، رئيس مجموعة Labs في جوجل: "Imagen 4 يمثل قفزة نوعية في الجودة. لقد أولينا اهتمامًا كبيرًا بكيفية توليد النصوص والخطوط، لذا فهو رائع لإنشاء العروض التقديمية أو الدعوات أو أي شيء آخر يتطلب دمج الصور مع النصوص".
ويعزز دمج هذه التقنية ضمن منظومة جوجل، بما في ذلك تطبيقات Workspace، من الإنتاجية في مختلف مسارات العمل الإبداعية والمهنية. وأشارت جوجل إلى أنه سيتم طرح شرائح تسعير إضافية خلال الأسابيع المقبلة، مع إمكانية الحصول على حدود استخدام أعلى عند الطلب. كما تخطط الشركة لإطلاق نسخة أسرع من Imagen 4 قد تكون أسرع بعشر مرات من Imagen 3.