حققت جوجل تقدماً كبيراً في قدراتها على إنشاء الوسائط باستخدام الذكاء الاصطناعي مع إطلاق Veo 3 وImagen 4 خلال مؤتمر المطورين السنوي Google I/O في 20 مايو 2025.
يمثل Veo 3، أحدث نموذج لإنشاء الفيديو من جوجل، نقلة نوعية من خلال تقديم قدرات توليد الصوت لأول مرة. يمكن للنموذج إنتاج مقاطع فيديو متكاملة مع أصوات خلفية متزامنة مثل ضوضاء المرور أو زقزقة العصافير، بل ويستطيع أيضاً توليد حوارات بين الشخصيات مع مزامنة دقيقة لحركة الشفاه. ويظهر Veo 3 فهماً متقدماً لفيزياء العالم الحقيقي وتعابير البشر، مما ينتج عنه مقاطع فيديو أكثر واقعية وتفصيلاً.
إلى جانب Veo 3، كشفت جوجل عن Imagen 4، وهو أكثر نماذجها تطوراً في توليد الصور حتى الآن. يتميز Imagen 4 بقدرته على إبراز أدق التفاصيل مثل الأقمشة المعقدة وقطرات الماء وفراء الحيوانات بوضوح مذهل. يدعم النموذج نسب أبعاد متنوعة ويمكنه إنشاء صور بدقة تصل إلى 2K، ما يجعلها مناسبة للطباعة أو العروض التقديمية. كما أعلنت جوجل عن نيتها إطلاق إصدار سريع من Imagen 4 سيكون أسرع بعشر مرات من الإصدار السابق، ومصمم لتسريع عمليات النمذجة الأولية وتدفقات العمل الإبداعية.
تُشكل هذه النماذج القوية أساس Flow، أداة صناعة الأفلام الجديدة المدعومة بالذكاء الاصطناعي من جوجل. تجمع Flow بين إمكانيات Veo وImagen وGemini لمساعدة صناع القصص على إنتاج مقاطع ومشاهد سينمائية. توفر الأداة ميزات مثل التحكم في الكاميرا لتحريك الكاميرا بدقة، وSceneBuilder لتمديد اللقطات بسلاسة، وإدارة الأصول لتنظيم العناصر الإبداعية. تتيح Flow للمبدعين الحفاظ على اتساق الشخصيات والمشاهد عبر عدة مقاطع، مما يوفر تجربة سرد قصصي أكثر تماسكاً.
يتوفر Veo 3 حالياً لمشتركي Google AI Ultra في الولايات المتحدة بسعر 249.99 دولار أمريكي شهرياً، بينما يمكن الوصول إلى Imagen 4 عبر تطبيق Gemini وWhisk وVertex AI ومجموعة من تطبيقات Google Workspace. وتحتوي جميع المحتويات المُنتجة بهذه النماذج على علامات مائية SynthID لضمان الشفافية ومكافحة التضليل الإعلامي.
تعكس هذه التطورات التزام جوجل بتوسيع قدرات الذكاء الاصطناعي لتشمل المزيد من المستخدمين، حيث أعلنت الشركة أيضاً أن تطبيقات Gemini تجاوزت 400 مليون مستخدم نشط شهرياً، ما يبرز سرعة تبني تقنياتها الذكية.