تعمل Google DeepMind على تحويل نموذجها الأساسي المتعدد الوسائط الأكثر تقدماً، Gemini 2.5 Pro، إلى ما تطلق عليه اسم 'نموذج عالمي' – وهو نظام ذكاء اصطناعي قادر على فهم ومحاكاة جوانب من العالم الحقيقي بطريقة تحاكي العمليات الإدراكية البشرية.
وقد تم الإعلان عن هذه المبادرة الطموحة خلال مؤتمر Google I/O 2025، حيث تهدف إلى ابتكار ذكاء اصطناعي يمكنه وضع الخطط وتخيل تجارب جديدة من خلال نمذجة كيفية عمل العالم. ووفقاً للرئيس التنفيذي لـ DeepMind، ديميس هاسابيس، فإن هذه القدرة تمثل تقدماً جوهرياً في الذكاء الاصطناعي يتجاوز التصنيف والتنبؤ التقليدي.
وقال هاسابيس في منشور مدونة حديث: "لهذا السبب نعمل على تطوير أفضل نموذج أساسي متعدد الوسائط لدينا، Gemini 2.5 Pro، ليصبح 'نموذجاً عالمياً' قادراً على التخطيط وتخيل تجارب جديدة من خلال فهم ومحاكاة جوانب من العالم، تماماً كما يفعل الدماغ البشري".
وترى جوجل بالفعل بوادر مبكرة لقدرات نمذجة العالم في قدرة Gemini على تمثيل ومحاكاة البيئات الطبيعية، وفهم الفيزياء البديهية من خلال نموذج Veo، وتعليم الروبوتات كيفية التقاط الأشياء واتباع التعليمات عبر Gemini Robotics.
وتصف الشركة هذا التطوير بأنه خطوة محورية نحو إنشاء "مساعد ذكاء اصطناعي شامل" – نظام ذكي يفهم السياق وقادر على التخطيط واتخاذ الإجراءات عبر أي جهاز. وتتمثل رؤية جوجل النهائية في تحويل تطبيق Gemini إلى مساعد يمكنه أداء المهام اليومية، وإدارة الأعمال الإدارية، وتقديم توصيات شخصية.
وتعتمد هذه القدرة على نمذجة العالم على قدرات الاستدلال المتقدمة التي يتمتع بها Gemini 2.5 Pro حالياً. إذ يتصدر النموذج مؤشرات الأداء في مهام الرياضيات والعلوم والبرمجة المعقدة، ويحتل المركز الأول في لوائح LMArena وWebDev Arena التي تقيس تفضيلات المستخدمين في التفاعل مع الذكاء الاصطناعي.
وتخطط جوجل لدمج قدرات النمذجة العالمية هذه مع تقنيات من مشروعي Project Mariner وProject Astra، واللذين يركزان على تعدد المهام والفهم البصري على التوالي. ومن المتوقع أن يتوفر Gemini 2.5 Pro المحسن بشكل عام في يونيو 2025، بعد انتهاء مرحلة المعاينة الحالية.