تخطو Google خطوة كبيرة في مجال الذكاء الاصطناعي من خلال تطوير Gemini 2.5 Pro ليصبح 'نموذج عالم' شامل قادر على فهم ومحاكاة جوانب من الواقع بطريقة تحاكي الإدراك البشري.
تمثل نماذج العالم تحولاً جذرياً في قدرات الذكاء الاصطناعي، حيث تتجاوز معالجة اللغة لإنشاء تمثيلات داخلية للبيئات الفيزيائية. يركز هذا المفهوم على كيفية تمكن العوامل الذكية من فهم ونمذجة البيئات التفاعلية الخارجية لتحسين قدراتها في اتخاذ القرار والتخطيط. وقد تم تطويرها في البداية لنمذجة التفاعلات الفيزيائية منخفضة المستوى، ثم توسعت لتشمل المحاكاة الواقعية وإنشاء بيئات معقدة وواقعية.
تحاكي هذه الأنظمة الذكية المتقدمة البيئات الواقعية من خلال الاستفادة من مجموعات بيانات متعددة الوسائط تشمل الصور والصوت والفيديو والنصوص. وتتيح هذه القدرة للذكاء الاصطناعي التنبؤ بنتائج الإجراءات المختلفة، مما يعزز من قدراته على الاستدلال والتخطيط. وتعمل نماذج العالم على سد الفجوة بين البيانات الخام والرؤى القابلة للتنفيذ، مما يسهل تفاعلات أكثر بديهية بين الآلات وبيئاتها.
أعلنت Google أنها تعمل على تطوير Gemini 2.5 Pro ليصبح نموذج عالم "قادر على وضع خطط وتخيل تجارب جديدة من خلال فهم ومحاكاة جوانب من العالم، تماماً كما يفعل الدماغ البشري." ويمثل هذا التطور تقدماً كبيراً في استراتيجية Google للذكاء الاصطناعي، مع إمكانية تمكين حلول أكثر تطوراً للمشكلات في مجالات متعددة.
وبالإضافة إلى هذا التطور الطموح، شاركت Google عدة تحديثات لعائلة نماذج Gemini. أصبح Gemini 2.5 Flash متاحاً الآن للجميع في تطبيق Gemini، وسيتم طرح نسخة محدثة منه قريباً في Google AI Studio للمطورين وفي Vertex AI للمؤسسات في أوائل يونيو، يليه Gemini 2.5 Pro.
سيتم تعزيز Gemini 2.5 Pro بوضع Deep Think، وهو وضع تجريبي للاستدلال مصمم للمهام الرياضية والبرمجية عالية التعقيد. كما تقدم Google قدرات جديدة لكلا النموذجين، بما في ذلك تدابير أمان متقدمة. وقد أدى النهج الأمني الجديد إلى زيادة كبيرة في الحماية ضد هجمات الحقن غير المباشر للأوامر أثناء استخدام الأدوات، مما يجعل عائلة Gemini 2.5 أكثر نماذج الشركة أماناً حتى الآن.
تأتي هذه التطورات في ظل تصاعد المنافسة في مجال الذكاء الاصطناعي، حيث تعمل شركات مثل Nvidia وشركات ناشئة مثل World Labs أيضاً على تقنيات نماذج العالم. فما تمثله النماذج اللغوية الكبيرة لأنظمة مثل ChatGPT، تمثله نماذج العالم لمحاكيات العوالم الافتراضية اللازمة لتدريب الروبوتات وأنظمة الذكاء الاصطناعي الأخرى. إذ يمكن لهذه الأدوات إنتاج بيئات ومحاكاة ثلاثية الأبعاد تساعد الروبوتات على فهم وتخطيط وتنقل أفضل في محيطها.
ومع استمرار Google في دفع حدود قدرات الذكاء الاصطناعي، يشير تطور Gemini 2.5 Pro إلى نموذج عالم إلى عصر جديد يمكن فيه للذكاء الاصطناعي ليس فقط معالجة المعلومات، بل أيضاً فهم وتوقع والتفاعل مع العالم بطرق تزداد شبهاً بالبشر.