أعلنت جوجل عن تقدم كبير في نموذج الذكاء الاصطناعي الرائد لديها مع إطلاق وضعية "التفكير العميق" في Gemini 2.5 Pro، والتي تمثل قفزة نوعية في قدرات الاستدلال للذكاء الاصطناعي.
تعتمد وضعية التفكير العميق على أحدث الأبحاث في تقنيات التفكير المتوازي، حيث تتيح للنموذج استكشاف وتقييم عدة حلول محتملة في الوقت نفسه قبل تقديم الإجابة. تحاكي هذه الطريقة أسلوب خبراء البشر في التعامل مع المشكلات المعقدة من خلال دراسة زوايا وفرضيات متعددة.
وقال ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind، خلال الإعلان في مؤتمر Google I/O 2025: "نستخدم أحدث أبحاثنا المتقدمة في مجال الاستدلال - بما في ذلك تقنيات التفكير المتوازي - مما أدى إلى أداء مذهل".
وقد أظهرت الوضعية الجديدة نتائج استثنائية في اختبارات معيارية صعبة، حيث حققت نتيجة مبهرة في أولمبياد الرياضيات الأمريكي لعام 2025 (USAMO)، والذي يُعتبر أحد أصعب اختبارات الرياضيات على الإطلاق. كما تصدرت وضعية التفكير العميق اختبار LiveCodeBench، وهو معيار صعب لمهارات البرمجة على مستوى المسابقات، وسجلت نسبة نجاح بلغت 84% في اختبار MMMU الذي يقيس قدرات الاستدلال متعددة الوسائط عبر مهام متنوعة.
وبالإضافة إلى وضعية التفكير العميق، عززت جوجل بشكل كبير من أمان سلسلة Gemini 2.5، حيث طبقت تدابير حماية متقدمة ضد هجمات الحقن غير المباشر للأوامر - وهي هجمات يتم فيها تضمين تعليمات خبيثة ضمن البيانات التي يسترجعها نموذج الذكاء الاصطناعي. ووفقاً لجوجل، فقد زادت منهجية الأمان الجديدة من معدل حماية Gemini ضد هذه الهجمات أثناء استخدام الأدوات، لتجعل سلسلة 2.5 الأكثر أماناً بين نماذج جوجل حتى الآن.
وتتبع جوجل نهجاً حذراً في طرح وضعية التفكير العميق. وقالت الشركة: "نظراً لأننا نحدد حدود الابتكار مع 2.5 Pro DeepThink، فإننا نأخذ وقتاً إضافياً لإجراء المزيد من تقييمات الأمان المتقدمة والحصول على آراء إضافية من خبراء الأمان". في البداية، ستكون وضعية التفكير العميق متاحة فقط للمختبرين الموثوقين عبر واجهة برمجة تطبيقات Gemini لجمع الملاحظات قبل الإطلاق الأوسع.
كما أعلنت الشركة عن تحسينات في Gemini 2.5 Flash، وهو النموذج الأكثر كفاءة المصمم للسرعة وتكلفة أقل. حيث يستخدم الإصدار المحدث 20-30% رموزاً أقل مع تقديم أداء أفضل في مجالات الاستدلال، وتعدد الوسائط، والبرمجة، واختبارات السياق الطويل.