أعلنت جوجل عن تقدم كبير في نموذج الذكاء الاصطناعي الرائد لديها مع إطلاق وضعية "التفكير العميق" لجيميني 2.5 برو، والتي تمثل قفزة نوعية في قدرات الاستدلال للذكاء الاصطناعي.
تعتمد وضعية التفكير العميق على أحدث الأبحاث في تقنيات التفكير المتوازي، حيث تتيح للنموذج استكشاف وتقييم عدة حلول محتملة في الوقت نفسه قبل تقديم الإجابة. وتُحاكي هذه الطريقة أسلوب خبراء البشر في التعامل مع المشكلات المعقدة من خلال دراسة زوايا وفرضيات متعددة.
وقال ديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، خلال الإعلان في مؤتمر Google I/O 2025: "نستخدم أحدث أبحاثنا في مجال الاستدلال، بما في ذلك تقنيات التفكير المتوازي، مما أدى إلى أداء مذهل".
وقد أظهرت الوضعية الجديدة نتائج استثنائية في اختبارات معيارية صعبة. فقد حققت نتيجة مبهرة في أولمبياد الرياضيات الأمريكي لعام 2025 (USAMO)، والذي يُعد من أصعب اختبارات الرياضيات على الإطلاق. كما تصدرت وضعية التفكير العميق اختبار LiveCodeBench، وهو معيار صعب لمهارات البرمجة التنافسية، وسجلت نسبة 84٪ في اختبار MMMU الذي يقيس الاستدلال متعدد الوسائط عبر مهام متنوعة.
وبالإضافة إلى وضعية التفكير العميق، عززت جوجل بشكل كبير الأمان في عائلة جيميني 2.5. فقد طبقت الشركة تدابير حماية متقدمة ضد هجمات الحقن غير المباشر، حيث يتم تضمين تعليمات خبيثة في البيانات التي يسترجعها نموذج الذكاء الاصطناعي. ووفقًا لجوجل، فقد زادت منهجية الأمان الجديدة من معدل حماية جيميني ضد هذه الهجمات أثناء استخدام الأدوات، مما يجعل سلسلة 2.5 الأكثر أمانًا بين نماذج جوجل حتى الآن.
وتتبع جوجل نهجًا حذرًا في طرح وضعية التفكير العميق. وقالت الشركة: "نظرًا لأننا نحدد حدود الابتكار مع جيميني 2.5 برو تفكير عميق، فإننا نأخذ وقتًا إضافيًا لإجراء المزيد من تقييمات الأمان المتقدمة والحصول على آراء إضافية من خبراء السلامة". في البداية، ستكون وضعية التفكير العميق متاحة فقط للمختبرين الموثوقين عبر واجهة Gemini API لجمع الملاحظات قبل الإطلاق الأوسع.
كما أعلنت الشركة عن تحسينات في جيميني 2.5 فلاش، النموذج الأكثر كفاءة المصمم للسرعة والتكلفة المنخفضة. ويستخدم الإصدار المحدث عدد رموز أقل بنسبة 20-30٪ مع تقديم أداء أفضل في اختبارات الاستدلال، وتعدد الوسائط، والبرمجة، والسياقات الطويلة.