Google telah mengumumkan satu kemajuan penting untuk model AI utamanya dengan pengenalan mod Deep Think untuk Gemini 2.5 Pro, menandakan lonjakan besar dalam keupayaan penaakulan AI.
Deep Think memanfaatkan penyelidikan terkini dalam teknik pemikiran selari, membolehkan model meneroka dan menilai pelbagai penyelesaian berpotensi secara serentak sebelum memberikan respons. Pendekatan ini meniru cara pakar manusia menangani masalah kompleks dengan mempertimbangkan pelbagai sudut dan hipotesis.
"Ia menggunakan hasil penyelidikan terkini kami dalam penaakulan – termasuk teknik pemikiran selari – yang menghasilkan prestasi luar biasa," jelas Demis Hassabis, Ketua Pegawai Eksekutif Google DeepMind, semasa pengumuman di Google I/O 2025.
Mod baharu ini telah menunjukkan keputusan cemerlang dalam pelbagai penanda aras mencabar. Ia memperoleh skor mengagumkan dalam United States of America Mathematical Olympiad (USAMO) 2025, yang dianggap antara penanda aras matematik paling sukar. Deep Think juga mendahului dalam LiveCodeBench, penanda aras sukar untuk pengekodan bertaraf pertandingan, dan memperoleh 84% dalam MMMU, yang menguji penaakulan multimodal merentasi pelbagai tugasan.
Selain Deep Think, Google telah meningkatkan keselamatan secara ketara dalam keluarga Gemini 2.5. Syarikat ini telah melaksanakan perlindungan canggih terhadap serangan suntikan arahan tidak langsung—di mana arahan berniat jahat disisipkan ke dalam data yang diambil oleh model AI. Menurut Google, pendekatan keselamatan baharu ini telah meningkatkan kadar perlindungan Gemini terhadap serangan tersebut semasa penggunaan alat, menjadikan siri 2.5 sebagai keluarga model paling selamat Google setakat ini.
Google mengambil pendekatan berhati-hati dalam pelancaran Deep Think. "Oleh kerana kami sedang mendefinisikan sempadan baharu dengan 2.5 Pro DeepThink, kami mengambil masa tambahan untuk menjalankan lebih banyak penilaian keselamatan frontier dan mendapatkan input lanjut daripada pakar keselamatan," kata syarikat itu. Pada peringkat awal, Deep Think hanya akan tersedia kepada penguji terpilih melalui Gemini API untuk mengumpul maklum balas sebelum pelancaran lebih meluas.
Syarikat itu turut mengumumkan penambahbaikan kepada Gemini 2.5 Flash, model yang lebih cekap untuk kelajuan dan kos rendah. Versi terkini ini menggunakan 20-30% token lebih sedikit sambil memberikan prestasi lebih baik dalam penaakulan, multimodaliti, pengekodan, dan penanda aras konteks panjang.