Google telah mengumumkan ekspansi besar-besaran pada sistem AI Project Mariner, membawa kemampuan kontrol komputernya kepada pengembang melalui platform Gemini API dan Vertex AI.
Pertama kali diperkenalkan pada akhir 2024, Project Mariner merupakan upaya ambisius Google untuk mentransformasi cara pengguna berinteraksi dengan antarmuka digital melalui agen AI. Sistem ini mampu memahami dan melakukan penalaran atas informasi yang ditampilkan di layar komputer, termasuk teks, gambar, kode, dan formulir web, lalu secara otonom menavigasi situs web serta menyelesaikan tugas-tugas kompleks.
Versi terbaru Project Mariner telah ditingkatkan secara signifikan untuk berjalan di mesin virtual berbasis cloud, mirip dengan agen dari OpenAI dan Amazon. Pendekatan berbasis cloud ini memungkinkan pengguna mengerjakan proyek lain sementara Project Mariner menyelesaikan tugas di latar belakang, dengan kemampuan menangani hingga sepuluh operasi berbeda secara bersamaan—peningkatan besar dibandingkan versi sebelumnya yang hanya berjalan di browser.
Beberapa perusahaan telah mulai mengeksplorasi potensi Project Mariner, termasuk spesialis otomasi Automation Anywhere dan UiPath, serta Browserbase, Autotab, The Interaction Company, dan Cartwheel. Para pengguna awal ini memanfaatkan kemampuan teknologi tersebut untuk mengotomasi alur kerja berbasis web yang sebelumnya membutuhkan intervensi manusia secara ekstensif.
Google juga telah menerapkan langkah-langkah keamanan canggih untuk melindungi dari ancaman seperti indirect prompt injection, di mana instruksi berbahaya dapat disisipkan dalam data yang diambil oleh model AI. Menurut Google, peningkatan keamanan ini secara signifikan meningkatkan tingkat perlindungan Gemini selama penggunaan alat, menjadikan Gemini 2.5 sebagai keluarga model paling aman milik perusahaan hingga saat ini.
Akses yang lebih luas bagi pengembang ke kemampuan Project Mariner dijadwalkan pada musim panas tahun ini, yang berpotensi merevolusi cara pengembang membangun aplikasi AI yang dapat mengontrol dan berinteraksi dengan antarmuka komputer. Teknologi ini juga diintegrasikan ke dalam Mode AI Google Search, yang awalnya akan digunakan untuk menangani tugas seperti pembelian tiket acara, reservasi restoran, dan penjadwalan janji temu lokal.