Google ने अपने Project Mariner AI सिस्टम के बड़े विस्तार की घोषणा की है, जिसके तहत इसकी कंप्यूटर नियंत्रण क्षमताएँ अब Gemini API और Vertex AI प्लेटफॉर्म्स के माध्यम से डेवलपर्स के लिए उपलब्ध होंगी।
2024 के अंत में पहली बार पेश किया गया Project Mariner, Google का महत्वाकांक्षी प्रयास है, जिसका उद्देश्य AI एजेंट्स के माध्यम से उपयोगकर्ताओं के डिजिटल इंटरफेस के साथ संवाद करने के तरीके को बदलना है। यह सिस्टम कंप्यूटर स्क्रीन पर प्रदर्शित जानकारी—जैसे कि टेक्स्ट, इमेज, कोड और वेब फॉर्म्स—को समझ और विश्लेषित कर सकता है, और फिर स्वायत्त रूप से वेबसाइट्स पर नेविगेट कर जटिल कार्यों को पूरा कर सकता है।
Project Mariner के नवीनतम संस्करण को क्लाउड में वर्चुअल मशीनों पर चलाने के लिए काफी उन्नत किया गया है, जो OpenAI और Amazon के एजेंट्स के समान है। यह क्लाउड-आधारित तरीका उपयोगकर्ताओं को अन्य प्रोजेक्ट्स पर काम करने की सुविधा देता है, जबकि Project Mariner बैकग्राउंड में एक साथ दस अलग-अलग ऑपरेशन्स को संभाल सकता है—जो इसके पिछले ब्राउज़र-आधारित संस्करण की तुलना में एक बड़ा सुधार है।
Automation Anywhere और UiPath जैसे ऑटोमेशन विशेषज्ञों के साथ-साथ Browserbase, Autotab, The Interaction Company और Cartwheel जैसी कई कंपनियाँ पहले ही Project Mariner की संभावनाओं का परीक्षण कर रही हैं। ये शुरुआती उपयोगकर्ता इस तकनीक की मदद से जटिल वेब-आधारित वर्कफ्लो को स्वचालित कर रहे हैं, जिनके लिए पहले व्यापक मानवीय हस्तक्षेप की आवश्यकता होती थी।
Google ने सुरक्षा के उन्नत उपाय भी लागू किए हैं, ताकि अप्रत्यक्ष प्रॉम्प्ट इंजेक्शन जैसे खतरों से बचाव किया जा सके, जिसमें AI मॉडल द्वारा प्राप्त डेटा में दुर्भावनापूर्ण निर्देश छिपे हो सकते हैं। Google के अनुसार, इन सुरक्षा सुधारों के चलते Gemini के टूल उपयोग के दौरान सुरक्षा दर में काफी वृद्धि हुई है, जिससे Gemini 2.5 अब तक का सबसे सुरक्षित मॉडल परिवार बन गया है।
Project Mariner की क्षमताओं के लिए व्यापक डेवलपर एक्सेस इस गर्मी में शुरू होने की योजना है, जिससे डेवलपर्स के लिए ऐसे AI एप्लिकेशन बनाना संभव होगा जो कंप्यूटर इंटरफेस को नियंत्रित और इंटरैक्ट कर सकें। यह तकनीक Google Search के AI मोड में भी एकीकृत की जा रही है, जहाँ शुरुआत में यह इवेंट टिकट खरीदने, रेस्तरां में आरक्षण करने और स्थानीय अपॉइंटमेंट शेड्यूल करने जैसे कार्य संभालेगी।