menu
close

Google разширява контрола на компютъра чрез AI за разработчици с Gemini

Google интегрира възможностите за контрол на компютъра от Project Mariner в Gemini API и Vertex AI, което позволява на разработчиците да създават приложения, които автономно навигират и взаимодействат с уеб интерфейси. Компании като Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company и Cartwheel вече проучват тези възможности, а по-широк достъп за разработчици се очаква това лято. Това разширяване представлява значителен напредък в AI агент технологиите на Google.
Google разширява контрола на компютъра чрез AI за разработчици с Gemini

Google обяви мащабно разширяване на своята AI система Project Mariner, като предоставя възможностите ѝ за контрол на компютъра на разработчиците чрез платформите Gemini API и Vertex AI.

Project Mariner, представен за първи път в края на 2024 г., е амбициозният опит на Google да трансформира начина, по който потребителите взаимодействат с дигитални интерфейси чрез AI агенти. Системата може да разбира и анализира информация, показвана на компютърен екран – включително текст, изображения, код и уеб форми – и след това автономно да навигира уебсайтове и да изпълнява сложни задачи.

Последната версия на Project Mariner е значително подобрена и вече работи във виртуални машини в облака, подобно на агентите на OpenAI и Amazon. Този облачен подход позволява на потребителите да работят по други проекти, докато Project Mariner изпълнява задачи във фонов режим, като обработва до десет различни операции едновременно – съществено подобрение спрямо предишната версия, която работеше в браузъра.

Няколко компании вече проучват потенциала на Project Mariner, сред които са специалистите по автоматизация Automation Anywhere и UiPath, както и Browserbase, Autotab, The Interaction Company и Cartwheel. Тези ранни потребители използват технологията за автоматизация на сложни уеб-базирани работни процеси, които преди това са изисквали значителна човешка намеса.

Google е внедрила и усъвършенствани мерки за сигурност с цел защита от заплахи като индиректни prompt injection атаки, при които злонамерени инструкции могат да бъдат вградени в данни, извличани от AI моделите. Според Google тези подобрения значително са увеличили нивото на защита при използване на инструментите Gemini, като Gemini 2.5 е най-сигурното семейство модели на компанията до момента.

По-широк достъп за разработчици до възможностите на Project Mariner се очаква това лято, което потенциално може да революционизира начина, по който се създават AI приложения, способни да контролират и взаимодействат с компютърни интерфейси. Технологията ще бъде интегрирана и в AI Mode на Google Search, където първоначално ще изпълнява задачи като закупуване на билети за събития, резервации в ресторанти и записване на часове за местни услуги.

Source:

Latest News