menu
close

Google розширює можливості керування комп’ютером за допомогою ШІ для розробників через Gemini

Google інтегрує можливості керування комп’ютером із проєкту Mariner в API Gemini та Vertex AI, дозволяючи розробникам створювати застосунки, які можуть автономно навігувати та взаємодіяти з веб-інтерфейсами. Компанії Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company та Cartwheel вже досліджують ці можливості, а ширший доступ для розробників заплановано на це літо. Це розширення є суттєвим кроком уперед у розвитку агентних технологій штучного інтелекту Google.
Google розширює можливості керування комп’ютером за допомогою ШІ для розробників через Gemini

Google оголосила про значне розширення своєї системи штучного інтелекту Project Mariner, надавши розробникам доступ до можливостей керування комп’ютером через платформи Gemini API та Vertex AI.

Вперше представлений наприкінці 2024 року, Project Mariner є амбітною ініціативою Google, спрямованою на трансформацію взаємодії користувачів із цифровими інтерфейсами за допомогою агентів ШІ. Система здатна розуміти й аналізувати інформацію, що відображається на екрані комп’ютера, включаючи текст, зображення, код і веб-форми, а також автономно навігувати сайтами та виконувати складні завдання.

Остання версія Project Mariner суттєво вдосконалена й може працювати на віртуальних машинах у хмарі, подібно до агентів OpenAI та Amazon. Такий хмарний підхід дозволяє користувачам займатися іншими проєктами, поки Project Mariner виконує завдання у фоновому режимі, обробляючи до десяти різних операцій одночасно — це значне покращення порівняно з попередньою версією, яка працювала у браузері.

Декілька компаній уже досліджують потенціал Project Mariner, зокрема фахівці з автоматизації Automation Anywhere та UiPath, а також Browserbase, Autotab, The Interaction Company і Cartwheel. Ці перші користувачі використовують технологію для автоматизації складних веб-процесів, які раніше вимагали значної участі людини.

Google також впровадила розширені заходи безпеки для захисту від загроз, таких як непрямі ін’єкції підказок, коли шкідливі інструкції можуть бути вбудовані у дані, що отримує модель ШІ. За словами Google, ці вдосконалення суттєво підвищили рівень захисту Gemini під час використання інструментів, зробивши Gemini 2.5 найбезпечнішою лінійкою моделей компанії на сьогодні.

Ширший доступ розробників до можливостей Project Mariner заплановано на це літо, що потенційно може революціонізувати підхід до створення застосунків ШІ, які здатні керувати комп’ютерними інтерфейсами та взаємодіяти з ними. Технологія також інтегрується в AI Mode пошуку Google, де спочатку виконуватиме завдання на кшталт купівлі квитків на події, бронювання столиків у ресторанах і планування локальних зустрічей.

Source:

Latest News