Google направи значителен напредък в развитието на AI асистентите, като интегрира възможностите на Project Astra в Gemini Live, както беше обявено на Google I/O 2025 на 20 май.
Project Astra, представен за първи път на Google I/O 2024, олицетворява визията на Google DeepMind за „универсален AI асистент, който да бъде наистина полезен в ежедневието“. Крайната цел е приложението Gemini да се превърне в универсален AI асистент, който изпълнява ежедневни задачи, поема рутинна администрация и предлага персонализирани препоръки, за да направи потребителите по-продуктивни и да обогати живота им. Това започва с възможности, първоначално разработени в Project Astra, като разбиране на видео, споделяне на екран и памет.
Google обяви, че Project Astra — нисколатентното, мултимодално AI изживяване на компанията — ще захранва редица нови функции в Search, приложението Gemini AI и продукти на външни разработчици. Най-забележителното е, че Project Astra стои зад новата функция Search Live в Google Search. Когато използват AI Mode или Lens, потребителите могат да натиснат бутона „Live“, за да задават въпроси относно това, което виждат през камерата на смартфона си. Project Astra предава на живо видео и аудио към AI модела и отговаря с минимално или никакво забавяне.
В приложението Gemini Google съобщава, че възможностите за видео в реално време и споделяне на екран на Project Astra ще бъдат достъпни за всички потребители. Макар Project Astra вече да захранва разговорите с ниска латентност в Gemini Live, този визуален вход досега беше запазен само за платени абонати. Потребителите харесват Gemini Live, като средната продължителност на разговорите е пет пъти по-дълга от текстовите взаимодействия, тъй като предлага нови начини за помощ — било то при отстраняване на повреден уред или при получаване на персонализирани съвети за пазаруване. Затова от днес Google прави Gemini Live с камера и споделяне на екран достъпно за всички на Android и iOS безплатно.
Практическите приложения са впечатляващи. Google демонстрира възможностите на Project Astra чрез видео, в което Gemini Live помага при ежедневни дейности, като например ремонт на велосипед. Във видеото потребителят моли Project Astra да намери ръководството за велосипеда, който ремонтира. AI търси в интернет, намира документа и пита какво иска да види потребителят по-нататък. След това потребителят инструктира Project Astra да превърта документа, докато намери секция за спирачките. Екранът на Android телефона показва как Project Astra прави точно това и намира нужната информация. Този тип агентно поведение подсказва, че Project Astra ще може да достъпва специфична информация онлайн, дори в рамките на документи.
През последната година Google интегрира тези възможности в Gemini Live, за да ги направи достъпни за повече хора. Компанията продължава да подобрява и изследва нови иновации, включително по-естествен гласов изход с роден аудио сигнал, подобрена памет и добавяне на компютърен контрол. Google в момента събира обратна връзка за тези възможности от доверени тестери и работи по внедряването им в Gemini Live, нови функции в Search, Live API за разработчици и нови форм-фактори като очила.
Тази интеграция представлява значителен напредък в създаването на AI асистенти, които са по-контекстуално осъзнати и полезни в ежедневни ситуации, позволявайки на технологиите по-добре да разбират заобикалящата среда на потребителите и да предоставят по-релевантна помощ.