Google je napravio značajan iskorak u razvoju vizualno svjesnijih AI asistenata integracijom mogućnosti Project Astra u Gemini Live, kako je najavljeno na Google I/O 2025, 20. svibnja.
Project Astra, prvi put predstavljen na Google I/O 2024, predstavlja viziju Google DeepMinda o "univerzalnom AI asistentu koji može biti zaista koristan u svakodnevnom životu." Krajnji cilj je transformirati aplikaciju Gemini u univerzalnog AI asistenta koji obavlja svakodnevne zadatke, rješava administrativne obaveze i nudi personalizirane preporuke kako bi korisnici bili produktivniji i imali bogatiji život. To započinje mogućnostima koje su prvo istražene u Project Astra, poput razumijevanja videa, dijeljenja zaslona i memorije.
Google je najavio da će Project Astra — nisko-latentno, multimodalno AI iskustvo tvrtke — pokretati niz novih iskustava u Pretraživanju, Gemini AI aplikaciji i proizvodima trećih strana. Najznačajnije je što Project Astra pokreće novu značajku Search Live u Google pretraživanju. Kada koriste AI način rada ili Lens, korisnici mogu kliknuti gumb "Live" kako bi postavljali pitanja o onome što vide kroz kameru svog pametnog telefona. Project Astra prenosi uživo video i zvuk u AI model i odgovara s minimalnim ili nikakvim kašnjenjem.
U Gemini aplikaciji, Google navodi da mogućnosti Project Astra za video u stvarnom vremenu i dijeljenje zaslona dolaze svim korisnicima. Iako Project Astra već pokreće razgovore s niskom latencijom u Gemini Live, ovaj vizualni unos bio je prethodno rezerviran za pretplatnike.
Korisnici obožavaju Gemini Live, s prosječno pet puta duljim razgovorima u odnosu na interakcije putem teksta, jer nudi nove načine za dobivanje pomoći — bilo da je riječ o rješavanju problema s pokvarenim uređajem ili dobivanju personaliziranih savjeta za kupovinu. Zato Google od danas omogućuje Gemini Live s kamerom i dijeljenjem zaslona besplatno svim korisnicima Androida i iOS-a.
Praktične primjene su impresivne. Google je demonstrirao mogućnosti Project Astra prikazom videa u kojem Gemini Live pomaže u svakodnevnim aktivnostima, poput popravka bicikla. U videu korisnik traži od Project Astra da pronađe priručnik za bicikl koji popravlja. AI pretražuje internet, pronalazi dokument i pita što korisnik želi vidjeti dalje. Zatim korisnik traži od Project Astra da skrolira dokument dok ne pronađe odjeljak o kočnicama. Na ekranu Android telefona vidi se kako Project Astra upravo to radi i pronalazi informacije. Ovakvo agentsko ponašanje sugerira da će Project Astra moći pristupati specifičnim informacijama na internetu, čak i unutar dokumenata.
Tijekom protekle godine, Google je integrirao ove mogućnosti u Gemini Live kako bi ih iskusilo što više korisnika. Tvrtka nastavlja s unaprjeđenjima i istraživanjem novih inovacija, uključujući prirodniji glasovni izlaz s izvornim zvukom, poboljšanje memorije i dodavanje kontrole nad računalom. Google sada prikuplja povratne informacije o ovim mogućnostima od pouzdanih testera i radi na njihovom uvođenju u Gemini Live, nova iskustva u Pretraživanju, Live API za developere i nove formate poput naočala.
Ova integracija predstavlja značajan napredak u razvoju AI asistenata koji su kontekstualno svjesniji i korisniji u svakodnevnim scenarijima, omogućujući tehnologiji bolje razumijevanje korisničkog okruženja i pružanje relevantnije pomoći.