menu
close

Dinala ng Google ang Visual na Kakayahan ng Project Astra sa Gemini Live

Inintegrate ng Google ang mga advanced na kakayahan ng visual na pag-unawa ng Project Astra sa Gemini Live, na nagbibigay-daan sa AI assistant na makita at bigyang-kahulugan ang mundo gamit ang mga camera at screen ng smartphone ng mga gumagamit. Ang mahalagang pag-upgrade na ito, na inanunsyo sa Google I/O 2025, ay nagpapahintulot sa Gemini na magbigay ng real-time na tulong sa pamamagitan ng pagsusuri ng visual na impormasyon habang nagkakausap. Ang tampok na ito, na dati'y limitado lamang sa mga bayad na subscriber, ay ngayon ay bukas na para sa lahat ng Android at iOS users—isang malaking hakbang patungo sa bisyon ng Google na lumikha ng isang unibersal na AI assistant.
Dinala ng Google ang Visual na Kakayahan ng Project Astra sa Gemini Live

Isang malaking hakbang ang ginawa ng Google upang gawing mas mulat sa visual na impormasyon ang mga AI assistant sa pamamagitan ng pag-integrate ng mga kakayahan ng Project Astra sa Gemini Live, na inanunsyo noong Google I/O 2025 noong Mayo 20.

Ang Project Astra, na unang ipinakilala sa Google I/O 2024, ay kumakatawan sa bisyon ng Google DeepMind para sa isang "unibersal na AI assistant na tunay na makakatulong sa pang-araw-araw na buhay." Ang pangunahing layunin ay gawing isang unibersal na AI assistant ang Gemini app na kayang gampanan ang mga pang-araw-araw na gawain, pamahalaan ang mga paulit-ulit na administratibong gawain, at magbigay ng mga personalisadong rekomendasyon upang gawing mas produktibo at mas makabuluhan ang buhay ng mga gumagamit. Nagsisimula ito sa mga kakayahang unang sinubukan sa Project Astra, gaya ng pag-unawa sa video, screen sharing, at memorya.

Inanunsyo ng Google na ang Project Astra — ang low latency, multimodal AI experience ng kumpanya — ay magpapagana ng iba't ibang bagong karanasan sa Search, Gemini AI app, at mga produkto mula sa third-party developers. Pinakamahalaga, pinapagana ng Project Astra ang bagong Search Live feature sa Google Search. Kapag ginagamit ang AI Mode o Lens, maaaring pindutin ng mga gumagamit ang "Live" button upang magtanong tungkol sa kanilang nakikita sa camera ng kanilang smartphone. I-stream ng Project Astra ang live na video at audio sa AI model at sumasagot ito nang halos walang delay.

Sa Gemini app, sinabi ng Google na ang real-time na video at screen-sharing capabilities ng Project Astra ay darating na para sa lahat ng gumagamit. Habang ang Project Astra ay nagpapagana na ng low-latency na pag-uusap sa Gemini Live, ang visual input na ito ay dati'y eksklusibo lamang sa mga bayad na subscriber. Maraming nagkakagusto sa Gemini Live, na may mga pag-uusap na limang beses na mas mahaba kumpara sa text-based na interaksyon sa karaniwan dahil nag-aalok ito ng mga bagong paraan ng pagtulong—mula sa pag-aayos ng sirang gamit hanggang sa pagbibigay ng personalisadong payo sa pamimili. Kaya simula ngayon, ginagawa ng Google na libre para sa lahat ng Android at iOS users ang Gemini Live na may camera at screen sharing.

Kahanga-hanga ang mga praktikal na aplikasyon nito. Ipinakita ng Google ang mga kakayahan ng Project Astra sa pamamagitan ng isang video kung saan tumutulong ang Gemini Live sa mga pang-araw-araw na gawain, tulad ng pag-aayos ng bisikleta. Sa video, hiniling ng gumagamit sa Project Astra na hanapin ang manual ng bisikletang inaayos nila. Nag-browse ang AI sa web, nahanap ang dokumento, at nagtanong kung ano ang nais makita ng gumagamit. Sinabi ng gumagamit kay Project Astra na i-scroll ang dokumento hanggang makita ang seksyon tungkol sa preno. Makikita sa screen ng Android phone na ginawa ito ng Project Astra at nahanap ang impormasyon. Ang ganitong uri ng agentic na kilos ay nagpapahiwatig na kayang mag-access ng Project Astra ng espesipikong impormasyon online, kahit pa sa loob ng mga dokumento.

Sa nakaraang taon, patuloy na ini-integrate ng Google ang mga kakayahang ito sa Gemini Live upang maranasan ng mas maraming tao. Patuloy ding pinapahusay ng kumpanya at sinusubukan ang mga bagong inobasyon, kabilang ang pagpapaganda ng natural na boses gamit ang native audio, pagpapabuti ng memorya, at pagdagdag ng computer control. Nangangalap na ngayon ang Google ng feedback mula sa mga pinagkakatiwalaang tester tungkol sa mga kakayahang ito at nagsusumikap na dalhin ang mga ito sa Gemini Live, mga bagong karanasan sa Search, Live API para sa mga developer, at mga bagong anyo tulad ng salamin.

Ang integrasyong ito ay kumakatawan sa isang mahalagang pag-unlad sa paggawa ng mga AI assistant na mas mulat sa konteksto at mas kapaki-pakinabang sa pang-araw-araw na sitwasyon, na nagbibigay-daan sa teknolohiya na mas maunawaan ang kapaligiran ng mga gumagamit at magbigay ng mas angkop na tulong.

Source:

Latest News