menu
close

Google ने Project Astra की विज़ुअल क्षमताएँ Gemini Live में जोड़ीं

Google ने Project Astra की उन्नत विज़ुअल समझ क्षमताओं को Gemini Live में एकीकृत कर दिया है, जिससे AI असिस्टेंट अब उपयोगकर्ताओं के स्मार्टफोन कैमरा और स्क्रीन के माध्यम से दुनिया को देख और समझ सकता है। Google I/O 2025 में घोषित यह महत्वपूर्ण अपग्रेड Gemini को बातचीत के दौरान विज़ुअल जानकारी का विश्लेषण कर रियल-टाइम सहायता देने में सक्षम बनाता है। यह फीचर, जो पहले केवल पेड सब्सक्राइबर्स तक सीमित था, अब सभी Android और iOS उपयोगकर्ताओं के लिए उपलब्ध है, जो Google के सार्वभौमिक AI असिस्टेंट के विज़न की दिशा में एक बड़ा कदम है।
Google ने Project Astra की विज़ुअल क्षमताएँ Gemini Live में जोड़ीं

Google ने AI असिस्टेंट्स को और अधिक विज़ुअली अवेयर बनाने की दिशा में एक बड़ा कदम उठाया है। कंपनी ने Project Astra की क्षमताओं को Gemini Live में एकीकृत कर दिया है, जिसकी घोषणा 20 मई को Google I/O 2025 में की गई।

Project Astra, जिसे पहली बार Google I/O 2024 में पेश किया गया था, Google DeepMind का वह विज़न है जिसमें 'एक सार्वभौमिक AI असिस्टेंट जो रोज़मर्रा की ज़िंदगी में वाकई मददगार हो' की कल्पना की गई है। अंतिम लक्ष्य Gemini ऐप को एक ऐसे सार्वभौमिक AI असिस्टेंट में बदलना है, जो रोज़मर्रा के काम कर सके, सामान्य प्रशासनिक कार्य संभाल सके, और व्यक्तिगत सिफारिशें देकर उपयोगकर्ताओं को अधिक उत्पादक और जीवन को समृद्ध बना सके। इसकी शुरुआत Project Astra में खोजी गई क्षमताओं से होती है, जैसे वीडियो समझ, स्क्रीन शेयरिंग और मेमोरी।

Google ने घोषणा की कि Project Astra—कंपनी का लो-लेटेंसी, मल्टीमॉडल AI अनुभव—अब Search, Gemini AI ऐप और थर्ड-पार्टी डेवलपर्स के प्रोडक्ट्स में नई सुविधाओं को शक्ति देगा। सबसे उल्लेखनीय रूप से, Project Astra अब Google Search में एक नए Search Live फीचर को शक्ति दे रहा है। जब उपयोगकर्ता AI Mode या Lens का उपयोग करते हैं, तो वे 'Live' बटन पर क्लिक करके अपने स्मार्टफोन कैमरा से दिख रही चीज़ों के बारे में सवाल पूछ सकते हैं। Project Astra लाइव वीडियो और ऑडियो को AI मॉडल में स्ट्रीम करता है और लगभग बिना किसी देरी के उत्तर देता है।

Gemini ऐप में, Google का कहना है कि Project Astra की रियल-टाइम वीडियो और स्क्रीन-शेयरिंग क्षमताएँ अब सभी उपयोगकर्ताओं के लिए आ रही हैं। जबकि Project Astra पहले से ही Gemini Live की लो-लेटेंसी बातचीत को शक्ति देता है, यह विज़ुअल इनपुट पहले केवल पेड सब्सक्राइबर्स के लिए सीमित था। लोग Gemini Live को पसंद करते हैं, क्योंकि इसकी बातचीत औसतन टेक्स्ट-आधारित इंटरैक्शन से पाँच गुना लंबी होती है। यह नई तरह की मदद देता है, चाहे वह टूटा हुआ उपकरण ठीक करना हो या व्यक्तिगत शॉपिंग सलाह लेनी हो। इसी वजह से, आज से Google Gemini Live को कैमरा और स्क्रीन शेयरिंग के साथ सभी Android और iOS उपयोगकर्ताओं के लिए मुफ्त में उपलब्ध करा रहा है।

इसकी व्यावहारिक उपयोगिताएँ काफ़ी प्रभावशाली हैं। Google ने Project Astra की क्षमताएँ एक वीडियो के माध्यम से डेमो कीं, जिसमें Gemini Live रोज़मर्रा की गतिविधियों में मदद करता दिखाया गया, जैसे साइकिल ठीक करना। वीडियो में उपयोगकर्ता Project Astra से उस साइकिल का मैन्युअल खोजने के लिए कहता है जिसे वह ठीक कर रहा है। AI वेब ब्राउज़ करता है, दस्तावेज़ ढूँढता है, और पूछता है कि उपयोगकर्ता आगे क्या देखना चाहता है। फिर उपयोगकर्ता Project Astra से कहता है कि वह दस्तावेज़ को तब तक स्क्रॉल करे जब तक ब्रेक्स से संबंधित सेक्शन न मिल जाए। Android फोन की स्क्रीन पर Project Astra ऐसा ही करता दिखता है और जानकारी ढूँढ लेता है। इस तरह के एजेंटिक व्यवहार से संकेत मिलता है कि Project Astra ऑनलाइन, यहाँ तक कि दस्तावेज़ों के भीतर भी, विशिष्ट जानकारी तक पहुँचने में सक्षम होगा।

पिछले एक साल में, Google ने इन क्षमताओं को अधिक से अधिक लोगों के लिए Gemini Live में एकीकृत किया है। कंपनी लगातार इनोवेशन कर रही है, जिसमें वॉयस आउटपुट को और प्राकृतिक बनाना, मेमोरी में सुधार, और कंप्यूटर कंट्रोल जैसी नई सुविधाएँ शामिल हैं। Google अब इन क्षमताओं पर विश्वसनीय टेस्टर्स से फीडबैक ले रहा है और इन्हें Gemini Live, Search में नई सुविधाओं, डेवलपर्स के लिए Live API और चश्मों जैसे नए फॉर्म फैक्टर्स में लाने के लिए काम कर रहा है।

यह एकीकरण AI असिस्टेंट्स को रोज़मर्रा के परिदृश्यों में अधिक संदर्भ-संपन्न और उपयोगी बनाने की दिशा में एक महत्वपूर्ण प्रगति है, जिससे तकनीक उपयोगकर्ताओं के परिवेश को बेहतर समझ सकेगी और अधिक प्रासंगिक सहायता दे सकेगी।

Source:

Latest News