اتخذت جوجل خطوة كبيرة نحو جعل المساعدات الذكية أكثر وعيًا بصريًا من خلال دمج قدرات Project Astra في Gemini Live، وذلك كما أُعلن في مؤتمر Google I/O 2025 بتاريخ 20 مايو.
يُعد Project Astra، الذي تم الكشف عنه لأول مرة في Google I/O 2024، رؤية Google DeepMind لإنشاء "مساعد ذكاء اصطناعي عالمي يمكن أن يكون مفيدًا حقًا في الحياة اليومية". الهدف النهائي هو تحويل تطبيق Gemini إلى مساعد ذكاء اصطناعي شامل يؤدي المهام اليومية، ويتولى الأعمال الإدارية الروتينية، ويقدم توصيات شخصية لجعل المستخدمين أكثر إنتاجية وإثراء حياتهم. ويبدأ ذلك بقدرات تم استكشافها أولاً في Project Astra، مثل فهم الفيديو، ومشاركة الشاشة، والذاكرة.
أعلنت جوجل أن Project Astra — التجربة الذكية متعددة الوسائط ومنخفضة التأخير — ستدعم مجموعة من التجارب الجديدة في البحث، وتطبيق Gemini للذكاء الاصطناعي، ومنتجات المطورين الآخرين. والأبرز من ذلك، أن Project Astra يدعم ميزة Search Live الجديدة في بحث جوجل. عند استخدام وضع الذكاء الاصطناعي أو عدسة Lens، يمكن للمستخدمين الضغط على زر "Live" لطرح أسئلة حول ما يرونه من خلال كاميرا هواتفهم الذكية. يقوم Project Astra ببث الفيديو والصوت مباشرة إلى نموذج الذكاء الاصطناعي ويستجيب بالإجابات بسرعة شبه فورية.
في تطبيق Gemini، تقول جوجل إن قدرات Project Astra في الفيديو الفوري ومشاركة الشاشة ستتوفر لجميع المستخدمين. وبينما كانت Project Astra تدعم بالفعل المحادثات السريعة في Gemini Live، إلا أن هذه المدخلات البصرية كانت متاحة سابقًا فقط للمشتركين المدفوعين. وبما أن المستخدمين يحبون Gemini Live، حيث أن متوسط مدة المحادثات فيه أطول بخمس مرات من التفاعلات النصية، ولأنه يوفر طرقًا جديدة للمساعدة مثل إصلاح الأجهزة أو تقديم نصائح تسوق شخصية، قررت جوجل إتاحة Gemini Live مع الكاميرا ومشاركة الشاشة مجانًا للجميع على أندرويد وiOS بدءًا من اليوم.
التطبيقات العملية لهذه التقنية مثيرة للإعجاب. فقد عرضت جوجل قدرات Project Astra من خلال فيديو يُظهر Gemini Live وهو يساعد في أنشطة يومية مثل إصلاح الدراجة. في الفيديو، يطلب المستخدم من Project Astra البحث عن دليل الدراجة التي يقوم بإصلاحها. يتصفح الذكاء الاصطناعي الإنترنت، ويجد المستند، ويسأل المستخدم عن القسم الذي يريد رؤيته بعد ذلك. ثم يطلب المستخدم من Project Astra التمرير حتى يجد جزءًا عن المكابح، ويظهر على شاشة هاتف أندرويد قيام Project Astra بذلك بالفعل والعثور على المعلومات المطلوبة. هذا السلوك الذكي يشير إلى أن Project Astra سيتمكن من الوصول إلى معلومات محددة عبر الإنترنت، حتى داخل المستندات.
خلال العام الماضي، عملت جوجل على دمج هذه القدرات في Gemini Live ليتمكن المزيد من المستخدمين من تجربتها. وتواصل الشركة تحسين هذه الميزات واستكشاف ابتكارات جديدة، بما في ذلك تطوير إخراج الصوت ليصبح أكثر طبيعية باستخدام الصوت الأصلي، وتحسين الذاكرة، وإضافة التحكم في الكمبيوتر. كما تجمع جوجل الآن آراء المستخدمين الموثوقين حول هذه القدرات وتعمل على توفيرها في Gemini Live، وتجارب جديدة في البحث، وواجهة Live API للمطورين، وأشكال جديدة مثل النظارات الذكية.
يمثل هذا الدمج تقدمًا كبيرًا في جعل المساعدات الذكية أكثر وعيًا بالسياق وأكثر فائدة في السيناريوهات اليومية، مما يسمح للتقنية بفهم بيئة المستخدمين بشكل أفضل وتقديم مساعدة أكثر ملاءمة.