menu
close

Google ने लागत-संवेदनशील AI के लिए अल्ट्रा-एफिशिएंट Gemini 2.5 Flash-Lite लॉन्च किया

15 जुलाई 2025 को Google ने अपने Gemini 2.5 परिवार का विस्तार करते हुए Flash-Lite को आधिकारिक रूप से लॉन्च किया, जो 2.5 सीरीज का सबसे किफायती और तेज़ मॉडल है। इस लॉन्च के साथ ही Gemini 2.5 Flash और Pro भी सभी उपयोगकर्ताओं के लिए उपलब्ध हो गए हैं। Flash-Lite को उच्च-थ्रूपुट कार्यों के लिए बेहतरीन प्रदर्शन देने के लिए डिज़ाइन किया गया है, जबकि Gemini 2.5 लाइनअप में सबसे कम विलंबता और लागत बनाए रखता है।
Google ने लागत-संवेदनशील AI के लिए अल्ट्रा-एफिशिएंट Gemini 2.5 Flash-Lite लॉन्च किया

Google ने आधिकारिक तौर पर Gemini 2.5 Flash-Lite लॉन्च किया है, जो डेवलपर्स और एंटरप्राइजेज के लिए शक्तिशाली AI को अधिक सुलभ और कुशल बनाने की दिशा में एक महत्वपूर्ण कदम है।

नया मॉडल, जिसे Google का 'अब तक का सबसे किफायती और तेज़ 2.5 मॉडल' बताया गया है, उच्च-वॉल्यूम और कम-विलंबता वाले ऑपरेशनों के लिए अनुकूलित है। Flash-Lite 2.5 मॉडल परिवार में सबसे कम विलंबता और लागत के साथ बाजार में आया है, जिसे पिछले 1.5 और 2.0 Flash मॉडल्स के लिए एक किफायती अपग्रेड के रूप में डिज़ाइन किया गया है। यह अधिकांश मूल्यांकन में बेहतर प्रदर्शन देता है, पहले टोकन तक पहुँचने का समय कम करता है और प्रति सेकंड अधिक टोकन डिकोड करता है, जिससे यह बड़े पैमाने पर वर्गीकरण या संक्षेपण जैसे उच्च थ्रूपुट कार्यों के लिए आदर्श बन जाता है।

एक रीजनिंग मॉडल के रूप में, Flash-Lite API पैरामीटर के माध्यम से 'थिंकिंग बजट' का डायनामिक कंट्रोल देता है। अन्य Gemini 2.5 मॉडल्स के विपरीत, जहाँ सोचने की क्षमता डिफॉल्ट रूप से सक्रिय रहती है, Flash-Lite लागत और गति के लिए अनुकूलित है और सोचने की प्रक्रिया तभी सक्रिय होती है जब इसे विशेष रूप से सक्षम किया जाए। इस अनुकूलन के बावजूद, यह सभी मूलभूत टूल्स जैसे Google Search ग्राउंडिंग, कोड निष्पादन, URL संदर्भ और फंक्शन कॉलिंग को सपोर्ट करता है।

प्रदर्शन परीक्षणों से पता चला है कि Flash-Lite, Gemini 2.0 Flash की तुलना में 1.5 गुना तेज़ है और लागत भी कम है, जिससे यह वर्गीकरण, अनुवाद, इंटेलिजेंट रूटिंग और अन्य लागत-संवेदनशील, बड़े पैमाने के कार्यों के लिए विशेष रूप से उपयुक्त है। जबकि अन्य मॉडल्स डिफॉल्ट रूप से अधिक शक्तिशाली (और महंगे) रीजनिंग टूल्स का उपयोग करते हैं, Flash-Lite इस प्रक्रिया पर डेवलपर्स को नियंत्रण देता है। उपयोगकर्ता अपनी आवश्यकताओं के अनुसार सोचने की क्षमता को ऑन या ऑफ कर सकते हैं, और लागत-कुशल होने के बावजूद, Flash-Lite अपनी क्षमताओं में सीमित नहीं है।

Gemini 2.5 Flash-Lite का प्रीव्यू अब Google AI Studio और Vertex AI में उपलब्ध है, साथ ही 2.5 Flash और Pro के स्थिर वर्शन भी उपलब्ध हैं। दोनों 2.5 Flash और Pro Gemini ऐप में भी एक्सेस किए जा सकते हैं, और Google ने 2.5 Flash-Lite और Flash के कस्टम वर्शन को Search में भी शामिल किया है।

Gemini मॉडल परिवार का यह रणनीतिक विस्तार, Google की AI को लोकतांत्रिक बनाने की प्रतिबद्धता को दर्शाता है, जिसमें जटिल रीजनिंग कार्यों से लेकर उच्च-वॉल्यूम डेटा प्रोसेसिंग तक विभिन्न उपयोग मामलों के लिए प्रदर्शन, लागत और गति के संतुलन वाले विकल्प उपलब्ध कराए जा रहे हैं।

Source:

Latest News