menu
close

Google ने Gemini 2.5 Pro में AI लागत नियंत्रण का विस्तार किया

Google ने अपने 'थिंकिंग बजट्स' फीचर को Gemini 2.5 Flash से बढ़ाकर अब Gemini 2.5 Pro में भी लागू कर दिया है, जिससे डेवलपर्स को AI रीजनिंग लागतों पर सटीक नियंत्रण मिल सकेगा। इस सुविधा के तहत उपयोगकर्ता यह तय कर सकते हैं कि मॉडल रीजनिंग के लिए कितने टोकन इस्तेमाल करेगा या फिर सोचने की क्षमता को पूरी तरह बंद भी कर सकते हैं। इससे प्रदर्शन और आर्थिक दक्षता के बीच संतुलन बनाया जा सकता है। यह फीचर उन व्यवसायों के लिए खासतौर पर महत्वपूर्ण है जो बड़े पैमाने पर उन्नत AI तैनात कर रहे हैं, क्योंकि रीजनिंग फीचर्स आमतौर पर काफी अधिक परिचालन लागत के साथ आते हैं।
Google ने Gemini 2.5 Pro में AI लागत नियंत्रण का विस्तार किया

Google ने घोषणा की है कि उसने अपने नवीन 'थिंकिंग बजट्स' फीचर को अब Gemini 2.5 Pro तक विस्तारित कर दिया है, जो कंपनी का सबसे उन्नत AI रीजनिंग मॉडल है। इससे पहले इस फीचर को इस साल की शुरुआत में Gemini 2.5 Flash में सफलतापूर्वक लागू किया गया था।

थिंकिंग बजट्स फीचर AI लागत प्रबंधन में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है, जिससे डेवलपर्स जटिल समस्याओं के समाधान के लिए आवंटित कंप्यूटेशनल पावर पर सटीक नियंत्रण रख सकते हैं। इस सुविधा के तहत उपयोगकर्ता यह निर्धारित कर सकते हैं कि उत्तर उत्पन्न करने से पहले मॉडल आंतरिक रीजनिंग के लिए अधिकतम कितने टोकन का उपयोग करेगा, या फिर साधारण कार्यों के लिए सोचने की क्षमता को पूरी तरह बंद भी कर सकते हैं।

Google ने अपनी घोषणा में कहा, "हमने 2.5 Flash में थिंकिंग बजट्स लॉन्च किया ताकि डेवलपर्स लागत, लेटेंसी और क्वालिटी के बीच संतुलन बनाते हुए अधिक नियंत्रण पा सकें। अब हम इस क्षमता को 2.5 Pro में भी विस्तार दे रहे हैं।" कंपनी ने पुष्टि की है कि आने वाले हफ्तों में Gemini 2.5 Pro में बजट्स के साथ यह सुविधा स्थिर प्रोडक्शन उपयोग के लिए सामान्य रूप से उपलब्ध हो जाएगी।

यह विकास आज के AI बाजार में मौजूद एक मूलभूत चुनौती को संबोधित करता है, जहां अधिक उन्नत रीजनिंग आमतौर पर लेटेंसी और लागत दोनों को बढ़ा देती है। उदाहरण के लिए, Gemini 2.5 Flash में रीजनिंग सक्षम करने पर आउटपुट लागत लगभग छह गुना बढ़ जाती है—$0.60 प्रति मिलियन टोकन से $3.50 प्रति मिलियन टोकन तक। थिंकिंग बजट्स लागू करके, व्यवसाय अपनी विशिष्ट जरूरतों के अनुसार AI डिप्लॉयमेंट को अनुकूलित कर सकते हैं और केवल आवश्यक होने पर ही रीजनिंग को सक्षम कर सकते हैं।

यह फीचर विशेष रूप से उन एंटरप्राइज ग्राहकों के लिए उपयोगी है, जिन्हें AI तैनाती की लागत को सावधानीपूर्वक प्रबंधित करते हुए उन्नत क्षमताओं तक पहुंच चाहिए। जैसे, भाषा अनुवाद या सामान्य जानकारी प्राप्त करने जैसे सरल प्रश्नों के लिए सोचने की क्षमता बंद की जा सकती है ताकि लागत न्यूनतम रहे। वहीं, गणितीय समस्या-समाधान या जटिल विश्लेषण जैसे बहु-चरणीय रीजनिंग वाले कार्यों के लिए सोचने की क्षमता को सक्षम और फाइन-ट्यून किया जा सकता है।

जैसे-जैसे AI व्यवसायिक वर्कफ्लो में गहराई से एकीकृत होता जा रहा है, Google का यह अनुकूलन योग्य रीजनिंग वाला दृष्टिकोण एक परिपक्व होते बाजार को दर्शाता है, जहां लागत अनुकूलन और प्रदर्शन ट्यूनिंग अब केवल क्षमताओं जितने ही महत्वपूर्ण हो गए हैं—यह जनरेटिव AI तकनीकों के व्यवसायीकरण के एक नए चरण की ओर संकेत करता है।

Source:

Latest News