அமேசான் வெப் சர்வீசஸ் (AWS), நிறுவனங்கள் பெரிய அளவில் ஏஐ தரவுகளை சேமித்து பயன்படுத்தும் முறையை மாற்றும் வகையில், Amazon S3 வெக்டர்கள் என்ற புதிய, நீடித்த வெக்டர் சேமிப்பு தீர்வை அறிமுகப்படுத்தியுள்ளது.
2025 ஜூலை 15-ஆம் தேதி நியூயார்க் நகரில் நடைபெற்ற AWS சம்மிடில் அறிவிக்கப்பட்ட S3 வெக்டர்கள், வெக்டர் எம்பெட்டிங்குகளை சேமிப்பதற்கும், கேள்வி செய்வதற்கும் இயற்கையாகவே ஆதரவளிக்கும் முதல் கிளவுட் ஆப்ஜெக்ட் ஸ்டோரேஜ் ஆகும். பாரம்பரிய வெக்டர் தரவுத்தளங்களுடன் ஒப்பிடும்போது, வெக்டர்களை பதிவேற்றுதல், சேமித்தல், கேள்வி செய்வதற்கான மொத்த செலவை 90% வரை குறைக்க முடியும். அதேசமயம், வினாடிக்கு குறைவான நேரத்தில் கேள்வி முடிவுகளை வழங்கும்.
வெக்டர் எம்பெட்டிங்குகள் என்பது, embedding மாடல்களால் உருவாக்கப்படும், கட்டமைப்பில்லாத தரவுகளின் எண்மதிப்பான பிரதிநிதிகள். இவை, நவீன ஏஐ பயன்பாடுகளுக்கு அவசியமானவை. அர்த்தமுள்ள தேடல் திறனையும், பெரிய மொழி மாதிரிகளுக்கான சூழலையும் வழங்குகின்றன. ஆனால், பாரம்பரிய வெக்டர் சேமிப்பு தீர்வுகள் பெரும்பாலும் தொடர்ச்சியாக இயங்கும் தனிப்பட்ட கணினி வளங்களை தேவைப்படுத்தும்; இதனால் செலவுகள் அதிகரிக்கின்றன.
"வாடிக்கையாளர் பணிச்சுமைகளை ஆய்வு செய்தபோது, பெரும்பாலான வெக்டர் இன்டெக்ஸ்களுக்கு எப்போதும் கணினி, RAM அல்லது SSD ஒதுக்கீடு தேவையில்லை என்பதை கண்டறிந்தோம்," என AWS அறிவிப்பில் தெரிவித்துள்ளது. எடுத்துக்காட்டாக, பத்து மில்லியன் வெக்டர்களை கொண்ட பாரம்பரிய வெக்டர் தரவுத்தளத்திற்கு மாதம் $300-க்கும் மேல் செலவாகும்; அதே தரவுத்தொகுப்பை S3 வெக்டர்களில் $30-க்கு மாதம் 2,50,000 கேள்விகளுடன் சேமிக்கலாம்.
S3 வெக்டர்கள், வெக்டர் செயல்பாடுகளுக்காக தனிப்பட்ட API-களுடன் புதிய வகை பக்கெட்டை அறிமுகப்படுத்துகிறது. இதன்மூலம், உள்கட்டமைப்பை ஒதுக்காமல் வெக்டர் தரவுகளை சேமிக்கவும், கேள்வி செய்யவும் முடியும். ஒவ்வொரு வெக்டர் பக்கெட்டிலும் 10,000 வெக்டர் இன்டெக்ஸ்கள் வரை வைத்திருக்க முடியும்; ஒவ்வொரு இன்டெக்ஸிலும் பல மில்லியன் வெக்டர்கள் சேமிக்கலாம். சேவை, தரவுத்தொகுப்புகள் பெரிதாகி வளர்ந்தாலும், சிறந்த விலை-செயல்திறன் விகிதத்திற்காக வெக்டர் தரவுகளை தானாகவே மேம்படுத்தும்.
இந்த தீர்வு, Amazon Bedrock Knowledge Bases, Amazon SageMaker, மற்றும் Amazon OpenSearch Service ஆகியவற்றுடன் இயற்கையாக இணைகிறது. குறிப்பாக, Retrieval-Augmented Generation (RAG) பயன்பாடுகளுக்கு இது மிகவும் பயனுள்ளதாகும். நிறுவனங்கள், பெரிய வெக்டர் தரவுத்தொகுப்புகளை S3-இல் குறைந்த செலவில் சேமித்து, அடிக்கடி அணுகப்படும் வெக்டர்களை OpenSearch-க்கு மாற்றி அதிக செயல்திறனை பெறும் படிநிலைத் திட்டத்தை நடைமுறைப்படுத்தலாம்.
S3 வெக்டர்கள் தற்போது முன்னோட்டமாக (preview) கிடைக்கின்றது; வாடிக்கையாளர்கள் Amazon S3 கன்சோல் மூலம் இதை முயற்சிக்க AWS அழைப்பு விடுத்துள்ளது.