Amazon Web Services (AWS) predstavio je Amazon S3 Vectors, namjensko i izdržljivo rješenje za pohranu vektora koje obećava transformirati način na koji organizacije pohranjuju i koriste AI podatke u velikim razmjerima.
Najavljeno 15. srpnja 2025. na AWS Summitu u New Yorku, S3 Vectors je prvo cloud objektno spremište s izvornom podrškom za pohranu i pretraživanje vektorskih ugradnji. Ova usluga može smanjiti ukupne troškove učitavanja, pohrane i pretraživanja vektora do 90% u odnosu na tradicionalne vektorske baze podataka, uz zadržavanje performansi upita ispod jedne sekunde.
Vektorske ugradnje, koje su numeričke reprezentacije nestrukturiranih podataka kreirane modelima za ugradnju, postale su ključne za moderne AI aplikacije. Omogućuju semantičko pretraživanje i pružaju kontekst za velike jezične modele. Međutim, konvencionalna rješenja za pohranu vektora obično zahtijevaju stalno pokrenute namjenske računalne resurse, što značajno povećava troškove.
"Kada smo analizirali radna opterećenja korisnika, otkrili smo da velika većina vektorskih indeksa ne treba stalno osigurane računalne resurse, RAM ili SSD," objasnio je AWS u svojoj najavi. Na primjer, konvencionalna vektorska baza podataka s deset milijuna vektora može koštati više od 300 dolara mjesečno na namjenskoj instanci, dok bi isti skup podataka u S3 Vectors koštao otprilike 30 dolara mjesečno uz 250.000 upita.
S3 Vectors uvodi novu vrstu spremnika (bucket) s namjenskim API-jima za rad s vektorima, omogućujući korisnicima pohranu i pretraživanje vektorskih podataka bez potrebe za osiguravanjem infrastrukture. Svaki vektorski spremnik može sadržavati do 10.000 vektorskih indeksa, a svaki indeks može držati desetke milijuna vektora. Usluga automatski optimizira vektorske podatke za najbolji mogući omjer cijene i performansi, čak i kako se skupovi podataka povećavaju i razvijaju.
Rješenje se izvorno integrira s Amazon Bedrock Knowledge Bases, Amazon SageMaker i Amazon OpenSearch Service, što ga čini posebno vrijednim za aplikacije temeljene na retrieval-augmented generation (RAG) pristupu. Organizacije mogu implementirati slojevitu strategiju, pohranjujući velike vektorske skupove podataka u S3 radi uštede, dok se često korišteni vektori mogu premjestiti u OpenSearch za veću brzinu kada je to potrebno.
S3 Vectors je trenutno dostupan u preview verziji, a AWS poziva korisnike da ga isprobaju putem Amazon S3 konzole.