Amazon Web Services (AWS), kuruluşların yapay zeka verilerini büyük ölçekte depolama ve kullanma biçimini dönüştürmeyi vaat eden, özel olarak geliştirilmiş dayanıklı bir vektör depolama çözümü olan Amazon S3 Vectors'ı duyurdu.
15 Temmuz 2025'te New York'taki AWS Summit'te tanıtılan S3 Vectors, vektör gömülerinin depolanması ve sorgulanması için yerel desteğe sahip ilk bulut nesne depolama servisi olma özelliğini taşıyor. Bu hizmet, vektörlerin yüklenmesi, depolanması ve sorgulanmasının toplam maliyetini geleneksel vektör veritabanlarına kıyasla %90'a kadar azaltırken, saniyenin altında sorgu performansını da koruyor.
Gömme modellerinden üretilen ve yapılandırılmamış verilerin sayısal temsilleri olan vektör gömüleri, modern yapay zeka uygulamaları için vazgeçilmez hale geldi. Bu gömüler, anlamsal arama yetenekleri sunuyor ve büyük dil modellerine bağlam sağlıyor. Ancak, geleneksel vektör depolama çözümleri genellikle sürekli çalışan özel hesaplama kaynakları gerektiriyor ve bu da maliyetleri önemli ölçüde artırıyor.
AWS, duyurusunda "Müşteri iş yüklerine baktığımızda, vektör indekslerinin büyük çoğunluğunun %100 oranında ayrılmış işlemci, RAM veya SSD'ye ihtiyaç duymadığını gördük," açıklamasında bulundu. Örneğin, on milyon vektör içeren geleneksel bir vektör veritabanı, özel bir instance üzerinde aylık 300 doların üzerinde maliyete yol açarken, aynı veri kümesi S3 Vectors'ta 250.000 sorgu ile yaklaşık 30 dolara depolanabiliyor.
S3 Vectors, vektör işlemleri için özel API'lere sahip yeni bir bucket türü sunuyor ve kullanıcıların altyapı sağlamak zorunda kalmadan vektör verilerini depolamasına ve sorgulamasına imkan tanıyor. Her vektör bucket'ı 10.000'e kadar vektör indeksi içerebiliyor ve her indeks onlarca milyon vektör barındırabiliyor. Hizmet, veri kümeleri büyüyüp geliştikçe en iyi fiyat-performans oranı için vektör verilerini otomatik olarak optimize ediyor.
Çözüm, Amazon Bedrock Knowledge Bases, Amazon SageMaker ve Amazon OpenSearch Service ile yerel olarak entegre çalışıyor ve özellikle retrieval-augmented generation (RAG) uygulamaları için büyük değer taşıyor. Kuruluşlar, büyük vektör veri kümelerini maliyet etkin şekilde S3'te depolarken, sık erişilen vektörleri gerektiğinde daha yüksek performans için OpenSearch'e taşıyarak katmanlı bir strateji uygulayabiliyor.
S3 Vectors şu anda önizleme aşamasında ve AWS, müşterileri Amazon S3 konsolu üzerinden denemeye davet ediyor.