Amazon Web Services (AWS) a dévoilé Amazon S3 Vectors, une solution de stockage vectoriel durable conçue sur mesure qui promet de transformer la façon dont les organisations stockent et exploitent les données d’IA à grande échelle.
Annoncé le 15 juillet 2025 lors du AWS Summit à New York, S3 Vectors devient le premier service de stockage d’objets infonuagique à offrir un support natif pour l’entreposage et l’interrogation des embeddings vectoriels. Ce service peut réduire le coût total de téléversement, de stockage et d’interrogation des vecteurs jusqu’à 90 % comparativement aux bases de données vectorielles traditionnelles, tout en maintenant des performances de requête en moins d’une seconde.
Les embeddings vectoriels, qui sont des représentations numériques de données non structurées générées par des modèles d’embedding, sont devenus essentiels pour les applications d’IA modernes. Ils permettent la recherche sémantique et fournissent du contexte aux grands modèles de langage. Cependant, les solutions de stockage vectoriel classiques exigent généralement des ressources de calcul dédiées en continu, ce qui fait grimper les coûts de façon importante.
« En analysant les charges de travail de nos clients, nous avons constaté que la grande majorité des index vectoriels n’avaient pas besoin de ressources de calcul, de mémoire vive ou de SSD provisionnées en tout temps », a expliqué AWS dans son annonce. Par exemple, une base de données vectorielle conventionnelle contenant dix millions de vecteurs peut coûter plus de 300 $ par mois sur une instance dédiée, alors que le même ensemble de données dans S3 Vectors coûterait environ 30 $ par mois pour 250 000 requêtes.
S3 Vectors introduit un nouveau type de compartiment avec des API dédiées aux opérations vectorielles, permettant aux utilisateurs de stocker et d’interroger des données vectorielles sans avoir à provisionner d’infrastructure. Chaque compartiment vectoriel peut contenir jusqu’à 10 000 index vectoriels, chaque index pouvant héberger des dizaines de millions de vecteurs. Le service optimise automatiquement les données vectorielles pour offrir le meilleur rapport qualité-prix possible, même à mesure que les ensembles de données évoluent et prennent de l’ampleur.
La solution s’intègre de façon native à Amazon Bedrock Knowledge Bases, Amazon SageMaker et Amazon OpenSearch Service, ce qui la rend particulièrement intéressante pour les applications de génération augmentée par la recherche (RAG). Les organisations peuvent ainsi adopter une stratégie hiérarchisée, en stockant de grands ensembles de vecteurs dans S3 pour maximiser l’efficacité des coûts, tout en transférant les vecteurs les plus consultés vers OpenSearch pour des performances accrues au besoin.
S3 Vectors est actuellement offert en préversion, et AWS invite les clients à l’essayer via la console Amazon S3.