Amazon Web Services (AWS) a dévoilé Amazon S3 Vectors, une solution de stockage vectoriel durable spécialement conçue pour transformer la manière dont les organisations stockent et exploitent les données d’IA à grande échelle.
Annoncé le 15 juillet 2025 lors de l’AWS Summit à New York, S3 Vectors est le premier stockage objet cloud à offrir un support natif pour le stockage et l’interrogation d’embeddings vectoriels. Ce service peut réduire le coût total de chargement, de stockage et de requête des vecteurs jusqu’à 90 % par rapport aux bases de données vectorielles traditionnelles, tout en maintenant des performances de requête inférieures à la seconde.
Les embeddings vectoriels, qui sont des représentations numériques de données non structurées générées par des modèles d’embedding, sont devenus essentiels pour les applications d’IA modernes. Ils permettent la recherche sémantique et fournissent du contexte aux grands modèles de langage. Cependant, les solutions de stockage vectoriel classiques nécessitent généralement des ressources de calcul dédiées fonctionnant en continu, ce qui entraîne des coûts importants.
« En analysant les charges de travail de nos clients, nous avons constaté que la grande majorité des index de vecteurs n’avaient pas besoin de ressources de calcul, de RAM ou de SSD provisionnées en permanence », explique AWS dans son annonce. Par exemple, une base de données vectorielle classique contenant dix millions de vecteurs peut coûter plus de 300 dollars par mois sur une instance dédiée, alors que le même ensemble de données dans S3 Vectors reviendrait à environ 30 dollars par mois pour 250 000 requêtes.
S3 Vectors introduit un nouveau type de bucket avec des API dédiées aux opérations sur les vecteurs, permettant aux utilisateurs de stocker et d’interroger des données vectorielles sans avoir à provisionner d’infrastructure. Chaque bucket vectoriel peut contenir jusqu’à 10 000 index de vecteurs, chacun pouvant stocker des dizaines de millions de vecteurs. Le service optimise automatiquement les données vectorielles pour offrir le meilleur rapport qualité-prix, même lorsque les ensembles de données évoluent et grandissent.
La solution s’intègre nativement à Amazon Bedrock Knowledge Bases, Amazon SageMaker et Amazon OpenSearch Service, ce qui la rend particulièrement précieuse pour les applications de génération augmentée par récupération (RAG). Les organisations peuvent ainsi adopter une stratégie hiérarchisée, stockant de grands ensembles de vecteurs dans S3 pour plus d’efficacité économique, tout en transférant les vecteurs les plus sollicités vers OpenSearch pour des performances accrues si nécessaire.
S3 Vectors est actuellement disponible en préversion, AWS invitant ses clients à l’essayer via la console Amazon S3.