Amazon Web Services (AWS) ha presentado Amazon S3 Vectors, una solución de almacenamiento vectorial duradera y diseñada específicamente para transformar la forma en que las organizaciones almacenan y utilizan datos de IA a gran escala.
Anunciado el 15 de julio de 2025 durante el AWS Summit en Nueva York, S3 Vectors es el primer almacenamiento de objetos en la nube con soporte nativo para almacenar y consultar incrustaciones vectoriales. El servicio puede reducir el coste total de carga, almacenamiento y consulta de vectores hasta en un 90% frente a las bases de datos vectoriales tradicionales, manteniendo un rendimiento de consulta inferior al segundo.
Las incrustaciones vectoriales, que son representaciones numéricas de datos no estructurados generadas por modelos de embedding, se han vuelto esenciales para las aplicaciones de IA modernas. Permiten capacidades de búsqueda semántica y proporcionan contexto para los grandes modelos de lenguaje. Sin embargo, las soluciones convencionales de almacenamiento vectorial suelen requerir recursos de computación dedicados que funcionan de manera continua, lo que incrementa considerablemente los costes.
"Al analizar las cargas de trabajo de los clientes, descubrimos que la gran mayoría de los índices vectoriales no necesitaban computación aprovisionada, RAM o SSD el 100% del tiempo", explicó AWS en su anuncio. Por ejemplo, una base de datos vectorial convencional con diez millones de vectores puede costar más de 300 dólares al mes en una instancia dedicada, mientras que el mismo conjunto de datos en S3 Vectors costaría aproximadamente 30 dólares mensuales con 250.000 consultas.
S3 Vectors introduce un nuevo tipo de bucket con APIs dedicadas para operaciones vectoriales, permitiendo a los usuarios almacenar y consultar datos vectoriales sin necesidad de aprovisionar infraestructura. Cada bucket vectorial puede contener hasta 10.000 índices vectoriales, y cada índice es capaz de albergar decenas de millones de vectores. El servicio optimiza automáticamente los datos vectoriales para lograr la mejor relación calidad-precio, incluso a medida que los conjuntos de datos crecen y evolucionan.
La solución se integra de forma nativa con Amazon Bedrock Knowledge Bases, Amazon SageMaker y Amazon OpenSearch Service, lo que la hace especialmente valiosa para aplicaciones de generación aumentada por recuperación (RAG). Las organizaciones pueden implementar una estrategia escalonada, almacenando grandes conjuntos de datos vectoriales en S3 para optimizar costes y trasladando los vectores más consultados a OpenSearch para un mayor rendimiento cuando sea necesario.
S3 Vectors está disponible actualmente en versión preliminar, y AWS invita a los clientes a probarlo a través de la consola de Amazon S3.