A Amazon Web Services (AWS) revelou o Amazon S3 Vectors, uma solução de armazenamento vetorial durável e dedicada que promete transformar a forma como as organizações armazenam e utilizam dados de IA em grande escala.
Anunciado a 15 de julho de 2025, no AWS Summit em Nova Iorque, o S3 Vectors é o primeiro armazenamento de objetos na cloud com suporte nativo para guardar e consultar embeddings vetoriais. O serviço pode reduzir o custo total de upload, armazenamento e consulta de vetores em até 90% em comparação com bases de dados vetoriais tradicionais, mantendo um desempenho de consulta inferior a um segundo.
Os embeddings vetoriais, representações numéricas de dados não estruturados criadas a partir de modelos de embedding, tornaram-se essenciais para aplicações modernas de IA. Permitem capacidades de pesquisa semântica e fornecem contexto para grandes modelos de linguagem. No entanto, as soluções convencionais de armazenamento vetorial exigem normalmente recursos de computação dedicados a funcionar continuamente, o que aumenta significativamente os custos.
"Ao analisarmos as cargas de trabalho dos clientes, verificámos que a grande maioria dos índices vetoriais não necessitava de computação provisionada, RAM ou SSD a 100% do tempo", explicou a AWS no seu anúncio. Por exemplo, uma base de dados vetorial convencional com dez milhões de vetores pode custar mais de 300 dólares por mês numa instância dedicada, enquanto o mesmo conjunto de dados no S3 Vectors custaria aproximadamente 30 dólares por mês com 250.000 consultas.
O S3 Vectors introduz um novo tipo de bucket com APIs dedicadas para operações vetoriais, permitindo aos utilizadores armazenar e consultar dados vetoriais sem necessidade de provisionar infraestrutura. Cada bucket vetorial pode conter até 10.000 índices vetoriais, sendo que cada índice pode armazenar dezenas de milhões de vetores. O serviço otimiza automaticamente os dados vetoriais para garantir a melhor relação preço-desempenho, mesmo à medida que os conjuntos de dados crescem e evoluem.
A solução integra-se de forma nativa com o Amazon Bedrock Knowledge Bases, Amazon SageMaker e Amazon OpenSearch Service, sendo particularmente valiosa para aplicações de geração aumentada por recuperação (RAG). As organizações podem implementar uma estratégia em camadas, armazenando grandes conjuntos de dados vetoriais no S3 para maior eficiência de custos, enquanto transferem vetores mais acedidos para o OpenSearch para desempenho superior quando necessário.
O S3 Vectors está atualmente disponível em pré-visualização, com a AWS a convidar os clientes a experimentarem o serviço através da consola do Amazon S3.