Amazon Web Services (AWS) представила Amazon S3 Vectors — специализированное и надёжное решение для хранения векторных данных, которое обещает изменить подход организаций к хранению и использованию данных для искусственного интеллекта в масштабах предприятия.
Анонс состоялся 15 июля 2025 года на саммите AWS в Нью-Йорке. S3 Vectors — это первое облачное объектное хранилище с нативной поддержкой хранения и поиска векторных эмбеддингов. Сервис позволяет снизить совокупные затраты на загрузку, хранение и обработку векторов до 90% по сравнению с традиционными векторными базами данных, сохраняя при этом время отклика менее одной секунды.
Векторные эмбеддинги — это числовые представления неструктурированных данных, создаваемые с помощью моделей эмбеддинга, которые стали неотъемлемой частью современных ИИ-приложений. Они обеспечивают возможности семантического поиска и предоставляют контекст для крупных языковых моделей. Однако традиционные решения для хранения векторов обычно требуют выделенных вычислительных ресурсов, которые должны работать постоянно, что значительно увеличивает стоимость.
«Анализируя рабочие нагрузки клиентов, мы обнаружили, что подавляющему большинству векторных индексов не требуется выделенные вычисления, оперативная память или SSD на 100% времени», — отметили в AWS в своём заявлении. Например, традиционная векторная база данных с десятью миллионами векторов может обходиться более чем в $300 в месяц на выделенном инстансе, тогда как тот же набор данных в S3 Vectors будет стоить примерно $30 в месяц при 250 000 запросов.
S3 Vectors вводит новый тип бакета с отдельными API для работы с векторами, позволяя пользователям хранить и обрабатывать векторные данные без необходимости выделять инфраструктуру. Каждый векторный бакет может содержать до 10 000 векторных индексов, причём каждый индекс способен хранить десятки миллионов векторов. Сервис автоматически оптимизирует хранение векторных данных для достижения наилучшего соотношения цены и производительности, даже по мере роста и изменения наборов данных.
Решение нативно интегрируется с Amazon Bedrock Knowledge Bases, Amazon SageMaker и Amazon OpenSearch Service, что особенно ценно для приложений класса retrieval-augmented generation (RAG). Организации могут реализовать многоуровневую стратегию: хранить большие векторные наборы данных в S3 для экономии, а часто используемые векторы перемещать в OpenSearch для повышения производительности по мере необходимости.
В настоящее время S3 Vectors доступен в режиме предварительного просмотра, и AWS приглашает клиентов опробовать сервис через консоль Amazon S3.