Η Amazon Web Services (AWS) παρουσίασε τα Amazon S3 Vectors, μια ειδικά σχεδιασμένη, ανθεκτική λύση αποθήκευσης διανυσμάτων που υπόσχεται να μεταμορφώσει τον τρόπο με τον οποίο οι οργανισμοί αποθηκεύουν και αξιοποιούν δεδομένα AI σε μεγάλη κλίμακα.
Ανακοινώθηκε στις 15 Ιουλίου 2025, στο AWS Summit της Νέας Υόρκης, τα S3 Vectors αποτελούν την πρώτη υπηρεσία αποθήκευσης αντικειμένων στο cloud με εγγενή υποστήριξη για αποθήκευση και αναζήτηση διανυσματικών ενσωματώσεων. Η υπηρεσία μπορεί να μειώσει το συνολικό κόστος μεταφόρτωσης, αποθήκευσης και αναζήτησης διανυσμάτων έως και 90% σε σύγκριση με τις παραδοσιακές βάσεις δεδομένων διανυσμάτων, διατηρώντας παράλληλα απόδοση ερωτημάτων σε υποδευτερόλεπτο.
Οι διανυσματικές ενσωματώσεις, που αποτελούν αριθμητικές αναπαραστάσεις μη δομημένων δεδομένων από μοντέλα ενσωμάτωσης, έχουν καταστεί απαραίτητες για τις σύγχρονες εφαρμογές AI. Παρέχουν δυνατότητες σημασιολογικής αναζήτησης και προσφέρουν συμφραζόμενα για μεγάλα γλωσσικά μοντέλα. Ωστόσο, οι παραδοσιακές λύσεις αποθήκευσης διανυσμάτων συνήθως απαιτούν αποκλειστικούς υπολογιστικούς πόρους που λειτουργούν συνεχώς, αυξάνοντας σημαντικά το κόστος.
"Όταν εξετάσαμε τους φόρτους εργασίας των πελατών, διαπιστώσαμε ότι η συντριπτική πλειοψηφία των ευρετηρίων διανυσμάτων δεν χρειάζεται δεσμευμένους πόρους υπολογιστή, RAM ή SSD στο 100% του χρόνου", εξήγησε η AWS στην ανακοίνωσή της. Για παράδειγμα, μια παραδοσιακή βάση δεδομένων διανυσμάτων με δέκα εκατομμύρια διανύσματα μπορεί να κοστίζει πάνω από $300 μηνιαίως σε αποκλειστική υποδομή, ενώ το ίδιο σύνολο δεδομένων στα S3 Vectors θα κόστιζε περίπου $30 το μήνα με 250.000 ερωτήματα.
Τα S3 Vectors εισάγουν έναν νέο τύπο bucket με ειδικά APIs για διανυσματικές λειτουργίες, επιτρέποντας στους χρήστες να αποθηκεύουν και να αναζητούν διανυσματικά δεδομένα χωρίς να χρειάζεται να διαχειρίζονται υποδομή. Κάθε διανυσματικό bucket μπορεί να περιέχει έως και 10.000 διανυσματικά ευρετήρια, με κάθε ευρετήριο να μπορεί να φιλοξενεί δεκάδες εκατομμύρια διανύσματα. Η υπηρεσία βελτιστοποιεί αυτόματα τα διανυσματικά δεδομένα για τη βέλτιστη σχέση τιμής-απόδοσης, ακόμα και καθώς τα σύνολα δεδομένων μεγαλώνουν και εξελίσσονται.
Η λύση ενσωματώνεται εγγενώς με τα Amazon Bedrock Knowledge Bases, το Amazon SageMaker και το Amazon OpenSearch Service, καθιστώντας την ιδιαίτερα πολύτιμη για εφαρμογές τύπου retrieval-augmented generation (RAG). Οι οργανισμοί μπορούν να εφαρμόσουν μια πολυεπίπεδη στρατηγική, αποθηκεύοντας μεγάλα διανυσματικά σύνολα δεδομένων στο S3 για οικονομία, ενώ μετακινούν συχνά προσπελάσιμα διανύσματα στο OpenSearch για υψηλότερη απόδοση όταν απαιτείται.
Τα S3 Vectors είναι προς το παρόν διαθέσιμα σε preview, με την AWS να προσκαλεί τους πελάτες να τα δοκιμάσουν μέσω της κονσόλας Amazon S3.