menu
close

Αποτυχία του Google Cloud IAM Παραλύει Παγκόσμιες Υπηρεσίες Διαδικτύου

Μια κρίσιμη αποτυχία στο σύστημα Διαχείρισης Ταυτότητας και Πρόσβασης (IAM) του Google Cloud στις 12 Ιουνίου 2025 προκάλεσε εκτεταμένες διακοπές υπηρεσιών διαδικτύου παγκοσμίως. Η διακοπή, που οφείλεται σε ενημέρωση λογισμικού με ανεπαρκή διαχείριση σφαλμάτων, επηρέασε πάνω από 50 υπηρεσίες Google Cloud σε περισσότερες από 40 περιοχές. Μεγάλες πλατφόρμες όπως τα Spotify, Discord, OpenAI και Cloudflare υπέστησαν σημαντικούς χρόνους μη διαθεσιμότητας, αναδεικνύοντας την αυξανόμενη εξάρτηση κρίσιμων υποδομών από τις υπηρεσίες cloud.
Αποτυχία του Google Cloud IAM Παραλύει Παγκόσμιες Υπηρεσίες Διαδικτύου

Στις 12 Ιουνίου 2025, μια φαινομενικά ασήμαντη αλλαγή πολιτικής στην υποδομή του Google Cloud προκάλεσε μια αλυσιδωτή αποτυχία που παρέλυσε μεγάλα τμήματα του διαδικτύου για αρκετές ώρες, επηρεάζοντας εκατομμύρια χρήστες και επιχειρήσεις παγκοσμίως.

Το περιστατικό ξεκίνησε στις 10:51 π.μ. PDT, όταν μια ενημέρωση πολιτικής με ακούσια κενά πεδία εισήχθη στις περιφερειακές βάσεις δεδομένων Spanner του Google Cloud. Αυτό ενεργοποίησε ανενεργό κώδικα που είχε αναπτυχθεί από τις 29 Μαΐου αλλά δεν είχε δοκιμαστεί σωστά. Ο κώδικας, ο οποίος δεν διέθετε επαρκή διαχείριση σφαλμάτων και προστασία μέσω feature flag, αντιμετώπισε μηδενικές τιμές (null values) που δεν μπορούσε να επεξεργαστεί, προκαλώντας κατάρρευση των binaries του Service Control της Google σε πολλές περιοχές ταυτόχρονα.

Η αποτυχία επηρέασε ειδικά τη λειτουργικότητα Διαχείρισης Ταυτότητας και Πρόσβασης (IAM) της Google, που είναι υπεύθυνη για την εξουσιοδότηση αιτημάτων και τον καθορισμό των ενεργειών που μπορούν να εκτελέσουν οι πιστοποιημένοι χρήστες και υπηρεσίες. Καθώς οι υπηρεσίες IAM κατέρρεαν, η διακοπή εξαπλώθηκε γρήγορα σε κρίσιμα στοιχεία του cloud, όπως τα App Engine, Firestore, Cloud SQL, BigQuery και Memorystore.

Ο αντίκτυπος της διακοπής ήταν εκτεταμένος, επηρεάζοντας τόσο τις ίδιες τις υπηρεσίες της Google όσο και τρίτες πλατφόρμες. Οι εφαρμογές του Google Workspace, όπως Gmail, Drive, Docs και Meet, έγιναν μη προσβάσιμες. Μεγάλες καταναλωτικές πλατφόρμες όπως το Spotify (με περίπου 46.000 επηρεαζόμενους χρήστες), το Discord, το Snapchat και το Twitch υπέστησαν σημαντικούς χρόνους μη διαθεσιμότητας. Οι υπηρεσίες τεχνητής νοημοσύνης επλήγησαν ιδιαίτερα, με την OpenAI να αναφέρει προβλήματα ταυτοποίησης, ενώ πλατφόρμες προγραμματισμού με AI όπως τα Cursor και Replit τέθηκαν πλήρως εκτός λειτουργίας.

Η ομάδα Site Reliability Engineering της Google εντόπισε τη ρίζα του προβλήματος μέσα σε 10 λεπτά και ξεκίνησε ενέργειες αποκατάστασης μέσα σε 40 λεπτά. Ωστόσο, η πλήρης ανάκαμψη διήρκεσε σημαντικά περισσότερο, με ορισμένες περιοχές (ιδιαίτερα η us-central1) να αντιμετωπίζουν παρατεταμένες διακοπές έως και τρεις ώρες. Το περιστατικό έληξε επίσημα στις 20:49 UTC (1:49 μ.μ. PDT).

Αυτή η διακοπή λειτουργίας αποτελεί ηχηρή υπενθύμιση της αυξανόμενης εξάρτησης του διαδικτύου από την υποδομή cloud. Όπως παραδέχθηκε ο επικεφαλής του Google Cloud, Thomas Kurian: «Λυπούμαστε για την αναστάτωση που προκλήθηκε στους πελάτες μας». Το περιστατικό έχει πυροδοτήσει συζητήσεις για την ανάγκη πιο ανθεκτικής διαχείρισης σφαλμάτων, καλύτερων διαδικασιών δοκιμών και διαφοροποίησης των εξαρτήσεων από το cloud, ώστε να αποτραπούν παρόμοιες αποτυχίες στο μέλλον.

Source:

Latest News