12 Haziran 2025'te, Google Cloud altyapısında yapılan önemsiz gibi görünen bir politika değişikliği, zincirleme bir arızaya yol açarak internetin büyük bir bölümünü saatlerce devre dışı bıraktı ve dünya genelinde milyonlarca kullanıcı ile işletmeyi etkiledi.
Olay, saat 10:51 PDT'de, Google Cloud'un bölgesel Spanner veritabanlarına istenmeyen boş alanlar içeren bir politika güncellemesinin eklenmesiyle başladı. Bu güncelleme, 29 Mayıs'ta dağıtılmış ancak hiç düzgün test edilmemiş olan uyuyan bir kodu tetikledi. Uygun hata yönetimi ve özellik bayrağı koruması olmayan bu kod, işleyemediği null (boş) değerlerle karşılaşınca, Google'ın Service Control ikili dosyalarının birden fazla bölgede aynı anda çökmesine neden oldu.
Arıza, özellikle Google'ın Kimlik ve Erişim Yönetimi (IAM) işlevselliğini etkiledi. IAM, kimliği doğrulanmış kullanıcı ve servislerin hangi işlemleri yapabileceğini belirleyip yetkilendirmekten sorumlu. IAM hizmetleri devre dışı kalınca, kesinti hızla App Engine, Firestore, Cloud SQL, BigQuery ve Memorystore gibi kritik bulut bileşenlerine yayıldı.
Kesintinin etkisi oldukça genişti; hem Google'ın kendi servisleri hem de üçüncü taraf platformlar etkilendi. Google Workspace uygulamaları (Gmail, Drive, Docs ve Meet dahil) erişilemez hale geldi. Spotify (yaklaşık 46.000 etkilenen kullanıcı), Discord, Snapchat ve Twitch gibi büyük tüketici platformları ciddi kesintiler yaşadı. Yapay zeka servisleri özellikle ağır darbe aldı; OpenAI kimlik doğrulama sorunları bildirirken, Cursor ve Replit gibi yapay zeka kodlama platformları tamamen çevrimdışı kaldı.
Google'ın Site Reliability Engineering (SRE) ekibi, temel nedeni 10 dakika içinde tespit etti ve 40 dakika içinde çözüm uygulamaya başladı. Ancak tam iyileşme çok daha uzun sürdü; bazı bölgelerde (özellikle us-central1) kesintiler üç saate kadar devam etti. Olay resmi olarak 20:49 UTC'de (13:49 PDT) sona erdi.
Bu kesinti, internetin bulut altyapısına artan bağımlılığını çarpıcı biçimde hatırlattı. Google Cloud Başkanı Thomas Kurian'ın da kabul ettiği gibi: "Müşterilerimize yaşattığımız bu aksaklıktan dolayı üzgünüz." Olay, gelecekte benzer arızaların önlenmesi için daha sağlam hata yönetimi, daha iyi test prosedürleri ve bulut bağımlılığının çeşitlendirilmesi gerekliliği konusunda tartışmaları beraberinde getirdi.