Dana 12. lipnja 2025. naizgled manja promjena politike u infrastrukturi Google Clouda pokrenula je lančani kvar koji je na nekoliko sati srušio velike dijelove interneta, utječući na milijune korisnika i tvrtki širom svijeta.
Incident je započeo u 10:51 po pacifičkom vremenu kada je ažuriranje politike s nenamjerno praznim poljima uneseno u regionalne Spanner baze podataka Google Clouda. Time je aktiviran neiskorišteni kod koji je bio implementiran 29. svibnja, ali nikada nije ispravno testiran. Taj kod, koji nije imao odgovarajuće rukovanje greškama ni zaštitu putem feature flagova, naišao je na null vrijednosti koje nije mogao obraditi, što je uzrokovalo rušenje Service Control binarnih datoteka Googlea u više regija istovremeno.
Kvar je posebno pogodio funkcionalnost Googleova sustava za upravljanje identitetom i pristupom (IAM), koji je zadužen za autorizaciju zahtjeva i određivanje koje radnje ovlašteni korisnici i servisi mogu izvršavati. Kako su IAM usluge otkazivale, prekid se brzo proširio na ključne cloud komponente, uključujući App Engine, Firestore, Cloud SQL, BigQuery i Memorystore.
Utjecaj prekida bio je širok, zahvativši i Googleove vlastite usluge i platforme trećih strana. Google Workspace aplikacije poput Gmaila, Drivea, Docsa i Meeta postale su nedostupne. Velike potrošačke platforme poput Spotifyja (s otprilike 46.000 pogođenih korisnika), Discorda, Snapchata i Twitcha doživjele su značajne zastoje. AI servisi su bili posebno pogođeni, pri čemu je OpenAI prijavio probleme s autentifikacijom, dok su AI platforme za kodiranje poput Cursora i Replita bile potpuno izvan funkcije.
Googleov tim za pouzdanost stranica (Site Reliability Engineering) identificirao je uzrok kvara unutar 10 minuta i započeo s ublažavanjem posljedica unutar 40 minuta. Ipak, potpuni oporavak trajao je znatno dulje, a neke regije (posebno us-central1) iskusile su produžene prekide do tri sata. Incident je službeno završio u 20:49 UTC (13:49 po pacifičkom vremenu).
Ovaj prekid snažno podsjeća na sve veću ovisnost interneta o cloud infrastrukturi. Kako je priznao Thomas Kurian, voditelj Google Clouda: "Žao nam je zbog prekida koji smo prouzročili našim korisnicima." Incident je potaknuo rasprave o potrebi za robusnijim rukovanjem greškama, boljim testiranjem i diverzifikacijom ovisnosti o cloud uslugama kako bi se spriječili slični kvarovi u budućnosti.