menu
close

Google Cloud IAM-haveri lamslog globala internettjänster

Ett kritiskt haveri i Google Clouds Identity and Access Management (IAM)-system den 12 juni 2025 orsakade omfattande störningar i internettjänster världen över. Avbrottet, som utlösts av en mjukvaruuppdatering med bristfällig felhantering, påverkade över 50 Google Cloud-tjänster i mer än 40 regioner. Stora plattformar som Spotify, Discord, OpenAI och Cloudflare drabbades av betydande driftstopp, vilket belyser den växande beroendeställningen av molntjänster inom kritisk infrastruktur.
Google Cloud IAM-haveri lamslog globala internettjänster

Den 12 juni 2025 ledde en till synes obetydlig policyändring i Google Clouds infrastruktur till ett kedjereaktionsartat haveri som slog ut stora delar av internet under flera timmar och påverkade miljontals användare och företag världen över.

Incidenten inleddes kl. 10:51 PDT när en policyuppdatering med oavsiktligt tomma fält infördes i Google Clouds regionala Spanner-databaser. Detta aktiverade vilande kod som hade distribuerats den 29 maj men aldrig testats ordentligt. Koden, som saknade adekvat felhantering och skydd via feature flags, stötte på null-värden den inte kunde hantera, vilket fick Googles Service Control-binärer att krascha samtidigt i flera regioner.

Haveriet drabbade särskilt Google Clouds Identity and Access Management (IAM)-funktionalitet, som ansvarar för att auktorisera förfrågningar och avgöra vilka åtgärder autentiserade användare och tjänster får utföra. När IAM-tjänsterna föll, spreds störningen snabbt till kritiska molnkomponenter såsom App Engine, Firestore, Cloud SQL, BigQuery och Memorystore.

Avbrottets påverkan var omfattande och drabbade både Googles egna tjänster och tredjepartsplattformar. Google Workspace-applikationer som Gmail, Drive, Docs och Meet blev otillgängliga. Stora konsumentplattformar som Spotify (med cirka 46 000 drabbade användare), Discord, Snapchat och Twitch upplevde betydande driftstopp. AI-tjänster drabbades särskilt hårt, där OpenAI rapporterade autentiseringsproblem och AI-kodningsplattformar som Cursor och Replit gick helt offline.

Googles Site Reliability Engineering-team identifierade grundorsaken inom 10 minuter och började implementera åtgärder inom 40 minuter. Full återställning tog dock betydligt längre tid, med vissa regioner (särskilt us-central1) som hade utökade avbrott på upp till tre timmar. Incidenten avslutades officiellt kl. 20:49 UTC (13:49 PDT).

Detta avbrott är en tydlig påminnelse om internets ökande beroende av molninfrastruktur. Som Thomas Kurian, chef för Google Cloud, konstaterade: "Vi beklagar den störning detta orsakade våra kunder." Händelsen har lett till diskussioner om behovet av mer robust felhantering, bättre testprocedurer och diversifierade molnberoenden för att förhindra liknande haverier i framtiden.

Source:

Latest News