menu
close

Google Cloud IAM-storing legt wereldwijde internetdiensten plat

Een kritieke storing in het Identity and Access Management (IAM)-systeem van Google Cloud op 12 juni 2025 veroorzaakte wereldwijde verstoringen van internetdiensten. De storing, veroorzaakt door een software-update met gebrekkige foutafhandeling, trof meer dan 50 Google Cloud-diensten in ruim 40 regio’s. Grote platforms zoals Spotify, Discord, OpenAI en Cloudflare werden zwaar getroffen, wat de groeiende afhankelijkheid van cruciale infrastructuur van clouddiensten onderstreept.
Google Cloud IAM-storing legt wereldwijde internetdiensten plat

Op 12 juni 2025 leidde een ogenschijnlijk kleine beleidswijziging in de infrastructuur van Google Cloud tot een kettingreactie die grote delen van het internet urenlang platlegde, met gevolgen voor miljoenen gebruikers en bedrijven wereldwijd.

Het incident begon om 10:51 uur PDT toen een beleidsupdate met onbedoeld lege velden werd doorgevoerd in de regionale Spanner-databases van Google Cloud. Hierdoor werd sluimerende code geactiveerd die al op 29 mei was uitgerold, maar nooit goed was getest. Deze code, die niet beschikte over adequate foutafhandeling of bescherming via feature flags, stuitte op null-waarden die niet verwerkt konden worden, waardoor de Service Control-binaries van Google in meerdere regio’s tegelijk crashten.

De storing trof specifiek de Identity and Access Management (IAM)-functionaliteit van Google, die verantwoordelijk is voor het autoriseren van verzoeken en het bepalen welke acties geauthenticeerde gebruikers en diensten mogen uitvoeren. Toen de IAM-diensten uitvielen, verspreidde de verstoring zich snel naar essentiële cloudcomponenten zoals App Engine, Firestore, Cloud SQL, BigQuery en Memorystore.

De impact van de storing was groot en trof zowel Google’s eigen diensten als die van derden. Google Workspace-applicaties zoals Gmail, Drive, Docs en Meet waren niet bereikbaar. Grote consumentenplatforms zoals Spotify (met circa 46.000 getroffen gebruikers), Discord, Snapchat en Twitch kenden aanzienlijke uitval. AI-diensten werden bijzonder hard geraakt: OpenAI meldde authenticatieproblemen, terwijl AI-codingplatforms als Cursor en Replit volledig offline gingen.

Het Site Reliability Engineering-team van Google vond binnen 10 minuten de oorzaak en begon binnen 40 minuten met het doorvoeren van oplossingen. Toch duurde het aanzienlijk langer voordat alles volledig hersteld was; sommige regio’s (met name us-central1) hadden tot drie uur last van uitval. Het incident werd officieel beëindigd om 20:49 UTC (13:49 uur PDT).

Deze storing is een duidelijke waarschuwing voor de groeiende afhankelijkheid van het internet van cloudinfrastructuur. Zoals Thomas Kurian, hoofd van Google Cloud, erkende: "We betreuren de overlast die dit onze klanten heeft bezorgd." Het incident heeft geleid tot discussies over de noodzaak van robuustere foutafhandeling, betere testprocedures en meer spreiding van cloudafhankelijkheden om soortgelijke storingen in de toekomst te voorkomen.

Source:

Latest News