menu
close

Guasto IAM di Google Cloud Paralizza i Servizi Internet Globali

Un grave malfunzionamento nel sistema di Identity and Access Management (IAM) di Google Cloud il 12 giugno 2025 ha causato diffuse interruzioni dei servizi internet a livello mondiale. Il blackout, provocato da un aggiornamento software con gestione degli errori inadeguata, ha interessato oltre 50 servizi Google Cloud in più di 40 regioni. Piattaforme di rilievo come Spotify, Discord, OpenAI e Cloudflare hanno subito importanti periodi di inattività, evidenziando la crescente dipendenza delle infrastrutture critiche dai servizi cloud.
Guasto IAM di Google Cloud Paralizza i Servizi Internet Globali

Il 12 giugno 2025, una modifica apparentemente minore nelle policy dell’infrastruttura di Google Cloud ha innescato un guasto a cascata che ha messo fuori uso ampie porzioni di internet per diverse ore, colpendo milioni di utenti e aziende in tutto il mondo.

L’incidente è iniziato alle 10:51 AM PDT, quando un aggiornamento delle policy contenente campi vuoti non previsti è stato inserito nei database regionali Spanner di Google Cloud. Questo ha attivato un codice dormiente, distribuito il 29 maggio ma mai testato adeguatamente. Il codice, privo di una corretta gestione degli errori e di protezione tramite feature flag, si è trovato a gestire valori nulli non previsti, causando il crash dei binari Service Control di Google in più regioni contemporaneamente.

Il guasto ha colpito in particolare la funzionalità di Identity and Access Management (IAM) di Google, responsabile dell’autorizzazione delle richieste e della determinazione delle azioni consentite a utenti e servizi autenticati. Con il malfunzionamento dei servizi IAM, il disservizio si è rapidamente esteso a componenti cloud critici come App Engine, Firestore, Cloud SQL, BigQuery e Memorystore.

L’impatto dell’interruzione è stato esteso, coinvolgendo sia i servizi Google sia piattaforme di terze parti. Le applicazioni Google Workspace, tra cui Gmail, Drive, Docs e Meet, sono diventate inaccessibili. Importanti piattaforme consumer come Spotify (con circa 46.000 utenti colpiti), Discord, Snapchat e Twitch hanno subito significativi periodi di inattività. I servizi di intelligenza artificiale sono stati particolarmente colpiti: OpenAI ha segnalato problemi di autenticazione, mentre piattaforme di coding AI come Cursor e Replit sono risultate completamente offline.

Il team Site Reliability Engineering di Google ha identificato la causa principale entro 10 minuti e ha iniziato a implementare le prime soluzioni entro 40 minuti. Tuttavia, il ripristino completo ha richiesto molto più tempo, con alcune regioni (in particolare us-central1) che hanno registrato interruzioni prolungate fino a tre ore. L’incidente si è ufficialmente concluso alle 20:49 UTC (13:49 PDT).

Questo blackout rappresenta un chiaro monito sulla crescente dipendenza di internet dalle infrastrutture cloud. Come ha riconosciuto Thomas Kurian, responsabile di Google Cloud: "Ci rammarichiamo per i disagi causati ai nostri clienti." L’evento ha avviato un dibattito sulla necessità di una gestione degli errori più robusta, procedure di test più rigorose e una maggiore diversificazione delle dipendenze cloud per prevenire simili guasti in futuro.

Source:

Latest News