menu
close

Eșecul Google Cloud IAM Paralizează Serviciile Internet Globale

O defecțiune critică în sistemul de Identitate și Management al Accesului (IAM) al Google Cloud, produsă pe 12 iunie 2025, a declanșat întreruperi masive ale serviciilor de internet la nivel mondial. Pana, cauzată de un update software cu gestionare insuficientă a erorilor, a afectat peste 50 de servicii Google Cloud din peste 40 de regiuni. Platforme majore precum Spotify, Discord, OpenAI și Cloudflare au suferit perioade semnificative de nefuncționare, evidențiind dependența tot mai mare a infrastructurii critice de serviciile cloud.
Eșecul Google Cloud IAM Paralizează Serviciile Internet Globale

Pe 12 iunie 2025, o aparent minoră modificare de politică în infrastructura Google Cloud a declanșat o defecțiune în lanț care a dus la căderea unor porțiuni vaste ale internetului timp de câteva ore, afectând milioane de utilizatori și companii din întreaga lume.

Incidentul a început la ora 10:51 AM PDT, când o actualizare de politică ce conținea câmpuri goale neintenționate a fost introdusă în bazele de date Spanner regionale ale Google Cloud. Aceasta a activat un cod latent, implementat pe 29 mai, dar niciodată testat corespunzător. Codul, lipsit de gestionare adecvată a erorilor și de protecție prin feature flag, a întâlnit valori nule pe care nu le putea procesa, ceea ce a determinat prăbușirea binarelor Service Control ale Google în mai multe regiuni simultan.

Defecțiunea a afectat în mod special funcționalitatea de Identitate și Management al Accesului (IAM) a Google, responsabilă cu autorizarea solicitărilor și determinarea acțiunilor pe care utilizatorii și serviciile autentificate le pot efectua. Pe măsură ce serviciile IAM au cedat, întreruperea s-a extins rapid către componente cloud critice precum App Engine, Firestore, Cloud SQL, BigQuery și Memorystore.

Impactul penei a fost extins, afectând atât serviciile proprii Google, cât și platforme terțe. Aplicațiile Google Workspace, inclusiv Gmail, Drive, Docs și Meet, au devenit inaccesibile. Platforme majore pentru consumatori, precum Spotify (cu aproximativ 46.000 de utilizatori afectați), Discord, Snapchat și Twitch, au înregistrat perioade semnificative de nefuncționare. Serviciile AI au fost deosebit de afectate, OpenAI raportând probleme de autentificare, iar platforme de programare asistată de AI precum Cursor și Replit au fost complet offline.

Echipa de Site Reliability Engineering a Google a identificat cauza principală în 10 minute și a început implementarea măsurilor de remediere în 40 de minute. Cu toate acestea, recuperarea completă a durat semnificativ mai mult, unele regiuni (în special us-central1) confruntându-se cu întreruperi prelungite de până la trei ore. Incidentul s-a încheiat oficial la ora 20:49 UTC (1:49 PM PDT).

Această pană servește drept un avertisment clar privind dependența tot mai mare a internetului de infrastructura cloud. După cum a recunoscut Thomas Kurian, șeful Google Cloud: „Regretăm perturbarea cauzată clienților noștri.” Incidentul a generat discuții despre necesitatea unei gestionări mai robuste a erorilor, a unor proceduri de testare mai riguroase și a diversificării dependențelor cloud pentru a preveni incidente similare în viitor.

Source:

Latest News