menu
close

Pagpalya ng Google Cloud IAM, Nagdulot ng Malawakang Pagkaantala sa mga Serbisyo ng Internet sa Buong Mundo

Isang kritikal na aberya sa Identity and Access Management (IAM) system ng Google Cloud noong Hunyo 12, 2025 ang nagdulot ng malawakang pagkaantala sa mga serbisyo ng internet sa buong mundo. Ang insidente, na sanhi ng isang software update na kulang sa tamang error handling, ay nakaapekto sa mahigit 50 serbisyo ng Google Cloud sa higit 40 rehiyon. Malalaking plataporma gaya ng Spotify, Discord, OpenAI, at Cloudflare ay nakaranas ng matinding downtime, na nagbunyag ng lumalaking pagdepende ng mahahalagang imprastraktura sa mga cloud service.
Pagpalya ng Google Cloud IAM, Nagdulot ng Malawakang Pagkaantala sa mga Serbisyo ng Internet sa Buong Mundo

Noong Hunyo 12, 2025, isang tila maliit na pagbabago sa polisiya ng imprastraktura ng Google Cloud ang nagpasimula ng sunud-sunod na aberya na nagpatigil sa malaking bahagi ng internet sa loob ng ilang oras, na nakaapekto sa milyun-milyong gumagamit at negosyo sa buong mundo.

Nagsimula ang insidente bandang 10:51 AM PDT nang maipasok ang isang policy update na may hindi inaasahang blankong field sa mga regional Spanner database ng Google Cloud. Dahil dito, na-activate ang dormant code na na-deploy pa noong Mayo 29 ngunit hindi kailanman nasubok nang maayos. Ang code na ito, na kulang sa tamang error handling at feature flag protection, ay nakatagpo ng mga null value na hindi nito kayang i-proseso, dahilan upang mag-crash ang Service Control binaries ng Google sa maraming rehiyon nang sabay-sabay.

Partikular na naapektuhan ng aberya ang Identity and Access Management (IAM) functionality ng Google, na siyang responsable sa pag-authorize ng mga request at pagtukoy kung anong mga aksyon ang maaaring gawin ng mga authenticated na user at serbisyo. Nang bumagsak ang IAM services, mabilis na kumalat ang pagkaantala sa mahahalagang bahagi ng cloud gaya ng App Engine, Firestore, Cloud SQL, BigQuery, at Memorystore.

Malawak ang naging epekto ng outage, na nakaapekto hindi lang sa mga sariling serbisyo ng Google kundi pati na rin sa mga third-party platform. Hindi naging accessible ang mga Google Workspace application gaya ng Gmail, Drive, Docs, at Meet. Malalaking consumer platform gaya ng Spotify (na may tinatayang 46,000 apektadong user), Discord, Snapchat, at Twitch ay nakaranas ng matinding downtime. Lalo namang naapektuhan ang mga AI service, kung saan iniulat ng OpenAI ang authentication issues, habang ang mga AI coding platform gaya ng Cursor at Replit ay tuluyang offline.

Natukoy ng Site Reliability Engineering team ng Google ang ugat ng problema sa loob ng 10 minuto at nagsimulang magpatupad ng mga solusyon sa loob ng 40 minuto. Gayunpaman, mas matagal ang inabot bago tuluyang makabawi ang lahat ng serbisyo, kung saan ang ilang rehiyon (lalo na ang us-central1) ay nakaranas ng pagkaantala ng hanggang tatlong oras. Pormal na nagtapos ang insidente bandang 20:49 UTC (1:49 PM PDT).

Nagsilbing matinding paalala ang insidenteng ito sa lumalaking pagdepende ng internet sa cloud infrastructure. Ayon kay Thomas Kurian, pinuno ng Google Cloud: “Ikinalulungkot namin ang abalang idinulot nito sa aming mga customer.” Nagbunsod ito ng mga diskusyon hinggil sa pangangailangan ng mas matatag na error handling, mas mahusay na testing procedures, at mas diversified na cloud dependencies upang maiwasan ang mga ganitong uri ng aberya sa hinaharap.

Source:

Latest News