Pada 12 Juni 2025, perubahan kebijakan yang tampaknya sepele di infrastruktur Google Cloud memicu kegagalan berantai yang melumpuhkan sebagian besar internet selama beberapa jam, memengaruhi jutaan pengguna dan bisnis di seluruh dunia.
Insiden ini dimulai pada pukul 10:51 AM PDT ketika pembaruan kebijakan yang berisi kolom kosong yang tidak disengaja dimasukkan ke dalam database Spanner regional milik Google Cloud. Hal ini mengaktifkan kode dorman yang telah diterapkan sejak 29 Mei namun belum pernah diuji secara menyeluruh. Kode tersebut, yang tidak memiliki penanganan error yang memadai dan perlindungan feature flag, menemui nilai null yang tidak dapat diproses, menyebabkan binary Service Control Google crash secara serentak di berbagai wilayah.
Kegagalan ini secara khusus berdampak pada fungsi Identity and Access Management (IAM) Google, yang bertanggung jawab mengotorisasi permintaan dan menentukan tindakan apa yang dapat dilakukan pengguna dan layanan yang telah terautentikasi. Ketika layanan IAM gagal, gangguan dengan cepat menyebar ke komponen cloud penting seperti App Engine, Firestore, Cloud SQL, BigQuery, dan Memorystore.
Dampak gangguan ini sangat luas, memengaruhi layanan milik Google sendiri maupun platform pihak ketiga. Aplikasi Google Workspace seperti Gmail, Drive, Docs, dan Meet menjadi tidak dapat diakses. Platform konsumen besar seperti Spotify (dengan sekitar 46.000 pengguna terdampak), Discord, Snapchat, dan Twitch mengalami downtime signifikan. Layanan AI terdampak paling parah, dengan OpenAI melaporkan masalah autentikasi, sementara platform coding AI seperti Cursor dan Replit benar-benar offline.
Tim Site Reliability Engineering Google mengidentifikasi akar masalah dalam waktu 10 menit dan mulai menerapkan mitigasi dalam 40 menit. Namun, pemulihan penuh memakan waktu jauh lebih lama, dengan beberapa wilayah (khususnya us-central1) mengalami gangguan hingga tiga jam. Insiden ini secara resmi dinyatakan berakhir pada pukul 20:49 UTC (1:49 PM PDT).
Gangguan ini menjadi pengingat nyata akan meningkatnya ketergantungan internet pada infrastruktur cloud. Seperti diakui oleh Thomas Kurian, kepala Google Cloud: "Kami menyesalkan gangguan yang terjadi pada pelanggan kami." Insiden ini memicu diskusi tentang perlunya penanganan error yang lebih kuat, prosedur pengujian yang lebih baik, dan diversifikasi ketergantungan cloud untuk mencegah kegagalan serupa di masa depan.