menu
close

فشل إدارة الهوية والوصول في Google Cloud يشل خدمات الإنترنت العالمية

تسبب فشل حرج في نظام إدارة الهوية والوصول (IAM) في Google Cloud بتاريخ 12 يونيو 2025 في تعطيل واسع النطاق لخدمات الإنترنت حول العالم. وأدى الانقطاع، الناتج عن تحديث برمجي يفتقر إلى معالجة الأخطاء بشكل كافٍ، إلى تأثر أكثر من 50 خدمة من خدمات Google Cloud في أكثر من 40 منطقة. وقد شهدت منصات رئيسية مثل Spotify وDiscord وOpenAI وCloudflare توقفاً كبيراً، مما يسلط الضوء على الاعتماد المتزايد للبنية التحتية الحيوية على خدمات السحابة.
فشل إدارة الهوية والوصول في Google Cloud يشل خدمات الإنترنت العالمية

في 12 يونيو 2025، أدى تغيير بسيط ظاهرياً في سياسات بنية Google Cloud التحتية إلى سلسلة من الأعطال المتتابعة التي تسببت في توقف أجزاء كبيرة من الإنترنت لعدة ساعات، مما أثر على ملايين المستخدمين والشركات حول العالم.

بدأت الحادثة في الساعة 10:51 صباحاً بتوقيت المحيط الهادئ، عندما تم إدراج تحديث للسياسات يحتوي على حقول فارغة غير مقصودة في قواعد بيانات Spanner الإقليمية الخاصة بـ Google Cloud. هذا التغيير فعّل شيفرة برمجية خاملة تم نشرها في 29 مايو لكنها لم تُختبر بشكل كافٍ. الشيفرة، التي كانت تفتقر إلى معالجة الأخطاء المناسبة وحماية أعلام الميزات، واجهت قيماً فارغة (null) لم تستطع التعامل معها، مما أدى إلى تعطل برامج التحكم بالخدمات لدى Google في عدة مناطق في نفس الوقت.

تأثر هذا الفشل بشكل خاص بوظائف إدارة الهوية والوصول (IAM) لدى Google، وهي المسؤولة عن تفويض الطلبات وتحديد ما يمكن للمستخدمين والخدمات المصادق عليهم القيام به. ومع تعطل خدمات IAM، انتشر الانقطاع بسرعة إلى مكونات سحابية حيوية مثل App Engine وFirestore وCloud SQL وBigQuery وMemorystore.

كان تأثير الانقطاع واسع النطاق، حيث طال خدمات Google نفسها ومنصات الطرف الثالث. أصبحت تطبيقات Google Workspace مثل Gmail وDrive وDocs وMeet غير متاحة. كما شهدت منصات استهلاكية رئيسية مثل Spotify (مع حوالي 46,000 مستخدم متأثر)، وDiscord، وSnapchat، وTwitch توقفاً ملحوظاً. وتضررت خدمات الذكاء الاصطناعي بشكل خاص، حيث أبلغت OpenAI عن مشاكل في المصادقة، في حين توقفت منصات البرمجة بالذكاء الاصطناعي مثل Cursor وReplit عن العمل تماماً.

تمكن فريق هندسة موثوقية المواقع في Google من تحديد السبب الجذري خلال 10 دقائق، وبدأ في تنفيذ إجراءات التخفيف خلال 40 دقيقة. ومع ذلك، استغرق التعافي الكامل وقتاً أطول بكثير، حيث شهدت بعض المناطق (خاصة us-central1) انقطاعات ممتدة وصلت إلى ثلاث ساعات. وانتهت الحادثة رسمياً في الساعة 20:49 بتوقيت UTC (1:49 ظهراً بتوقيت المحيط الهادئ).

يعد هذا الانقطاع تذكيراً صارخاً بالاعتماد المتزايد للإنترنت على البنية التحتية السحابية. وكما أقر توماس كورين، رئيس Google Cloud: "نأسف للإزعاج الذي تسببنا به لعملائنا". وقد أثارت الحادثة نقاشات حول الحاجة إلى تحسين معالجة الأخطاء، وتعزيز إجراءات الاختبار، وتنويع الاعتماد على الخدمات السحابية لتجنب تكرار مثل هذه الأعطال مستقبلاً.

Source:

Latest News