فارغ از شوخی و متلکهایی که به قطعی سراسری شبکههای فیسبوک، اینستاگرام و واتساپ شده، در حوزهی مدیریت خدمات با چارچوب ITIL این اتفاق، یک مشکل ناشناخته است. چنین مشکلاتی در هر کسب و کاری بخصوص فناوری اطلاعات بهوفور رخ میدهد فیسبوک پیش از مالکیت اینستاگرام و واتساپ هم چالشهایی از این دست در سطح جهانی داشته.
اساس کار مدیریت مشکل برای حل مسئله در این سناریو بدین گونه است:
اندازهگیری تاثیر خرابی؟: آیا مشکل فقط در برخی نقاط جهان است یا همه: تمام جهان.
علائم خرابی؟: باز نشدن اپلیکیشنهای مرتبط و وبسایت
دلیل و عامل خرابی؟: دلیل قطع شدن این سرویسها بلافاصله مشخص نشده. با این حال، چندین کارشناس امنیتی به سرعت، وجود مشکل در سیستم نام دامنه (DNS) را به عنوان عامل احتمالی یاد کردند. آزمایشات آنها نشان میدهد که قطعی به دلیل نقص مداوم DNS است.(DNS نام وبسایتها را به آدرسهای اینترنتی IP ترجمه میکند که توسط رایانه قابل خواندن است. اغلب به آن "دفترچه تلفن اینترنت" نیز میگویند.)
راهکار موقت؟: شاید با دسترسی کاربران از طریق IP و حذف موقت DNS مشکل در برخی نقاط بطور موقت مرتفع شود.
راهکار دائم؟: پس از مشخص شدن علت اصلی و آزمایشات انجام شده، راهحل دائمی برای آن ارایه میشود تا از وقوع دوباره و عود مجدد مشکل جلوگیری گردد.
آیا این یک خطای شناخته شده بود؟: قطعاً خیر. زیرا در حد شرکت بزرگ و چندملیتی اگر چنین مشکلی از قبل رخ داده بود برچسب خطای شناخته شده میگرفت و سریعاً رفع رجوع میشد.
زمان حل مشکل؟: نامشخص! بدلیل عدم شناخت علت و عامل خرابی.
بهترین کار در چنین شرایطی، علیرغم اینکه میلیونها دلار این شرکت را زیانده خواهد کرد، حفظ خونسردی است. سپس اطلاعرسانی عمومی برای جلوگیری از ترافیک درخواستها، بازخوردها و عدم تزریق استرس بیشتر به کارشناسان فنی و در آخر استفاده از راهکارهای موقت برای به حالت اول بازگرداندن سرویس ولو موقتی.
در آمریکا، بسیاری از مردم، اینترنت را همین شبکههای محبوب مینامند. جدای از زیان این شرکت، کسب و کارهای بیشماری متحمل خسارت میشوند.
بهرحال این یک مشکل است و طبق مدیریت مشکل نیازمند زمان، تحلیل و آزمایش برای رفع ریشهای آن است.