Blog

Awaria Serwisu społecznościowego Facebook – Co się stało?

masz pytania? napisz do nas
5 października, 2021

Wprowadzenie do awarii

Dnia 04.10.2021 Serwis społecznościowy Facebook przestał działać na okres 6h. Co się stało? Co było powodem awarii

Wczorajszy dzień okazał się pechowy dla Facebook’a. Wszystkie jego usługi, z których obecnie możemy czerpać korzyści włączając w to:

  • Facebook
  • Instagram
  • Whats up
  • czy Oculus’a

przestały działać na okres około 6 godzin. Jest to niewątpliwie ogrommny czas, pociagający za sobą olbrzymie koszty, z którymi przyjdzie się im teraz zmierzyć. Co więcej, odnotowany został spadek ceny rynkowej giganta. Szacuje się bowiem, iż akcje firmy, spadły
o wartość 5%. Jeżeli chodzi o całkowitą stratę wynikającą z awarii, to około 50 miliardów dolarów.

Facebook na swoim blogu, zamieścił informację o przebiegu całego zdarzenia oraz tego, co tak naprawdę stało za największą awaarią działania całości architektury serwerowej projektu Pana Marka. Poniżej, znajdziecie Państwo skróconą wersję, w ktorej znajdują się
jedynie najważniejsze informacje.

Co się stało?

Posługując się językiem nieco bardziej technicznym – nie był to atak hakerów. Nie zidentyfikowano również incydentu naruszenia bezpieczeństwa bądź wycieku danych. Chodziło w dużej mierze o zmianę konfiguracji routerów.
Problem okazał się na tyle niecodzienny, że inżynierom organizacji identyfikacja nieprawidłowości, zajęła znaczy okres czasu, dlatego też serwis nie działał tak dlugo.

Co więcej, przez sam irracjonalizm sytuacji, administratorzy odpowiedzialni za infrastrukturę, mieli niemałe problemy gdy próbowali dostać sie do budynku w celu resetu serwerów routowych. Dlaczego? Ich karty dostępowe przestały działać.

Wczoraj, gdy serwis nie dawał znaku życia, po użyciu curl’a używając polecenia: curl -I https://facebook.com, otrzymywaliśmy następujące nagłówki zwrotne:

  • Status: 503 Service Unavailable
  • proxy-status: no_server_available

A zatem, co jest niesamowicie fascynujące, serwer reverse proxy, nie był w stanie rozwiązać żadnego z dostępnych serwerów, nie był w stanie rozwiązać żadnego żądania pochodzącego ze świata.

Dlatego też stwierdzono, że potencjalnym problemem
może okazać się albo błędna konfiguracja wewnętrznych serwerów DNS.

Nie był to całkowicie chybiony strzał, ponieważ – jak okazało się później, tak jak wspomniełem wcześniej – problem był spowodowany nie działającym routingiem, ale …

Kto, lub co za tym stało?

Tak naprawdę stał za tym BGP – Border Gateway Protocol. Jest to mechanizm odpowiedzialny za wymianę informacji ścieżek (routingów) w internecie.

Jeżeli jesteście zainteresowani aspektami bardziej technicznymi, serdecznie zapraszamy do zapoznania się z tym artykułem. Autor podjął się wyjaśnienia nie tylko czym dokładnie jest wspomniany protokół,
ale też wyjaśnil dlaczego serwery DNS, nie były w stanie rozwiązać wewnętrznych nazw, co spowodowało, że użytkownicy byli zmuszeni do tymczasowego zaprzestanie używania Facebooka.

Jak widzimy, historia ponownie zatacza błędne koło. To nie luka w systemie spowodowała tak ogromne straty organizacji. Nie stał za tym również ani żadna grupa hakerska która
próbowałaby doprowadzić do wycieku danych użytkowników. Było to spowodane wyłącznie przez ludzki bląd bądź zwykłe niedopatrzenie.

Mała ciekawostka na koniec

Spójrzcie proszę, co stało się w momencie zaistnienia awarii Facebooka. Jak wzróssł ruch na witrynach pokrewnych oraz komunikatorach takich jak na przykład Signal, Twitter, czy też zwykły Telegram.

Wydaje się to być nie tyle co intrygujące, co ciekawe. Z drugiej zaś strony nie powinno nas to dziwić, chociażby dlatego, że popyt na tego typu uslugi wciąż jest bardzo wysoki.

Zadzaiały tak naprawdę zwykłe prawa ekonomii. Jeżeli istnieje popyt, a podaż u jednego z dostawców zostanie ograniczony – konsumenci wybiorą alternatywę.

Po więcej tego rodzaju artykułów, zapraszamy tutaj

Tagi: ,

Kategorie