Po latach propagandy gigantów technologicznych, dostawców chmury publicznej, infrastruktury i sieci o zaletach chmury publicznej takich jak skalowalność i zasoby na żądanie, roztaczających wizje możliwości wykorzystania niemal nieograniczonej mocy obliczeniowej, przepustowości, zasobów dyskowych i wielu innych usług przez klientów w zależności od potrzeb – przyszedł moment, w którym życie napisało własny scenariusz mówiąc: Sprawdzam!
Oczywiście powyższy wstęp jest celowo nieco prowokujący. Globalni dostawcy chmury publicznej jak AWS, Microsoft i Google znaleźli się na pierwszej linii frontu w walce o zapewnienie klientom odpowiedniej infrastruktury podczas zmasowanej akcji WFH i LFH (Work From Home / Learn From Home) nie mającej precedensu. Wespół z dostawcami na linii frontu znaleźli się operatorzy infrastruktury sieciowej (internet) i dostawcy rozwiązań VPN.
Większość pracowników umysłowych państw dotkniętych epidemią COVID-19 na całym świecie pracuje obecnie zdalnie, ocenia się, że może to być ok 1/2 do 2/3 z sektorów gospodarki i administracji publicznej w których dopuszczalna jest taka możliwość. Technologia chmury obliczeniowej jest tutaj zbawienna dla wielu organizacji. To chmury – głównie publiczne – umożliwiają dostarczanie rozwiązań tak niezbędnych do wykonywania pracy w obecnych warunkach jak komunikacja wideo i głosowa, narzędzia pracy grupowej, streamingu wideo, współdzielenia dokumentów czy nauki na odległość.
Stress-test chmury
Choć od dłuższego czasu obserwuje się masową (biorąc pod uwagę dynamikę wzrostów r-r) migrację do usług chmury publicznej przedsiębiorstw, to jednak wymagania związane z obecnym kryzysem znacząco podniosły poprzeczkę. Pandemia COVID-19 jest swego rodzaju testem warunków skrajnych (ang. stress-test) dla chmury obliczeniowej. Jak dotąd główni dostawcy nie notują większych problemów z powodu nagłego wzrostu obciążeń i skokowego wzrostu nowych użytkowników. Microsoft informuje o 775% wzroście wykorzystania usługi Teams w chmurze w przeciągu miesiąca we Włoszech, po wprowadzeniu zaostrzonych zasad izolacji społecznej. Pod koniec marca w przeciągu tygodnia przybyło 12 mln nowych użytkowników usługi a rekordowa jak dotąd dzienna liczba użytkowników osiągnęła 44 mln. Łączny dzienny czas spędzony przez użytkowników Teams na rozmowach osiąga 2,7 mld minut a liczba rozmów wideo w marcu wzrosła dziesięciokrotnie.
Skokowy wzrost popytu o rząd wielkości doprowadził do tego, że Microsoft nadał priorytet obciążeniom związanym z COVID-19 i nałożył bardziej rygorystyczne limity na darmowe usługi w chmurze dla nowych użytkowników. Przyznał też, że poziom SLA dotyczący dostępności 99,99% nie został utrzymany przez cały czas od wybuchu pandemii. Jednak choć zdarzały się incydenty nie zanotowano większych awarii, które można by przypisać obecnym warunkom. Zasadniczo, w opinii dostawców chmury COVID-19 oznacza wzrost obciążeń do poziomów porównywalnych z okresami podwyższonej aktywności zakupowej jak okres przedświąteczny czy Black Friday. Co więcej, wiodący dostawcy oceniają swoją zdolność do skalowania wzwyż dość optymistycznie oferując wiele bezpłatnych pakietów dla uczelni, szkół czy instytucji publicznych – zmuszonych do pracy i nauczania online. Trzech największych dostawców oferuje też pokaźne fundusze w postaci kredytów na usługi w chmurze dla zespołów badawczych prowadzących eksperymenty obliczeniowe w ramach programów poszukiwania szczepionki na SARS-CoV-2.
Google Meet, nowe narzędzie do wideokonferencji notowało w ostatnim czasie 60% wzrost wykorzystania z tygodnia na tydzień i notowane wykorzystanie usługi jest obecnie 25 razy wyższe niż jeszcze w styczniu – takie statystyki ujawnia Thomas Kurian we wpisie na blogu Google Cloud.
– Zaprojektowaliśmy naszą sieć z myślą o obsłudze dużych obciążeń. – mówi Urs Hölzle, SVP ds. infrastruktury w Google. – Ta sama infrastruktura, która została zbudowana do obsługi szczytowego zapotrzebowania, jak szał zakupowy Cyber Monday czy transmisji finałów Mistrzostw Świata, służy obecnie obsłudze zwiększonego ruchu, generowanego przez zapytania Google ludzi poszukujących aktualności, czy komunikujących się ze sobą podczas przymusowej pracy zdalnej spowodowanej pandemią. Chociaż widzimy znaczący wzrost liczby użytkowników i obciążenia dla produktów takich jak Hangouts Meet, czy wzmożone wykorzystanie YouTube, to obserwowane szczytowe poziomy ruchu mieszczą się w granicach naszej zdolności do obsługi.
Rynek w czasie pandemii
Zaledwie PIĘCIU dostawców kontroluje 70% przychodów z rynku chmury publicznej (o wartości ca 100 mld USD w 2019 r.), są to Amazon Web Services (AWS), Microsoft Azure, Google Cloud, IBM i Alibaba. Inni globalni gracze na tym rynku to Salesforce, Oracle Cloud, Tencent Cloud, Rackspace i VMware. Netflix jest z kolei największym dostawcą usług dystrybucji treści (wideo) w chmurze, hostowanym przez AWS. Warto o tym wspomnieć mając na uwadze uprzejmą prośbę jaką komisarz UE ds rynku wewnętrznego Thierry Breton wystosował do CEO Netflixa o „przycięcie” jakości streamingu aby odciążyć infrastrukturę w momencie, kiedy spora część gospodarki przesiadła się na tryb WFH. Platformy pracy grupowej, telekonferencji i narzędzia zdalnej pracy biurowej i nauczania online wypłynęły na pierwszą linię działań w odpowiedzi na COVID-19 szeroko adaptowane przez szkolnictwo, biznes jak i bardzo często administrację. Rozwiązania takie, jak Zoom, Slack, Blackboard, Microsoft Teams, WebEx (Cisco), Canvas, Google Classroom i Hangouts Meet, AnyMeeting – w większości działają w infrastrukturze chmury publicznej. Np. Blackboard jak i Zoom działają na AWS, choć Zoom posiada również własną infrastrukturę.
Podczas obecnego, wyjątkowego kryzysu bezpieczna architektura chmury publicznej staje się newralgiczna ze względu na liczbę dużych przedsiębiorstw, administracji rządowych, ale także gmin, MŚP, szkół i użytkowników domowych korzystających z niej codziennie. Ochrona przed cyberatakami, złośliwym oprogramowaniem, ransomware, wyciekami danych czy wyłączeniem infrastruktury (DDoS) z punktu widzenia zmagań z COVID-19 staje się nie mniej krytyczna dla utrzymania ciągłości działania jak samo zwalczanie wirusa, a ewentualny cyberatak przy obecnym obciążeniu i zależności o infrastruktury może mieć niszczycielskie skutki.
Ostatnie tygodnie udowodniły gotowość dostawców publicznej chmury obliczeniowej do obsłużenia ponadprzeciętnego zapotrzebowanie i tego obrazu nie zmącą mniejsze bądź większe awarie czy niedostępności usług, których skala jest nieproporcjonalnie mniejsza niż obserwowany, niespotykany wzrost wykorzystania. Skala złożoności jaką reprezentują sieci centrów przetwarzania danych trzech największych dostawców jest nieporównywalna z jakąkolwiek indywidualną infrastrukturą datacenter na świecie. AWS posiada 70 regionów swojej chmury publicznej, Microsoft Azure prawie 60, Google Cloud ponad 20. Regiony są ze sobą bezpośrednio połączone a obciążenia można między nimi przenosić i równoważyć, tworząc wirtualną chmurę prywatną (VPC). Aby zdać sobie sprawę ze złożoności infrastruktury chmurowej zilustrujmy to przykładem: w średniej wielkości centrum przetwarzania danych (tj. ok 50 MW) przyjmując przeciętną awaryjność dysków rocznie na poziomie 2%, każdego dnia dochodzi do awarii ok 100 dysków – czyli co 15 min. Podobnie prezentuje się złożoność takich funkcji jak zarządzanie energią, zautomatyzowana aktualizacja oprogramowania czy zarządzanie chłodzeniem oraz ich optymalizacja. Aby sprostać tym wyzwaniom zarządzanie centrami danych rozwinęło się do osobnej, ekstremalnej specjalności, w której na wielką skalę wykorzystywane są najnowsze osiągnięcia automatyzacji, internetu rzeczy i sztucznej inteligencji. Dzięki temu minimalizuje się ilość personelu koniecznego do obsługi i utrzymania działania DC na miejscu – czynnik, który okazuje się krytycznym wobec wyzwań pandemii.
SLA na czarnego łabędzia*
Choć w typowych umowach czy regulaminach korzystania z usług chmury publicznej znajdziemy raczej ustalenia wyłączające zobowiązania dostawców do utrzymania gwarantowanego poziomu usług w przypadku czynników losowych, klęsk żywiołowych czy – w ogólności – działania siły wyższej, to jednak przypadek pandemii został przez nich potraktowany jak wyzwanie. Jak wynika z przytoczonych powyżej przykładów nie tylko wszyscy gracze udźwignęli wzrost zapotrzebowania komercyjnego ale też w większości wsparli mocą obliczeniową inicjatywy badawcze, społeczne a także jednostki edukacyjne i uczelnie na całym świecie. Oczywiście – nie bezinteresownie. Obecna sytuacja, niezwykle uciążliwa społecznie i dramatyczna gospodarczo, jest jednocześnie szeroko zakrojonym, praktycznym eksperymentem pozwalającym bezpośrednio doświadczyć korzyści z chmury obliczeniowej jak i… nieuchronności jej adopcji przez biznes, sektor akademicki, publiczny.
Czy wyobrażamy sobie taką sytuację jeszcze dekadę temu? Nie są odosobnione opinie, że gdyby pandemia nastała 10 lat wcześniej nie zastanawialibyśmy się nad tym jak stawić czoła nadchodzącemu gospodarczemu tsunami. Gospodarcze i organizacyjne tsunami byłoby już faktem od kilku tygodni.
Dostawcy usług chmury obliczeniowej pokazują się jako jedni z niewielu biznesowych wygranych pandemii koronawirusa, kiedy zamykanie biur i placówek handlowych w USA i na świecie spowodowało wzrost aktywności w Internecie – uważa The Wall Street Journal. Z kolei David Linthicum zwraca uwagę na wyzwania czekające przedsiębiorstwa i branżę IT ery post pandemicznej. Masowe migracje firm do chmury spowodują wysycenie rynku z architektów i deweloperów aplikacji w chmurze a zdecydowana większość nieudanych transformacji spowodowana jest błędnymi decyzjami na etapie doboru odpowiednich platform i narzędzi do odpowiednich potrzeb – z kolei przyczyną błędnych decyzji jest brak doświadczenia projektantów. Innym efektem może być saturacja rynku dostawców rozwiązań w chmurze, od firm doradczych i integratorów po samych dostawców. Na chwilę obecną jednak…. tęsknimy za takimi wyzwaniami.
Awarie i problemy z dostępnością usług dostawców chmury publicznej (2 lutego – 19 marca). Źródło: ThousandAyes
* Czarny łabędź to zdarzenie lub zjawisko, które ma trzy cechy: jest nieoczekiwane (subiektywnie bardzo mało prawdopodobne); ma olbrzymie konsekwencje; w retrospektywie wydaje się, że było do przewidzenia i jest wytłumaczalne (Nassim Nicholas Taleb) Źródło