ANALITYKA BIG DATA

Biznes oparty na danych: CMO pyta CTO o Big data

Wzrost ilości wdrożeń analityki wielkich zbiorów danych – Big data – jest napędzany przede wszystkim dynamicznym rozwojem usług w chmurze. Chmura publiczna to przyszłość analityki Big data w przedsiębiorstwach, choćby dlatego że wykorzystanie chmury daje możliwość stworzenia jednej, spójnej platformy, niezbędnej do uzyskania pełnej wartości biznesowej.

Jak pokazały przeprowadzone niedawno badania wśród polskich przedsiębiorstw, firmy co prawda gromadzą dane, ale nie mają świadomości ich potencjału i nie wykorzystują faktu ich posiadania w kreowaniu wartości dodanej dla biznesu.

Big data – to już 20 lat

Termin Big data stał się częścią technologicznego leksykonu pod koniec lat 90., kiedy John Mashey, Chief Scientist w SGI zastosował to wyrażenie do opisania ogromnych i stale rosnących zasobów danych przedsiębiorstw, które były trudne do przechowywania i analizy przy użyciu dostępnej wtedy technologii. Z kolei w 2001 r. analityk Gartnera Doug Laney zaproponował definicję Big data, która charakteryzowała dane za pomocą reguły „trzech V”: Volume (objętość), Velocity (prędkość) i Variety (różnorodność). W ciągu następnych kilku lat definicja Laney’a stała się czymś w rodzaju standardu branżowego, a z czasem rozszerzano definicję o kolejne ‘V’ oznaczające Variability (zmienność) czy też Veracity (wiarygodność). Przełomowy okazał się rok 2005, kiedy to Yahoo udostępniło społeczności open source platformę Hadoop – o rozproszonej architekturze, pozwalającą gromadzić i przetwarzać ogromne zbiory danych w skali dotychczas niedostępnej. Był to impuls dla rozwoju całego ekosystemu zarówno komercyjnych jak i otwartych rozwiązań do gromadzenia i analizy dużych zbiorów danych dla przedsiębiorstw.

Obecnie punkt ciężkości z rozwiązań technologicznych, pozwalających gromadzić i zarządzać rosnącą ilością danych różnego rodzaju, przesuwa się w kierunku analityki, data science i uczenia maszynowego. Wg badań obejmujących gospodarki dojrzałe – zarządzanie danymi jest w firmach traktowane jako część podstawowej działalności. Biznes koncentruje się obecnie na tym, jak posiadane dane przekuć na decyzje dające przewagę konkurencyjną. Konkluzje wspomnianego wyżej raportu z badania wśród polskich przedsiębiorstw pokazują, że jesteśmy w tym względzie nieco z tyłu.

Decyzje oparte na danych – ale jak to zrobić?

To pytanie zadają szefowie różnych obszarów w przedsiębiorstwach. A szczególne zainteresowane wykorzystaniem ogromnych zasobów danych w firmie wykazują CMO – szefowie marketingu, którym zanalizowane zettabajty ułatwiłyby zdobycie wiedzy o profilach, potrzebach i preferencjach ich klientów a to z kolei przyspieszyłoby wiele działań, także tych prowadzonych w czasie rzeczywistym. Zatem przychodzi taki moment, kiedy CTO „złapany” przez CMO musi odpowiedzieć na kilka pytań i doradzić, jak wykonać pierwsze kroki w kierunku biznesu opartego na danych.

Bastien Verdebout jest w OVH odpowiedzialny za rozwój produktów Big data, Databases, AI.

W rolę CTO wcielił się Bastien Verdebout, Product Manager Big data, Databases & AI w OVH

CMO: Na początku ustalmy fakty. Od marketerów oczekuje się podejmowania decyzji opartych na danych, ale to wymaga dostępu do danych, wiarygodnych danych. Samo ich gromadzenie nie dostarcza wartości dla biznesu. W idealnym świecie analizowalibyśmy i zestawialibyśmy posiadane dane w wartościowe biznesowo informacje decyzyjne. Jednak nasza codzienność to rozproszona infrastruktura i silosy informacyjne – sprzedaż stacjonarna, online, media społecznościowe, reklamacje czy obsługa klienta – każdy z obszarów w osobnych systemach. W jaki sposób podejście Big data może pomóc nam w dziale marketingu w integracji, weryfikacji i czyszczeniu już posiadanych danych?

CTO: Jeśli chodzi o dostęp do danych naszej firmy, to nawet jeśli są gromadzone w oddzielnych systemach, jestem pewien, że nie będzie z tym problemu, ponieważ jako CTO mogę poprosić o to mój zespół. Ale wskazałeś jedną bardzo ważną rzecz: jakość danych. Możemy mieć najlepsze narzędzia, ale rezultaty będą niewiarygodne z powodu zanieczyszczonych, zniekształconych czy niepełnych danych.

Technologie Big data pomagają w pobieraniu i czyszczeniu danych, szybkiej wizualizacji tego, co już posiadamy w naszych systemach. Przykład – w mojej poprzedniej firmie analizowaliśmy sprzedaż online, ale zapomnieliśmy usunąć operacje, gdzie występował problem płatności (jak fałszywa karta kredytowa itp.). Wyniki okazały się więc nierzetelne, przekłamane.

Z mojego punktu widzenia podejście Big data to ważny element strategii firmy. Musimy zainwestować w narzędzia, ale również zatrudnić menedżera ds. danych. Jego rolą powinno być zapewnienie kontroli danych i ich spójności (dla poszczególnych zespołów: marketingu, prawnego, bezpieczeństwa …). Niezbędna jest także ekspertyza danych.

Gdy będziemy już pewni jakości posiadanych danych, Big data z pewności pomoże ci w marketingu. To wy jesteście ekspertami od marketingu, nie mój zespół IT. Będziesz mógł zestawiać ze sobą informacje  z różnych silosów, znajdować wzorce zachowań, a w końcu podejmować lepsze decyzje, ponieważ zyskasz dużo lepsze zrozumienie zjawisk, jakie stoją za danymi.

Domyślam się, że zatrudnienie nowych pracowników może nie być łatwe, zanim nie pokażemy wymiernych rezultatów, dlatego właściwe podejście powinno polegać na precyzyjnym określeniu tego, co konkretnie zyskamy albo usprawnimy w wybranym obszarze. Na przykład skoncentruj się na reklamacjach i jakości obsługi klienta i samodzielnie zweryfikuj poprawność danych.

CMO: czym podejście Big data różni się od tradycyjnych rozwiązań Business Intelligence (BI)? Czy te podejścia się wykluczają?

CTO: Cóż, nie mamy ścisłych, słownikowych definicji dla tych pojęć, ale podzielę się moją wizją:

Big data to szersza koncepcja obejmująca to, w jaki sposób firma może działać w oparciu o dane, z kolei Business Intelligence jest częścią obszaru Big data. Wykorzystując ten sam zestaw danych możesz dostarczyć tradycyjną analizę BI, ale też inne rodzaje analiz typowych dla Big data.

Tradycyjne rozwiązania Business Intelligence są niezbyt skomplikowane. Gromadzisz wiele danych z różnych obszarów firmy, a zespół, głównie IT, generuje raporty na żądanie, pokazujące konkretne KPI, na przykład miesięczną sprzedaż online na terenie kraju lub średnią wartość koszyka klienta w ciągu ostatniego roku. Analizując  przeszłość, masz również możliwości predykcyjne, ale to wciąż bardzo podstawowe analizy. Musisz dokładnie zdefiniować to, czego szukasz, analogicznie jak w zapytaniach SQL: „Znajdź klientów, którzy najpierw zobaczyli naszą reklamę, następnie odwiedzili naszą stronę internetową, a potem zamówili coś online”.

Big data, jak powiedziałem, jest pojęciem szerszym, ponieważ jest poniekąd filozofią firmy wobec zbierania danych. Nowe narzędzia, jakie dostarcza Big data, pozwalają firmom takim jak nasza analizować i odkrywać w danych związki bez narzuconych a priori szablonów. Big data bardziej nadaje się do odpowiedzi na pytania: „Co robią nasi klienci przed złożeniem zamówienia online? Jakie są główne wzorce zachowań? Dowiedzmy się!”. Daje to możliwość pracy w oparciu o dane we wszystkich codziennych zadaniach.

Oba podejścia mogą być komplementarne w przypadku naszej firmy. Istotniejsze od samej technologii jest jednak to, co chcesz uzyskać. W marketingu – jeśli uważasz, że klienci mogą zachowywać się spontanicznie, być niestabilni w decyzjach i nie pasować do żadnego predefiniowanego, statycznego wzorca zachowań, Big data jest dla Ciebie!

CMO: fundamentalnym wyzwaniem dla mnie obecnie jest, jak zarządzać zaangażowaniem klientów i przekazem marketingowym w relacji do osób i segmentów z wykorzystaniem wielu kanałów. Funkcjonuje to pod nazwą Marketing Cloud. Czy musimy jednak migrować wszystkie dane do chmury? Niektóre dane i aplikacje powinny działać u nas lokalnie, więc ze swojej strony wolałbym rozwiązanie hybrydowe. Co byś sugerował?

CTO: Pytasz o dwie rzeczy.

Jeśli chodzi o to „czy moje dane powinny pozostać lokalnie”, odpowiem, że często dane są bezpieczniejsze w ramach chmury prywatnej oferowanej przez niektórych dostawców. Infrastruktura sprzętowa jest wtedy przeznaczona tylko dla jednego klienta, dostęp jest kontrolowany za pomocą reguł bezpieczeństwa i rejestrowany, centra danych mają wysokie certyfikacje, aby spełniać najwyższe standardy bezpieczeństwa, dane są replikowane z dużą częstotliwością, itp. Obawiałbym się bardziej naruszeń ze źródeł wewnętrznych, lokalnych niż źródeł z „zewnątrz” chmury prywatnej. Z wyjątkiem sytuacji, w których mamy prawny obowiązek przechowywania danych lokalnie, możemy jednak przenieść nasze dane do chmury publicznej.

Z kolei, jeśli chodzi o to „czy muszę wszystkie dane przenieść do chmury?” to krótka odpowiedź brzmi: nie. Najczęściej dostawcy rozwiązań Marketing Cloud jako usługi (SaaS), tacy jak Salesforce, mają interfejsy programistyczne do różnych baz danych, repozytoriów itp. Możesz więc przechowywać swoje wrażliwe dane lokalnie i autoryzować oprogramowanie dostawcy zezwalając na dostęp do nich. Podaj mi nazwę konkretnego oprogramowania, które cię interesuje, a my przeprowadzimy audyt bezpieczeństwa w naszym zespole.

Zaleciłbym również przeprowadzenie audytu naszych danych wewnętrznych (tutaj menedżer ds. danych byłby kluczową osobą), sprawdzenie czy dane są wrażliwe, potwierdzenie jakich danych naprawdę potrzebujemy w działaniach marketingowych, a następnie kontrolowanie tego, co przekazujemy online.

CMO: ostatnio powstało sporo szumu wokół pojęcia Customer Data Platform. CDP wzbudza moje zainteresowanie z kilku powodów: opiera się na Big data, umożliwia automatyzację oraz podejmowanie decyzji w czasie rzeczywistym. Co więcej, korzystanie z CDP przez dział marketingu wymaga niewielkiego wsparcia zespołu IT lub nawet wcale. Czy potrzebujemy zatem platformy Big data, aby wdrożyć u nas CDP?

CTO: Raczej nie. Dostawcy CDP proponują rozwiązania kompleksowe – nie tylko oprogramowanie, ale również przestrzeń dyskową, infrastrukturę, wszystko w modelu usługi (SaaS) dostępnej przez internet. Tak jak powiedziałeś, są skierowane do użytkowników końcowych, z niewielką wiedzą technologiczną. Zazwyczaj konieczny jest manualny import danych albo przyłączenie bazy danych czy innych źródeł, a dostawca utworzy i uruchomi dla ciebie klaster danych.

Po stronie zalet: prostota.

Po stronie wad: powielilibyśmy część naszego klastra. Sugerowałbym analizę kosztów przed podjęciem decyzji.

Podsumowując, mam taką samą odpowiedź, jak w przypadku Marketing Cloud: musielibyśmy wspólnie sprawdzić, do czego możemy wykorzystać to narzędzie i zaudytować bezpieczeństwo wybranego rozwiązania.

CMO: czy jesteśmy w stanie przedstawić naszemu CFO przekonujący model TCO (całkowitego kosztu posiadania) dla platformy Big Data? Automatyzacja, zadowolenie klienta, szybkie podejmowanie decyzji, dostępność – jestem w stanie określić wartościowo wszystkie te korzyści, ale co mamy po stronie kosztów?

CTO: Jasne, ale nie zrobię tego sam. Mogę oczywiście skalkulować całkowity koszt posiadania dla platformy Big data, ale wiedza specjalistyczna również jest potrzebna. Przydadzą się specjaliści data science lub firmę doradcza, która takie usługi oferuje.

Dla sporej części elementów infrastruktury ceny są publicznie dostępne u głównych dostawców usług w chmurze. Płacisz za moc obliczeniową, pamięć masową, ruch sieciowy, jak w przypadku każdej infrastruktury w chmurze. Niektóre dystrybucje Apache Hadoop znanych dostawców pozwolą nam uniknąć opłat licencyjnych. Mogę obliczyć w przybliżeniu wolumen danych, jaki będziemy potrzebować do codziennego pobierania i aktualizacji danych. To będzie bardzo zgrubna analiza, ale da nam jakiś pogląd.

Ty ze swojej strony, skontaktuj się z zespołem HR, aby sprawdzić możliwość rekrutacji osób o profilu analityka danych do zespołu marketingu, ja z kolei zrobię to samo pod kątem inżynierów danych do zespołu IT.

I jeszcze jedna rzecz na koniec: dyrektor finansowy musi zrozumieć, że bez platformy Big data nie będziemy mieli możliwości przetwarzania i analizy danych poza obecnymi platformami i będziemy musieli „odpytywać” nasze systemy produkcyjne bezpośrednio. Osobiście jestem przeciwny tego rodzaju praktykom, utrzymanie ciągłości działania systemów produkcyjnych jest krytyczne. Wykonywanie skomplikowanych zapytań w produkcyjnych bazach danych jest czasochłonne i ryzykowne. Redukcja obciążenia naszych platform produkcyjnych to kolejna zaleta, którą należy wymienić.

 

Chmura w Polsce: Dołącz do nas