W poprzednim artykule przybliżony został model analityki danych jako usługi, czyli BDaaS (Big Data as-a-Service ). Tym razem z Billem Schmarzo, CTO EMC Corp. (nazywanym też “dziekanem ds. big data”) – podejmujemy próbę obalenia sześciu mitów narosłych wokół analityki dużych zbiorów danych.

CTO EMC demaskuje 6 mitów big data w 5 minut

Bill Schmarzo, CTO EMC Corp.

Bill Schmarzo, CTO EMC Corp.

Zaproszony w czerwcu br. przez Elizabeth Davis, dziekan University of San Francisco School of Management, Bill Schmarzo wziął udział w panelu dyskusyjnym podczas konferencji stowarzyszenia sprzedaży bezpośredniej (Direct Sales Association). W przydzielonym mu 5-minutowym okienku czasowym podjął wyzwanie polegające na zmierzeniu się z sześcioma stereotypami narosłymi wokół big data.

Mit #1: Każda firma potrzebuje strategii big data.

Prawda #1: Niepotrzebna jest strategia big data, lecz strategia biznesowa, która uwzględnia użycie narzędzi big data. Warunkiem osiągnięcia sukcesu przy korzystaniu z big data jest przede wszystkim  przyjęcie biznesowej perspektywy. Niezależnie od tego, czy celem jest optymalizacja kluczowych procesów biznesowych czy wynajdywanie nowych możliwości zarabiania pieniędzy lub poprawa satysfakcji klientów – to możliwości wydobywania i czerpania korzyści biznesowych z big data są wszędzie. Niepowodzenia projektów, w których są wykorzystywane big data, nie wynikają z braku możliwości biznesowych, ale z ich nadmiaru. Problem stanowi koncentracja na celu biznesowym i priorytetyzacja.

Mit #2: Inwestowanie w możliwości, jakie dają big data stanowi pierwszy krok w procesie wydobywania cennych informacji z danych.

Prawda #2: Zaczynaj, przede wszystkim mając na uwadze wyznaczony cel biznesowy.

Swoją podróż z big data warto rozpocząć koncentrując się na jednej kluczowej inicjatywie biznesowej. ważnej dla firmy – na wyznaczonym celu do osiągnięcia w ciągu najbliższych 9-12 miesięcy.

Mit #3: Big data są tylko dla dużych firm (big businesses).

Prawda #3: Wszystkie rodzaje przedsiębiorstw mogą i powinny korzystać z ekonomii big data.

Używanie big data (skalowalne architektury sprzętowe zbudowane na ogólnie dostępnych procesorach, narzędziach open source i platformach) – to 20x do 50x tańsze przechowywanie, zarządzanie i analiza danych w porównaniu z tradycyjnymi technologiami danych.

Grafika EMC

Grafika EMC

“Ekonomię big data” zapewniają cztery kluczowe funkcjonalności, których zastosowanie  pozwala wydobywać  z dużych zbiorów danych wartościowe informacje biznesowe:

  1. Dostęp do pełnej historii szczegółowych danych transakcyjnych i operacyjnych organizacji na poziomie jednostki (człowiek, maszyna lub urządzenie).
  2. Dostęp do rosnącej ilości danych niestrukturalnych, zarówno ze zbiorów wewnętrznych organizacji (uwagi konsumentów, notatki zespołów sprzedażowych, wymiana e-maili, specyfikacje produktów, zlecenia prac, badania kliniczne), jak i zbiorów zewnętrznych (dotyczących natężenia ruchu miejskiego, pogody, wyceny nieruchomości, zgłoszeń patentowych, badań naukowych, itd.).
  3. Analizy “na czas” oparte na danych, pozwalające wyznaczać optymalny czas na podejmowanie określonych działań (na podstawie zaangażowania klienta, korzystania z urządzeń, dzienniku logów).
  4. Zastosowanie analityki predykcyjnej (data mining, uczenie maszynowe, cognitive computing) na zbiorach danych wewnętrznych i zewnętrznych, w celu wykrywania problemów lub możliwości na poziomie jednostki.

Mit #4: Koncentracja na danych w celu rozpoznania możliwości przeprowadzenia wartościowych analiz.

Prawda #4: Koncentracja na decyzjach, które zarząd musi podjąć, żeby wspierać realizację wyznaczonych inicjatyw biznesowych. Decyzje są kluczowe, ponieważ stanowią pomost między biznesem a nauką o danych (data science).

Mit #5: Nauka o danych to tajemnicza dyscyplina, pełna złożoności technicznej.

Prawda #5: Nauka o danych polega na identyfikacji tych zmiennych i wskaźników, które pozwalają lepiej przewidywać wydajność.

Mit #6: Data science jest tylko dla badaczy danych (data scientist).

Prawda #6: Użytkownicy biznesowi powinni myśleć jak badacze danych.

data scientistKto jest najlepszym źródłem zmiennych i wskaźników wymienionych w micie #5? Ludzie, którzy na co dzień pracują w swoich branżach – użytkownicy biznesowi (np. kierownicy sklepów, lekarze, pielęgniarki, nauczyciele, technicy, mechanicy, marketingowcy, sprzedawcy, itp.). Żeby zaczęli myśleć “jak badacze danych” (szerzej i bardziej twórczo o potencjalnych zmiennych i wskaźnikach), warto żeby brali pod uwagę następujące kwestie:

  • zamiast zadawać pytania opisowe o tym, co działo się, formułować predykcyjne pytania dotyczące tego, co może się zdarzyć, oraz opisowe – dotyczące tego, co należy zrobić;
  • starać się zrozumieć wagę wyników uzyskanych z agregacji wielu różnych zmiennych i danych związanych z określoną kategorią;
  • rozumieć konsekwencje doświadczeń użytkownika, czyli jak dostarczać wyniki analiz pracownikom, menedżerom i klientom, żeby były dla nich zrozumiałe i wskazywały kierunki działań?
Grafika EMC

Grafika EMC

Pracując z zespołami analityków danych, zdałem sobie sprawę, że powinniśmy zająć się też drugą stroną medalu; musimy nauczyć badaczy danych myśleć jak biznesmeni – podsumowuje Bill Schmarzo CTO i „Dean of Big Data” i dodaje:Aby efektywniej zaangażować użytkowników biznesowych, zespół naukowy zajmujący się analityką musi  m.in. umieć powiązać wyniki analizy z kluczowymi inicjatywami w organizacji, a dokładniej – z kluczowymi decyzjami biznesowymi, które je napędzają.

Na koniec polecam bardzo ciekawy i skłaniający do refleksji film The Human Face of Big Data. Warto poświęcić mu ok. 50 min. Szczególne wrażenie robią wizualizacje dużych zbiorów dynamicznie zmieniających się danych.

Napisane przez Stefan Kaczmarek