WRZESIEŃ 2015 RUCHOMY CEL: DANE O KLIENCIE Prezentacja wyników badania poziomu zaawansowania analiz danych o klientach w polskich przedsiębiorstwach. Partner merytoryczny:
Inspiracją do przeprowadzenia badania stała się publikacja Harvard Business Review Data Scientist: The Sexiest Job of the 21st Century. Według Hala Variana, głównego ekonomisty Google, Big Data Scientist, czyli badacz danych, będzie jednym z najbardziej pożądanych zawodów w IT w ciągu najbliższej dekady. Od czasu publikacji minęły blisko 2 lata, a my postanowiliśmy sprawdzić, czy na naszym rodzimym rynku stanowisko, czy rola Data Scientist rzeczywiście nabrała tak dużego znaczenia. Przy okazji badania pozyskaliśmy również odpowiedzi na wiele innych pytań, jak np. w jakim zakresie badacz danych pełni swoją funkcje; czy zapotrzebowanie na analizę danych w polskich przedsiębiorstwach rzeczywiście wzrasta; czy wyższy poziom jakości i analiz danych o klientach ma rzeczywiste przełożenie na poziom ich obsługi; kto korzysta z tak wielkiej ilości gromadzonych danych; i czy w praktyce, polskie przedsiębiorstwa korzystają z potencjału tych danych? Charakterystyka grupy docelowej OBROTY [ MLN PLN, 2014 ] >200 53% 100-200 37% <100 10% LICZBA PRACOWNIKÓW >500 19% 250-500 27% 100-250 49% <100 Przeprowadzone badanie jest pierwszą w Polsce tego typu inicjatywą, a jego wyniki mają charakter informacyjny i ujawniają m.in.: Najczęstsze źródła danych, cele gromadzenia i przetwarzania danych oraz stosowanie modeli danych o klientach w analityce biznesowej CZY DZIAŁ ANALIZ FUNKCJONUJE JAKO SAMODZIELNA JEDNOSTKA? 76% 24% Obecny poziom wykorzystywania narzędzi analitycznych Stopień zaawansowania i wykorzystywania analityki danych o klientach Głównych odbiorców danych gromadzonych i przetwarzanych przez dedykowane komórki organizacyjne 5% LICZBA PRACOWNIKÓW W DZIALE ANALIZ >10 16% 6-10 14% 3-5 31% <3 40% Miejsce i rolę działania Data Scientist, czyli analityka danych nieustrukturyzowanych KOMU PODLEGA DZIAŁ ANALIZ? O badaniu: Zespół analityków Redakcji portalu decyzje-it.pl wspólnie z IBM Polska przeprowadził badanie rynku techniką wywiadów telefonicznych na grupie docelowej 150 polskich przedsiębiorstw, w strukturach których działa zespół osób zajmujących się analizą danych o klientach. Badanie zostało zrealizowane w okresie między 2 lipca a 6 sierpnia 2015 roku. Zarząd 67% Sprzedaż 14% Marketing 6% Finanse 9% IT 6% Inne 8% 2
Najczęstsze źródła danych i cele stosowania modeli gromadzenia i przetwarzania danych o klientach wykorzystywane w analityce biznesowej Dane są dzisiaj wszędzie, w gigantycznych ilościach i rozproszone w różnych miejscach, pod różną postacią. Postanowiliśmy zbadać, z jakich źródeł danych o kliencie najczęściej korzystają analitycy oraz czy cechują się one dużą zmiennością. Okazuje się, iż najczęściej wykorzystywanymi źródłami danych o klientach są bazy danych, z których korzysta 90% respondentów. Znacznie mniej, bo 52% respondentów pozyskuje dane z zgromadzone w hurtowni danych. Na trzecim miejscu znajduje się Internet, przy czym 38% respondentów korzysta z danych ustrukturyzowanych, natomiast już tylko 23% z danych nieustrukturyzowanych. Kolejnym najczęściej wykorzystywanym źródłem danych wskazanych przez 34% respondentów są dane zgromadzone w arkuszach excelowych. Postanowiliśmy również ustalić, czy w przedsiębiorstwach występuje duża zmienność danych, które podlegają analizie w czasie zbliżonym do rzeczywistego. Przykładem wzmożonej zmienności analizowanych danych o klientach mogą być okresy świąteczne, kiedy to następuje zwiększenie natężenia przepływu i zmienności danych. Z odpowiedzi respondentów wynika, iż tylko w przypadku 28% zbadanych organizacji występuje wysoka zmienność ilości i jakości analizowanych danych w czasie zbliżonym do rzeczywistego. Skoro znamy już najczęściej wykorzystywane źródła danych o klientach w polskich przedsiębiorstwach, ustalmy do czego te dane są wykorzystywane oraz jakie modele analityczne o klientach są tam tworzone i wykorzystywane. Z uzyskanych odpowiedzi wynika, iż najczęściej dane o klientach są gromadzone i przetwarzane na potrzeby raportowania. Tak odpowiedziało 97% respondentów. Blisko 68% przedsiębiorstw gromadzi dane o klientach na potrzeby predykcji, natomiast 30% z nich, jako cel gromadzenia i przetwarzania danych o klientach wskazało identyfikowanie anomalii (wykrywanie nadużyć, niebezpiecznych zjawisk, defraudacji). W dalszej części badania przedstawiliśmy naszym respondentom listę przykładowych modeli analitycznych o klientach chcąc ustalić, które z nich są tworzone i wykorzysytywane w ich organizacjach. W dalszej części badania przedstawiliśmy naszym respondentom listę przykładowych modeli analitycznych Źródła danych o klientach BAZY DANYCH 10% 90% HURTOWNIA DANYCH 48% 52% INTERNET, JAKO ŹRÓDŁO DANYCH USTRUKTURYZOWANYCH 62% 38% BIG DATA, JAKO ŹRÓDŁO DANYCH USTRUKTURYZOWANYCH 77% 23% ARKUSZ EXCEL 66% 34% 3
o klientach chcąc ustalić, które z nich są tworzone i wykorzysytywane w ich organizacjach. Respondenci, na najczęściej wykorzytywaney, bo w 22% przypadków wskazali na model przewidywania popytu (analiz predykcyjnych), a dalej na model crosssellingu (wskazanie optymalnej strategii sprzedaży wiązanej). Następnie, bo w 13% badanych przypadków, na model upsellingu (optymalizacji strategii oferowania droższego produktu) oraz windykacji tj. wyznaczania prawdopodobieństwa trudności związanych z uregulowaniem płatności przez potencjalnych klientów lub klientów. Niewielki odestek badanych przedsiębiorstw, bo na poziomie 8-9% opracowuje i korzysta z profili behawioralnych klienta oraz portretów internetowych klienta oraz widoku 360º. Tworzone i wykorzystywane modele analityczne Profil behawioralny klienta 9% Portret internetowy klienta 8% Widok 360º klienta 8% Przewidywanie popytu (analiza predykcyjna) 22% Crossselling - wskazanie optymalnej strategii sprzedaży wiązanej 15% Upselling - optymalizacja strategii oferowania droższego produktu 13% 72% 28% Cele gromadzenia i przetwarznia danych o klientach RAPORTOWA 3% 97% PREDYKCJA 32% 68% Windykacja - wyznaczenia prawdopodobieństwa trudności związanych z uregulowaniem płatności przez potencjalnych klientów/klientów 13% Wykrywanie nadużyć (model przewiduje nieuczciwe zachowania) 8% Żaden z powyższych 3% Inne 1% WYSTĘPOWA DUŻEJ ZMIENNOŚCI DANYCH ANALIZOWANYCH W CZASIE ZBLIŻONYM DO RZECZYWISTEGO IDENTYFIKOWA ANOMALII 69% 31% 4
Obecny poziom wykorzystywania narzędzi analitycznych do analiz danych o klientach Przedsiębiorstwa mają dostęp i dysponują coraz większą ilością oraz jakością danych o kliencie. Znacznie częściej w ostatnich latach daje się słyszeć głosy, iż jest to krytyczny zasób w drzemiącej w oceanie danych o klientach niezbędne są narzędzia analityczne. W tej części badania staraliśmy się ustalić z jakich narzędzi analitycznych o klientach korzystają działy analiz. Z uzyskanych odpowiedzi wynika, że najczęściej wykorzystywane narzędzia to: raportowanie standardowe, w tym kostki OLAP (46%) oraz systemy typu Business Intelligence (42%). Najrzadziej w polskich przedsiębiorstwach wskazywano na takie narzędzia analityczne jak, analityka Big Data (7%) i Data Mining (5%). Na koniec tej części badania, zadaliśmy pytanie naszym respondentom o ich plany inwestycyjne w zakresie narzędzi analitycznych. Okazało się, że najchętniej będą oni inwestować w narzędzia raportowania standardowego, w tym kostki OLAP (55%) oraz w systemy Business Intelligence (36%). Najmniejsze zainteresowanie wykazali oni narzędziami typu Big Data i Data Mining (9%). Wykorzystywane narzędzia analityczne RAPORTOWA STANDARDOWE W TYM KOSTKI OLAP 54% 46% SYSTEM TYPU BUSSINES INTELIGENCE 58% 42% DATA MINING 95% 5% ANALITYKA BIG DATA 93% 7% W JAKIE NARZĘDZIA ANALITYCZNE BĘDĄ INWESTOWAĆ DZIAŁY ANALIZ? BIG DATA I DATA MINING BUSINESS 9% INTELLIGENCE 36% RAPORTOWA STANDARDOWEJ KOSTKI OLAP 55% 5
Poziom zaawansowania analityki danych o kliencie Zaawansowana analityka biznesowa Posiadanie i eksploatowanie narzędzi analitycznych, zatem ich możliwości funkcjonalne i techniczne, stają się główną wytyczną określającą poziom zaawansowania i wykorzystywania analityki danych o klientach w przedsiębiorstwach. Na potrzeby naszego badania przyjęliśmy cztery poziomy zaawansowania analityki danych o kliencie: Raportowanie standardowe Poziom zaawansowanej analityki danych o klientach zachodzi wówczas, gdy przedsiębiorstwo wykorzystuje narzędzia nazywane ogólnie terminem Data Mining, obejmujące m.in. eksplorację danych, drążenie danych, ekstrakcję danych oraz wykorzystując narzędzia analityczne typu np. SPSS do analiz predykcyjnych. W związku z tym, iż narzędzia Data Mainig wykorzystują modele statystyczne i matematyczne do identyfikacji wzorców i zależności, tym samym wymagają dobrej jakości danych historycznych gromadzonych w hurtowniach danych.przedsiębiorstwa, które stosują narzędzia Data Mining stanowią poziom trzeci zaawansowania analityki danych o kliencie. Rozumiane, jako zestawienia danych sprzedażowych w różnych przekrojach, czyli według wyboru określonego parametru (wartość, lokalizacja, itp.). Dodatkowo w ramach raportowania standardowego przyjęliśmy, iż dane przechowywane są w wielowymiarowych kostkach OLAP. Umożliwiają one tworzenie określonych, często dziedzinowych zbiorów danych, oznaczających możliwość poruszania się w hierarchii danych, tj. od poziomu najwyższego na najniższego i na odwrót. Raporty standardowe stanowią rodzaj podstawowych zestawień danych o klientach, stąd przyjęliśmy, iż przedsiębiorstwa korzystające z takiej właśnie formy analiz stanowią najniższy poziom zaawansowania analityki danych o klientach. Analityka biznesowa Oznacza generowanie raportów i zestawień o klientach z wykorzystaniem oprogramowania Business Intelligence, czerpiącego dane z hurtowni danych. Biorąc pod uwagę fakt, iż poza analizami danych historycznych, narzędzia BI mogą dostarczać prognozy i analizy typu co jeśli? bazując na danych z przeszłości z uwzględnieniem osi i trendów czasowych, to przedsiębiorstwa wykorzystujące narzędzia tego typu stanowią drugi poziom zaawansowania analityki danych o klientach. 6
Analityka Big Data Uwzględniając powyższe definicje poziomów zaawansowania stosowania analityk danych o kliencie okazało się w wyniku naszego badania, iż prawie połowa, tj. 46% przedsiębiorstw w Polsce analizuje dane o kliencie na podstawowym poziomie zaawansowania, stosując Raportowanie Standardowe, w tym kostki OLAP. Drugą grupę, tj. 42% stanowią przedsiębiorstwa, które stosują Analitykę Biznesową, wykorzystując systemy Business Intelligence, zatem kwalifikują się do drugiego poziomu zaawansowania analityki danych o klientach. Do stosowania trzeciego poziomu analityki danych o klientach, czyli Zaawansowanej Analityki Biznesowej przyznało się 5% badanych przedsiębiorstw, a do czwartego, czyli Analityki Big Data, 7% respondentów. Pierwsze trzy poziomy zaawansowania analityki danych o kliencie są możliwe do wykonywania na danych oczyszczonych (inaczej ustrukturyzowanych), tj. o jednolitej strukturze danych. Niestety próba stosowania, wcześniej wymienionych, narzędzi analitycznych w przypadku danych nieuporządkowanych (inaczej nieustrukturyzowanych) jest bezcelowa. Dane nieuporządkowane to przede wszystkim, dane pochodzące z własnych stron www, mediów społecznościowych, blogów i portali, jak i również dane dostępne w serwisach zajmujących się gromadzeniem i sprzedażą informacji. Takich danych w otoczeniu biznesowym jest bardzo dużo, mają one niejednolitą strukturę oraz dynamicznie się zmieniają. W celu doprowadzenia tego typu danych do postaci używalnej, wykorzystuje się narzędzia i metodyki Big Data. Transformacja i oczyszczanie danych nieustrukturyzowanych poprzez wykorzystanie narzędzi Big Data, stanowi najwyższy poziom zaawansowania analityki danych o kliencie. Jaki jest poziom zaawansowania analityki danych o kliencie w polskich przedsiębiorstwach? 7% 5% 42% 46% ANALITYKA BIG DATA ZAAWANSOWANA ANALITYKA BIZNESOWA ANALITYKA BIZNESOWA RAPORTOWA STANDARDOWE 7
Główni odbiorcy danych gromadzonych i przetwarzanych przez dedykowane komórki organizacyjne Odpowiedzieliśmy już na pytania, z jakich źródeł danych o kliencie korzystają analitycy; znamy najczęściej stosowane modele danych; wiemy z jakich narzędzi analitycznych korzystają działy analiz oraz poznaliśmy poziomy zaawansowania analiz danych o kliencie w przedsiębiorstwach w Polsce. Pozostało nam ustalić, kto jest odbiorcą wyników analiz, czyli kto korzysta z danych o klientach. Poznajmy zatem głównych odbiorców informacji generowanych przez działy analiz. Okazuje się, że Zarząd w 100% przypadków nie Dział Sprzedaży lub Marketingu stał się głównym beneficjentem danych o kliencie. W przypadku 74% przedsiębiorstw analizy danych o klientach wykonywane są na rzecz Działów Sprzedaży. Następnie, w 60% przypadków, działy analiz dostarczają danych do Działów Marketingu oraz Działów Finansowych. Ostatnie miejsce w tym rankingu zajął Dział Przestępstw Gospodarczych i Nadużyć (3%), co może być spowodowane niską popularnością występowania tego typu działów w strukturach przedsiębiorstw. KOMU PODLEGA DZIAŁ ANALIZ? ZARZĄD 100% 0% DZIAŁ FINANSOWY 60% 40% DZIAŁ MARKETINGU 60% 40% DZIAŁ SPRZEDAŻY 74% 26% DZIAŁ WINDYKACJI 31% 69% DZIAŁ IT 25% 75% DZIAŁPRZESTĘPSTW GOSPODARCZYCH/NADUŻYĆ 3% 97% INNE 13% 87% 8
Miejsce i rola Data Scientist Na koniec naszego raportu powróćmy do tezy postawionej przez Harvard Business Review dwa lata temu i oceńmy, czy rzeczywiscie Data Scientist jest najbardziej sexy zawodem w branży IT. Ustalmy czy, a jeśli tak, to gdzie jest miejsce Data Scientist w polskich przedsiębiorstwach? Z odpowiedzi respondentów wynika, iż tylko w przypadku 3% badanych przedsiębiorstw, które posiadają zespoły do analiz danych o kliencie, występuje stanowisko Data Scientist, czyli zajmujacej analizą danych nieustrukturyzowanych. W przypadku przedsiębiorstw, w których Data Scientist występuje ustaliliśmy, iż najcześciej pracuje on w Dziale IT (50%). Pozostały działami, które zostały wymienione przez respondentów były Działy Analiz oraz Controllingu. I na koniec, tylko 1% badanych przedsiębiorstw planuje w najbliższym czasie powołanie stanowiska Data Scientist do życia. CZY JEST DATA SCIENTIST? 97% 3% W JAKIM DZIALE PRACUJE DATA SCIENTIST? DZIAŁ IT 50% DZIAŁ CONTROLLINGU 25% DZIAŁ ANALIZ 25% CZY PLANUJĄ ZATRUDNIA DATA SCIENTIST? 99% 1% Czy zatem Data Scientist to najbardziej pożądany zawód w branży IT w Polsce? Przynajmniej na razie, zdecydowanie nie 9
Podsumowanie Wyniki naszego badania pozwalają na wyciągnięcie następujących wniosków: Ilość dostępnych danych o klientach które mogłyby znacząco wpłynąć na ich obsługę i pozyskiwanie nowych - jest gigantyczna, a mimo to polskie przedsiębiorstwa nadal najczęściej korzystają z podstawowych źródeł danych, jakimi są własne bazy i hurtownie danych. Dane dostępne w Internecie nadal nie stanowią dla polskich przedsiębiorstw znaczącego i liczącego się źródła danych o klientach. Można powiedzieć o niskim poziomie zaawansowania analityki danych o klientach w polskich przedsiębiorstwach, ponieważ zdecydowana większość z nich analizuje dane o kliencie na poziomie standardowego raportowania oraz analiz biznesowych, a tylko marginalna liczba stosując analizy Big Data i Data Mining. Głównym celem analiz danych o klientach pozostaje nadal odpowiedź na pytanie co i ile możemy sprzedać?. Przedsiębiorstwa nie postrzegają jeszcze klienta jako człowieka, którego należy poznać, ustalić jego zainteresowania, preferencje, trudności z którymi się boryka, itd. Potwierdza to fakt, iż bardzo nieliczne przedsiębiorstwa opracowują profile behawioralne klientów, portery internetowe, czy też widoki 360. Polskie przedsiębiorstwa chcą analizować przyszłość, korzystając ze zgromadzonych i dostępnych danych historycznych. Świadczy o tym wysoki odsetek przedsiębiorstw stosujących analizy predykcyjne. Jednocześnie nadal jednak nie widzą potrzeby wykrywania zagrożeń przed ich wystąpieniem, czyli identyfikacji anomalii. Głównym beneficjentem analiz danych dotyczących klientów są Zarządy przedsiębiorstw. Data Scientist to nadal wielki nieobecny w polskich przedsiębiorstwach i na razie nic nie wskazuje na to, by miało się to zmienić. Partner merytoryczny: Badanie wykonane przez: