AMA Institute Advanced Mdel Advisrs 1
Jak żyć w epce AI & Machine-Learning Karl Przanwski, AMA Institute Szkła Główna Handlwa - SGH 2
Agenda kł 30 minut Znaki czasu Rekmendacje: 1. Zmień myślenie analityka w centrum 2. Zmieniaj język analityczny w bizneswy 3. Bądź praktywny, twórz kulturę data driven 4. Zaakceptuj niską jakść danych 5. W wielu prcesach znajdź zastswanie dla mdeli predykcyjnych 6. Rzwijaj myślenie statystyczne 7. Naucz się używać prgramwania: SAS, R i Pythn 8. Zawsze zaczynaj d zrzumienia prcesu 9. Masz prblemy? Przyjdź d nas 3
Znaki czasu (1) Świat się zmienia i mżemy tylk zdążyć wsiąść d klejneg pciągu Rynek zmienia się szybciej niż wiedza ekspercka Dane i analityka stają się cennymi aktywami każdeg przedsiębirstwa Digitalizacja wszystkieg i wszystkich Big Data naptkał na pierwsze sukcesy i prażki Nawet sprzedaż butów zwiększa się dzięki analityce 4
Znaki czasu (2) Nie bój się t tylk synnimy analityki 5
Sprzedaż [mln PLN] Znaki czasu (3) A p studiach trafiamy d naszej pierwszej pracy!!! Sprzedaż w rku 2017 20 18 16 14 12 10 8 6 4 2 0 X Nazwa prduktu Y Nie przerażaj się, nie musisz zderzać się ze ścianą 6
Rekmendacja 1 Zmień myślenie analityka w centrum Wszystk da się skpiwać z wyjątkiem wewnętrznych danych i analityki IT, technlgie i systemy Mdel bizneswy Analityka IT, technlgie i systemy Mdel bizneswy Analityka Najczęściej zaczyna się d technlgii, ptem buduje się mdel bizneswy, a na kńcu analitykę 7
Rekmendacja 2 Zmieniaj język analityczny w bizneswy Musisz przeknywać językiem zrzumiałym przez biznes Nwy mdel predykcyjny zwiększy sprzedaż 20% Nwe reguły analityczne zmniejszą kszty 30% Nwe narzędzie analityczne zmniejszy dchdzenie klientów 30% Dzięki lepszym danym i lepszym kryterim selekcji zwiększymy zysk 15% 8
Case Study (1) stan pczątkwy ZAŁOŻENIA: 20 tys. Klientów 348 kampanii marketingwych rcznie ~7 mln decyzji wysłać czy nie? Kszt jednstkwy: 5 Zarbek przy zakupie: 800 Średnia szansa zakupu: 0,5% Wysyłamy wszystkim Przychdy: 28 000 000 Kszty: 35 000 000 Zysk: -7 000 000 Całkwicie niepłacalne Reguły eksperckie Przychdy: 15 895 139 Kszty: 12 250 000 Zysk: 3 645 139 Zauważalne zyski $ Wyniki Finanswe Występują zauważalne zyski, ale czy mżna je pprawić? 9
Case Study (2) mżliwe warianty rzwju Mdel_A dane bazwe Przychdy: 21 531 163 Kszty: 12 250 000 Zysk: 9 281 163 Mdel_B specjalistycznie rzbudwany zbiór danych Przychdy: 25 599 340 Kszty: 8 750 000 Zysk: 16 849 340 Wzrst zysków pnad 5,5 mln vs reguły eksperckie 40 000 000 35 000 000 30 000 000 25 000 000 20 000 000 15 000 000 10 000 000 5 000 000 Jeszcze większy zysk raz bniżenie ksztów wstępnych $ Wyniki Finanswe 0-5 000 000 W S Z Y S C Y E K S P E R C K A M O D E L _ A M O D E L _ B -10 000 000 przychód kszt zysk 10
Sensitivity / %Bad captured Hit rate / Sensitivity / %Gds remain 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100% Case Study (3) Świat analityka Liczba decyzji 7 000 000 Średni przychód ze sprzedaży 800 Średni kszt kntaktu 5 Glbalna mc predykcyjna - Gini 78,36% Glbalna knwersja 0,5% Knwersja na grupie dcelwej 1,83% Udział grupy dcelwej 25,00% Statystyka Lift na grupie dcelwej 3,66 Statystyka Gains na grupie dcelwej 91,43% Kszt glbalny 35 000 000 Przychód glbalny 28 000 000 Wynik (zysk) glbalny -7 000 000 Kszt na grupie dcelwej 8 750 000 Przychód na grupie dcelwej 25 599 340 Zysk na grupie dcelwej 16 849 340 Liczba fert, grupa dcelwa 1 750 000 Liczba respndentów w grupie dcelwej 31 999 Studium przypadku w Excelu: http://administracja.sgh.waw.pl/pl/ow/publikacje/strny/2015.aspx 4% 3% 3% 2% 2% 1% 1% 0% Liczba kampanii 29 Liczba miesięcy 12 Liczba klientów 20 115 Liczba decyzji 7 000 000 Respnse rate 100% 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Scre band 90% 80% 70% 60% 50% 40% 30% 20% 10% ROC 0% 0% 20% 40% 60% 80% 100% False alarm rate / 1-Specificity / %Bads remain 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% CAP 7,0 6,0 5,0 4,0 3,0 2,0 1,0 0,0 Lift Depth 0% 0% 20% 40% 60% 80% 100% Depth 11
Case Study (4) Wspólne ujęcie prblemu Zmienna: Liczba wysyłanych emaili w ciągu statnich 2 miesięcy Numer kategrii Kategria - pis prfilu Knwersja Udział w ppulacji 1 1 < VAR_N_EMAIL_2M 5,69% 19,84% 2 0 < VAR_N_EMAIL_2M <= 1 5,17% 18,84% 3 nt missing(var_n_email_2m) and VAR_N_EMAIL_2M <= 0 4,27% 61,31% 100,00% Delta Gini Delta Zysku 1% 272 569 5% 1 362 844 10% 2 725 687 Zysk 18 000 000 16 000 000 14 000 000 12 000 000 10 000 000 8 000 000 6 000 000 4 000 000 2 000 000 0 10,00% 20,00% 30,00% 40,00% 50,00% 60,00% 70,00% 80,00% Gini 12
Rekmendacja 3 Bądź praktywny, twórz kulturę data driven Szukaj miejsc pracy, gdzie analityka jest w centrum, a jeśli jej nie ma, t pmóż t siągnąć Nie rzstawaj się ze swimi raprtami i narzędziami szybkiej eksplracji danych Aktywnie zabieraj głs na sptkaniach, balaj mity pkazując raprty Naucz się biznesu a swjeg managera analityki Zawsze bądź gtwy d przemwy w windzie elevatr speech Pytaj szczegóły prcesu Gdy rbisz raprt, pytaj d czeg jest ptrzebny 13
Rekmendacja 4 Zaakceptuj niską jakść danych, mżesz tylk zrbić lepszy krk a nie rewlucję Big Data wcale nie znacza duże dane p czyszczeniu pzstaje mał Nie używaj niskiej jakści danych jak pwdu Twich niepwdzeń Jeśli identyfikujesz błędy w danych, t Ty d tej chwili jesteś za nie dpwiedzialny!!! Prpnuj prcesy, które d razu zbierają lepsze dane pla słwnikwe 14
BIG DATA knsekwencje niskiej jakści danych NOWE PARADYGMATY DWH (Hurtwnia danych): Najpierw czyść ptem załaduj (stare) Załaduj i ptem się martw (nwe) Mdelwanie (prgnzwanie): Znajdź przyczynę i skutek, bserwuj isttne zmienne, czynniki (stare) Sprawdź, które ze zgrmadznych danych wpływają na mdelwe zdarzenie, zależnści d zmiennych pchdnych (nwe) Pdczas jedneg prjektu zbiera się dane a pdczas drugieg się je wykrzystuje 15
BIG DATA knsekwencje niskiej jakści danych GŁÓWNE IDEE Pzwólmy mówić danym Nie ważne dlaczeg, ważne, że działa! (nt why, but what) Najważniejsze, że da się zarabiać!!! Grmadźmy dane bez ich pierwtneg przeznaczenia DATA ENTRANCE BIG DATA Mayer-Schnberger V i Cukier K (2013). Big Data: A revlutin that will transfrm hw we live, wrk and think. An Eamn Dlan Bk, Hughtn Mifflin Harcurt, Bstn, New Yrk. 16
Rekmendacja 5 W wielu prcesach znajdź zastswanie dla mdeli predykcyjnych, stsuj prcesy z autmatycznym pdejmwaniem decyzji Jeśli się nad tym zastanawiasz, t knkurencja już dawn t wdrżyła Tylk autmatyczne prcesy pzwlą przetrwać Tbie i Twjej firmie Zastswania mdeli predykcyjnych graniczne są tylk przez Twją wybraźnię Prawie każdy prces maswy z decyzją (tak, nie) daje się zautmatyzwać 17
Bariery wykrzystania mdeli predykcyjnych (1) Dlaczeg mdele predykcyjne nie są stswane na szerką skalę? WYSOKA CENA RYNKOWA OPROGRAMOWANIA DŁUGI CZAS WDROŻENIA KONIECZNOŚĆ POSIADANIA SPECJALISTYCZNYCH ZASOBÓW BRAK ZROZUMIENIA WARTOŚCI DODANEJ ANALIZY DANYCH SILOSOWOŚĆ DZIAŁAŃ W ORGANIZACJI SKOMPLIKOWANA TECHNOLOGIA Trzeba przełamywać bariery, balić status qu i zlikwidwać silsy!!! 18
Bariery wykrzystania mdeli predykcyjnych (2) NIEPOWODZENIA BIG DATA Brak dbrych business case Dane są zbierane, ale zbyt mał uzasadnia się ich przydatnść Lekceważne prblemy jakści danych Umniejszanie prblemu wniskwania na pdstawie bciążnej próby Zbyt duży nacisk płżny na technlgię Złudne nadzieje szybkieg klikania mdelu Brak inwestycji w przygtwanie i wykształcenie inżyniera danych Brak publicznych danych, dstępnych i przykładwych 19
Wykrzystanie mdeli predykcyjnych PRZYKŁADY BRANŻ, W KTÓRYCH MODELE PREDYKCYJNE MOGĄ BYĆ WYKORZYSTYWANE FINANSE MARKETING INNE Fundusze inwestycyjne i gwarancyjne Częsttliwści i rdzaj kntaktu z klientem Centra usług wspólnych Ubezpieczenia Prgramy ljalnściwe Punkty maswej bsługi klienta Kredyty / Leasing/ Faktring Retencja w usługach abnamentwych Dmy wysyłkwe Windykacja Prmcje cenwe Lgistyka Ochrna przed nadużyciami Sprzedaż internetwa Firmy windykacyjne NAUKA 20
Rekmendacja 6 Rzwijaj myślenie statystyczne, identyfikuj zjawiska maswe i wykrywaj główne prawidłwści Myślenie bizneswe: Ile zarbimy, ile stracimy? Ważniejsze są plany bliższe i pieniądze w zasięgu ręki! Szybki sukces się liczy! Myślenie peracyjne: Jak utrzymać prces, status qu? Nie zwiększajmy ksztów, róbmy efektywniej! Myślenie zarządcze: Wystarczy 20% trudu, b daje 80% efektów. Paret działa! Myślenie statystyczne: Estymwać liczby ukryte, trudne d zabserwwania Paret nie działa w przypadku analiz, każda analiza daje większe efekty i zrzumienie prcesu Znaleźć prprcje między udziałem zyskwnych klientów a klientami drzucnymi i zniechęcnymi PROBABILITY RULES 21
Rekmendacja 7 Naucz się używać prgramwania: SAS, R i Pythn, w dzisiejszych czasach musisz znać płatne i bezpłatne rzwiązania Trudniej znaleźć mistrza d pensurce, SAS mże wytyczać kierunki Zbyt duża liczba pakietów bezpłatnych który wybrać? Trudnści bezpłatnych rzwiązań niweluj siecią kntaktów Rzwijaj śrdwisk analityków Rzwijaj techniki prgramistyczne, nie tylk przez metdę prób i błędów 22
Dylemat technlgii INŻYNIER DANYCH C jest ważniejsze? Wygdny interfejs - UFI Tanie prgramwanie Hard cde SLA i dbry HELPDESK Kmpetencje zespłów inżynierów danych INŻYNIER DANYCH 23
Sprzedaż [mln PLN] Rekmendacja 8 Zawsze zaczynaj d zrzumienia prcesu, pamiętaj, że stary prces mże zaburzać interpretację danych Dlaczeg prdukt X psiada większą sprzedaż? Sprzedaż w rku 2017 B klienci g preferwali? 20 18 16 14 B pracwnicy sprzedaży mieli system mtywacyjny? 12 10 8 B prdukt był tańszy? 6 4 2 B prdukt szybk mżna był dstarczyć? 0 X Nazwa prduktu Y 24
Rekmendacja 9 Masz prblemy? Przyjdź d nas, pmżemy, razem zrbimy prezentację, przeknamy Twich przełżnych 1. Dstęp d zespłu z dużą wiedzą lkalnym rynku 2. Elastyczne pdejście d klienta, zamiast wykrzystywania generycznych schematów 3. Płączenie dużeg dświadczenie biznesweg raz IT z dświadczeniem naukwym, zachwując zdrwą krytykę zarówn narzędzi analitycznych, jak i IT zrzumienie biznesu i graniczeń IT 4. Rzwiązania szyte na miarę 5. Szybki zwrt pniesinych ksztów iteracyjne pdejście zapewniające nacisk na trzymanie zwrtu dla klienta w krótkim kresie 25