CZY DECYZJE KLIENTÓW O ZMIANIE UBEZPIECZYCIELA MOŻNA PRZEWIDYWAĆ? ANALIZA CHURN W TUIR WARTA



Podobne dokumenty
Scoring kredytowy w pigułce

Launch. przygotowanie i wprowadzanie nowych produktów na rynek

StatSoft profesjonalny partner w zakresie analizy danych

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY

Proces i narzędzia analizy potencjału wybranych obszarów rynku farmaceutycznego

Jak nie tylko być zgodnym z regulacją, ale wyciągnąć korzyści biznesowe z lepszego dopasowania oferty

NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym

ROZWÓJ OSOBISTY REKRUTACJA

SKORING JAKO NARZĘDZIE WSPIERAJĄCE SPÓŁDZIELCZE KASY OSZCZĘDNOŚCIOWO-KREDYTOWE W SPEŁNIENIU NOWYCH WYMAGAŃ NADZORCZYCH

Świadomość ubezpieczeniowa rolnika będzie rosła?

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Design thinking zaprojektuj, zbuduj i przetestuj swoje pomysły

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Karta Wskazań Efektywnego Partnerstwa Biznes-NGO

Szczegółowy program - Szkoła Planowania Biznesu -

ŚCIEŻKA: Zarządzanie projektami

Badania Marketingowe. Kalina Grzesiuk

Analiza praktyk zarządczych i ich efektów w zakładach opieki zdrowotnej Województwa Opolskiego ROK 2008 STRESZCZENIE.

Grupa Kapitałowa KRUK. KRUK Analytics Challenge2014. Konkurs dla Grupy QU. Wrocław, r.

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

Jak skutecznie poprowadzić Executive interview? Piotr Mazurkiewicz Senior Executive Search Consultant HRK S.A./ IRC Global Executive Search Partners

Walidacja metod analitycznych Raport z walidacji

Regresja linearyzowalna

WYKORZYSTANIE SKORINGU DO PRZEWIDYWANIA WYŁUDZEŃ KREDYTÓW W INVEST-BANKU

Miło nam poinformować, że rozpoczęliśmy prace nad Raportem płacowym Sedlak & Sedlak dla branży IT

Metodyka zarządzania ryzykiem w obszarze bezpieczeństwa informacji

Efektywny back-office. Warszawa, r.

Nowoczesne aplikacje mobilne i ich rola w podnoszeniu jakości danych

Zadanie 9: Oferta edukacyjna na nowej specjalności Pomiary technologiczne i biomedyczne na kierunku Elektrotechnika, WEAIiE

Program Wiarygodne Opinie 1 / 27

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Metoda 5-WHY. Metoda 5-WHY. Wydanie 1. Zbigniew Huber. Maj Artykuł dostępny na stronie autora:

BADANIE KLIENTÓW SATYSFAKCJI JAK KLIENCI OCENIAJĄ LIVESPACE CRM? Raport LiveSpace

Wyznaczenie celów. Rozdział I. - Wyznaczanie celów - Cel SMART - Przykłady dobrze i źle wyznaczonych celów

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Szkolenia dla doradców klienta/ sprzedawców. Szkolenia podstawowe Adam Kubicki -

KARTA OCENY MERYTORYCZNEJ. Kryterium Czy warunek został spełniony? Okres realizacji projektu jest zgodny z okresem wskazanym w regulaminie

166 Wstęp do statystyki matematycznej

Data Mining podstawy analizy danych Część druga

AGNIESZKA SZKLARCZYK EKSPERT OPTYMALIZACJI ORAZ ZASTOSOWANIA KAIZEN W MARKETINGU

RAPORT Z POLSKIEGO BADANIA PROJEKTÓW IT 2010

Którzy ubezpieczyciele najlepiej dbają o jakość obsługi?

Automatyczny system wykrywania nieubezpieczonych posiadaczy pojazdów mechanicznych wspierający kontrole prowadzone przez UFG

Scenariusz i formularz zogniskowanego wywiadu grupowego z przedstawicielami Urzędu

Wykład Zarządzanie projektami Zajęcia 7 Zarządzanie ryzykiem. dr Stanisław Gasik s.gasik@vistula.edu.pl

PORADNIK: JAK PRZYGOTOWAĆ DOBRY PROJEKT #DECYDUJESZPOMAGAMY?

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

oferta dla firm Kim jesteśmy? Nasze produkty

BADANIE SATYSFAKCJI KLIENTA

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

VENDIO SPRZEDAŻ kompleksowa obsługa sprzedaży. dcs.pl Sp. z o.o. vendio.dcs.pl info@dcs.pl Warszawa,

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Zarządzanie talentami w polskich przedsiębiorstwach - wyniki badań

Analiza współzależności. Z wykorzystaniem IDEA Caseware

BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA

Ile waży arbuz? Copyright Łukasz Sławiński

IV. Moduł: Narzędzia monitorowania podstawy programowej

Projektowanie systemu krok po kroku

System obsługi ubezpieczeń FORT

Raport z badania Ankietowego. Wizerunek Urzędu Miasta Nowy Targ i oczekiwania jego klientów - w ramach procedury systemu zarządzania, jakością PZ-1.5.

MARKETING-MIX POZNAJ KLUCZOWE TEORIE MARKETINGOWE

1. Co każdy zainteresowany wiedzieć powinien 2. Co zapewniamy naszym partnerom 3. Pierwsze kroki 4. Korzyści dla Ciebie

Rozwiązania księgowe dotyczące sprzedaży w sektorze nieruchomości różnią się w zależności od okresu ujmowania przychodów.

Model Matematyczny Call Center

Wprowadzenie do analizy korelacji i regresji

Mentoring starszy stażem pracownik przyucza pracownika mniej doświadczonego do zawodu

Analiza jakości kursów PERK na maklera papierów wartościowych,

Narzędzia Informatyki w biznesie

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. II seminarium konsultacyjne.

Szukaj miejsc i wydarzeń pozytywnie nakręconych!

Dwie szkoły oceny 360 stopni. Sprawdź różnicę pomiędzy klasycznym a nowoczesnym podejściem

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Bezpieczeństwo i koszty wdrażania Informatycznych Systemów Zarządzania Hubert Szczepaniuk Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego

Skuteczne Techniki Sprzedaży

Punkt 2: Stwórz listę Twoich celów finansowych na kolejne 12 miesięcy

EKONOMICZNE ASPEKTY LOSÓW ABSOLWENTÓW

Nowoczesne strategie sprzedażytrening

Mój biznes Etap II. Analiza strategiczna

Dlaczego należy oceniać efektywność systemów wynagradzania? Kraków, r. Renata Kucharska-Kawalec, Kazimierz Sedlak

AKADEMIA DLA MŁODYCH. Osiąganie celów. moduł 3 PODRĘCZNIK PROWADZĄCEGO. praca, życie, umiejętności. Akademia dla Młodych

EKONOMICZNE ASPEKTY LOSÓW ABSOLWENTÓW

WDROŻENIE MODELOWANIA PROCESÓW ORAZ WSPARCIE

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Klucz do procesu doskonalenia. dzięki Lean Six Sigma dla Green Belts. Praktyczne szkolenia prowadzone przez Lean Six Sigma Company

Wykład 4: Statystyki opisowe (część 1)

Szczęście w nieszczęściu, czyli jak wykorzystać potencjał utraconych klientów

EKONOMICZNE ASPEKTY LOSÓW ABSOLWENTÓW

Brandle.pl. Jak stworzyć kampanię?

Kwestionariusz stylu komunikacji

JAK PROWADZIĆ PROFESJONALNY MARKETING?

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

ZARZĄDZANIE MARKĄ. Doradztwo i outsourcing

Odkryj w danych to, co najważniejsze

Transkrypt:

CZY DECYZJE KLIENTÓW O ZMIANIE UBEZPIECZYCIELA MOŻNA PRZEWIDYWAĆ? ANALIZA CHURN W TUIR WARTA Joanna Woźniak i Piotr Paryż, TUiR WARTA S.A. Analiza migracji klientów jest jednym z najpopularniejszych tematów analitycznych. Nic dziwnego, gdyż nie od dziś wiadomo, że utrzymanie klienta jest dużo tańsze dla firmy niż pozyskanie nowego. W ubezpieczeniach temat ten staje się dodatkowo istotny ze względu na charakter umów podpisywanych z klientami. Większość polis obejmuje okres roczny i w związku z tym po roku walka o klienta musi być podejmowana od nowa. Wyniki analiz migracji wykorzystuje się zazwyczaj do planowania działań zatrzymujących klientów oraz jako jeden z elementów budowania polityki lojalnościowej firmy. W poniższym artykule chcielibyśmy podzielić się osobistymi doświadczeniami. Opiszemy zidentyfikowane przez nas pułapki oraz miejsca wrażliwe, na które należy zwrócić większą uwagę podczas analizy churn. Nie będziemy skupiać się na technicznej stronie poszczególnych etapów analizy, gdyż tę można poznać w łatwy sposób na stosownych szkoleniach. Naszym celem jest pokazanie biznesowego podejścia do pracy analityków budujących modele oraz wskazanie na sposoby, którymi można znaleźć wspólny język między analitykami kochającymi liczby i tabele oraz np. osobami zarządzającymi sprzedażą, które interesują w pierwszej kolejności wnioski mogące przełożyć się na wzrost sprzedaży. Dla uporządkowania naszych przemyśleń podzieliliśmy materiał na części odpowiadające kolejnym etapom analizy churn, począwszy od określenia celów i założeń, po wdrożenie wyników modelu w praktyce. Etap I określenie celów i niezbędnych założeń Celem analizy churn jest zbudowanie modelu predykcyjnego, który pozwoli przewidywać, którzy klienci z największym prawdopodobieństwem zakończą współpracę z naszą firmą. Mówiąc wprost, chcielibyśmy wiedzieć, który klient kupi u nas kolejną polisę, a który myśli o zmianie ubezpieczyciela. Każda z analiz powinna być poprzedzona określeniem założeń. W naszym przypadku nie będzie możliwe zbudowanie wartościowego modelu bez określenia definicji odchodzącego klienta (cechy churn). Copyright StatSoft Polska 2011 www.statsoft.pl/czytelnia.html 45

Tylko pozornie temat jest oczywisty. Można wyobrazić sobie co najmniej kilka możliwych definicji klienta odchodzącego: Klient, który nie odnowił umowy WAŻNE! Po jakim czasie uznajemy, że odszedł? Następnego dnia po ustaniu ochrony, miesiąc, pół roku od czasu wygaśnięcia umowy? Klient, który nie odnowił części umów w przypadku klientów posiadających kilka polis trzeba podjąć decyzję, czy brak odnowienia jednej z nich to już sygnał, że klient odszedł? Może dopiero po wygaśnięciu ostatniej umowy? Może niektóre z umów są istotniejsze od innych? Klient, który przestał płacić składkę znów pytanie, czy przestał oznacza dla nas, że nie zapłacił jednej raty składki? Po jakim czasie opóźnienia uznajemy, że klient nie zapłacił? Mając ustaloną jednolitą definicję klienta odchodzącego, którą będziemy stosować podczas analiz migracji, przechodzimy do najcięższego zadania, jakim jest przygotowanie danych do modelowania. Etap II przygotowanie danych Na przygotowanie danych składa się kilka czynności. Są to: gromadzenie danych, ich selekcja, czyszczenie oraz przetworzenie. Wiele firm ubezpieczeniowych boryka się z problemem ograniczonej ilości danych o kliencie. Ten niedosyt jest wywołany kilkoma czynnikami. Po pierwsze mamy świadomość, że zawierając z klientem umowę ubezpieczeniową możemy od niego zbierać tylko dane niezbędne do zawarcia umowy, inne, które mogą być dla nas niezwykle cenne, klienci mogą nam podać, ale nie muszą. Po drugie specyfika organizacji sprzedaży ubezpieczeń stawia między nami a klientem pośrednika w postaci agenta, który nie zawsze jest chętny do dzielenia się wiedzą z ubezpieczycielem w obawie o utratę klientów. Mimo to nie można powiedzieć, że mamy mało danych. Ważne jest, abyśmy uświadomili sobie, jakie dane posiadamy, które z nich możemy wykorzystać, i jak. Jakie dane zastosować, co uwzględnić i jak wykorzystać wiedzę innych w dalszej pracy, pokażemy na bazie naszych doświadczeń w budowaniu modelu dla ubezpieczeń mieszkaniowych w Warcie. Rozpoczynając pracę, w pierwszej kolejności chcieliśmy wiedzieć, jakie informacje mogą być potencjalnie wartościowe dla modelu i jakimi danymi dysponujemy. Wykorzystaliśmy w tym celu znaną technikę burzy mózgów, zapraszając do współpracy około 10 osób reprezentujących różne departamenty. Naszym zdaniem bardzo wartościowe jest zaproszenie reprezentantów sprzedaży, produktu, marketingu oraz analityków. Nie jest to oczywiście lista zamknięta. Ciekawym pomysłem jest również zaproszenie osób spoza firmy, np. agenta, doradcy finansowego czy nawet klienta posiadającego ubezpieczenie mieszkaniowe. Celem takiego spotkania jest zidentyfikowanie maksymalnie dużej liczby czynników, które mogą mieć wpływ na to, czy klient od nas odejdzie. 46 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2011

Jak zapewnić sobie skuteczność spotkania? Po pierwsze wszyscy uczestnicy powinni mieć świadomość, że na potrzeby spotkania zakładamy brak ograniczeń w dostępie i korzystaniu z danych dotyczących klienta. W związku z tym, każdy potencjalny czynnik wpływający na decyzję klienta o odejściu powinien zostać spisany. Nawet jeśli obecnie nie dysponujemy pewnymi informacjami o kliencie, możemy w przyszłości zacząć gromadzić te dane, znając ich znaczenie dla analizy zachowań klientów. Po drugie powinniśmy zapewnić pełną swobodę wypowiedzi, bez oceniania pomysłów. Po trzecie miejsce i czas spotkania powinny być dobrane tak, żeby uczestnicy mogli poświęcić czas wyłącznie na to spotkanie i nie mieć poczucia pośpiechu (bardzo pomocne jest również wyłączenie telefonów). Po czwarte spotkanie musi być dobrze przygotowane i poprowadzone, aby było możliwe skompletowanie wartościowej listy zmiennych. W kwestii przygotowania spotkania odniesiemy się po raz kolejny do sposobów, które zastosowaliśmy w naszym przypadku. W spotkaniu brało udział około 10 osób. Idealnie byłoby prowadzić burzę mózgów do momentu całkowitego wyczerpania pomysłów, ale znając realia, założyliśmy, że mamy do dyspozycji ok. 2,5 godziny. Przygotowując materiały na spotkanie, sporządziliśmy własny zestaw zmiennych (około 20) jako wstępną propozycję do dyskusji. Aby mieć punkt odniesienia, kiedy powinniśmy zakończyć pracę nad listą zmiennych, zastosowaliśmy następującą metodę: usunęliśmy 3 zmienne, które według nas mają dużą wagę dla modelu, i 3 o najmniejszej wadze. Następnie zaprezentowaliśmy wstępną propozycję na spotkaniu i utrzymywaliśmy dyskusję do momentu, kiedy usunięte przez nas zamienne zostały zaproponowane przez uczestników. W ten sposób osiągnęliśmy listę ok. 60 informacji dotyczących klienta, które mogą mieć wpływ na decyzję o odejściu do innego ubezpieczyciela. Wiedząc, jakie dane chcielibyśmy wykorzystać w modelowaniu, możemy przeprowadzić ich selekcję ze względu na dostępność i wartość dla modelu. Na początek sprawdziliśmy (w różnych źródłach), które dane zaproponowane na poprzednim etapie są dla nas osiągalne i zgromadziliśmy je na nasze potrzeby. Większość danych, które były nam potrzebne do dalszych analiz, znajdowało się we wcześniej zbudowanej Marketingowej Hurtowni Danych. Część udało się dodatkowo znaleźć w naszych firmowych systemach i źródłach, z których do tej pory nie korzystaliśmy. Dwie zmienne z listy odłożyliśmy do czasu budowania kolejnych modeli migracji, ponieważ nie były dostępne. Chcielibyśmy szczególnie zwrócić uwagę na dwa aspekty podejścia do gromadzenia i wykorzystywania danych: 1. Jeśli dane są dostępne tylko dla ograniczonej liczby klientów (nawet niewielkiej), nie należy ich odrzucać z zasady jako niedostępne. Sam fakt, czy dana informacja o kliencie jest dostępna czy nie, może być wykorzystany jako wartościowa zmienna Copyright StatSoft Polska 2011 www.statsoft.pl/czytelnia.html 47

w modelowaniu (oczywiście nie zadziała to w każdym przypadku, ale warto spróbować). 2. Dobrą praktyką jest również analiza danych, które zebraliśmy pod kątem opracowania na ich podstawie wskaźników (danych pochodnych) dodatkowo zwiększających liczbę zmiennych i dających ciekawe wyniki. W tym miejscu warto ponownie skonsultować swoje przemyślenia z kolegami odpowiedzialnymi za różne obszary w firmie. Nie bójmy się eksperymentować, ponieważ możemy otrzymać naprawdę bardzo ciekawą zmienną, którą będziemy mogli wielokrotnie wykorzystać. Z przykładów zmiennych pochodnych już stosowanych w naszych analizach i modelach warte wskazania są: Określenie typu miejsca zamieszkania. W naszych danych nie mamy jednoznacznej informacji, czy klient mieszka w mieszkaniu czy w domu jednorodzinnym. Jest ona bardzo przydatna do wielu analiz. W naszym przypadku tworzymy go na podstawie numeru mieszkania podanego w adresie. Jeśli taki numer figuruje, możemy założyć, że klient mieszka w bloku, zaś jeśli nie, można domniemać, że to dom wolnostojący. Wskaźniki regionalne. Zdarza nam się wykorzystywać dane o sile nabywczej w okolicy, w której mieszka klient. Dane pochodzą z zewnętrznego źródła, ale możemy każdemu z klientów przypisać odpowiednią wartość na podstawie kodu pocztowego miejsca zamieszkania. Wskaźniki pochodne kanału dystrybucji. Na podstawie danych o agencie obsługującym klienta możemy np. przypisać klientowi wskaźnik odnowień (średnia dla portfela danego agenta). Warto pochylić się nad tym tematem. Jeżeli opracujemy kilkanaście różnych danych pochodnych, mamy szansę zdobyć jedną lub dwie zmienne wartościowe dla modelu. Ważna jest w tym przypadku kreatywność i wyczucie biznesowe, a co najważniejsze, zaakceptowanie tego, że aby otrzymać wartościowe wyniki czasami musimy wykonać sporo pracy, która post factum zostanie odrzucona jako mało wartościowa dla dalszych analiz. Po zgromadzeniu maksymalnej ilości danych, przychodzi czas na ich czyszczenie. Jest to najbardziej pracochłonny etap. Średnio zajmuje od 60% do nawet 80% czasu potrzebnego do zbudowania modelu. Przy pracy nad modelem dla ubezpieczeń mieszkaniowych podeszliśmy do tematu w 3 etapach. 1. Czyszczenie eksperckie. Polega na czyszczeniu danych z błędów systemowych, które znamy, lub też uzupełnianiu danych brakujących, które znajdują się w więcej niż jednym miejscu w systemach informatycznych. Przykład: w wyniku historycznych zaszłości informacje o zgodach klientów na przetwarzanie ich danych w celach marketingowych znajdowały się w przypadku części klientów bezpośrednio w kartotece klienta, a w innych przypadkach przy danych o polisie. Aby mieć pełen obraz tego zjawiska, musieliśmy połączyć dane z kilku miejsc. 2. Uzupełnianie braków. Wspomnieliśmy już wcześniej, że warto przyjrzeć się dokładniej danym, nawet jeśli w części bazy ich brakuje. W zależności od liczby braków oraz specyfiki informacji, którą zawierają dane, możemy je uzupełniać, np. średnią, domi- 48 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2011

nantą lub inną wartością. W przypadkach, gdzie liczba danych jest bardzo niska, możemy przetworzyć zmienną na binarną o wartościach są dane/nie ma danych i w takiej formie przetestować ją dalej w modelu. Przykład: Uzupełnianie braków stosowaliśmy np. przy określaniu siły nabywczej według miejsca zamieszkania. Jeśli dane precyzyjne nie były dostępne, uzupełnialiśmy je średnią z obszarów sąsiadujących. 3. Czyszczenie błędów merytorycznych. Błędy takie mogą wynikać np. z uwarunkowań produktu. Czyszczenie to głównie opieramy na eliminacji przypadków, które nie powinny mieć miejsca, a w wyniku odstępstw lub błędów znalazły się w bazie. Przykład: Według bazy danych na niektórych polisach naliczono składkę niższą niż minimum określone taryfikatorem. Użycie takich danych może zaburzyć późniejsze analizy, usunęliśmy więc takie przypadki. Etap czyszczenia danych jest bardzo czasochłonny i może rodzić pokusę wykonania tylko minimalnych korekt danych, bądź pominięcia niektórych czynności. Jest to etap niezmiernie ważny, dlatego warto przeprowadzić go niezwykle skrupulatnie i poświęcić mu odpowiednią ilość czasu. Z naszych doświadczeń wynika, że zaniedbania na tym etapie mogą mieć ogromny wpływ na model. Etap III wybór zmiennych i metody modelowania Dzięki narzędziom statystycznym w łatwy sposób określimy zmienne przydatne, zmienne zbędne i zmienne zbyt mocno wpływające na model. Narzędzia takie są precyzyjnie omawiane na szkoleniach z data mining. W naszym przypadku po etapie burzy mózgów dysponowaliśmy ok. 60 potencjalnymi zmiennymi. Po czyszczeniu zmiennych oraz sprawdzeniu ich zależności między sobą wybraliśmy 21 zmiennych do oceny ich przydatności dla modelu. Ostatecznie do modelu zakwalifikowaliśmy 5 zmiennych z najwyższą wartością wskaźnika Information Value i jednocześnie najbardziej się od siebie różniących. Zależność między zmiennymi i różnorodność informacji, które ze sobą niosą, są tu niezwykle ważne. Jeśli mamy kilka zmiennych o podobnej wartości dla modelu, ale mocno ze sobą skorelowanych, lepiej wybrać do modelu jedną z nich. Dobrym przykładem na zmienne skorelowane ze sobą w ubezpieczeniach mogą być: wysokość składki i suma ubezpieczenia lub wysokość składki i liczba polis. Drugim ważnym czynnikiem przed ostateczną budową modelu jest wybór metody modelowania. Budując model churn w Warcie, rozważaliśmy dwie metody: drzewa decyzyjne oraz metodę skoringową. Drzewa decyzyjne są metodą bardzo prostą w interpretacji i łatwą w zastosowaniu. Skoring marketingowy jest trudniejszy w dalszym przekazie, ale jest metodą dokładniejszą. Copyright StatSoft Polska 2011 www.statsoft.pl/czytelnia.html 49

Ze względu na znacznie lepsze dopasowanie modelu zdecydowaliśmy się na zastosowanie skoringu do budowy modelu churn dla ubezpieczeń mieszkaniowych. Jednocześnie wiedząc, jak ważne jest przekonanie innych do wyników naszej pracy, szukaliśmy sposobu na pokazanie kolegom wymiernych korzyści, które możemy osiągnąć, stosując zbudowany model w praktyce. Proponujemy wykonanie w tym celu następującego ćwiczenia: Po zbudowaniu modelu możemy zastosować go dla danych historycznych i sprawdzić, ilu klientów, których model wytypował jako odchodzących, rzeczywiście zakończyło współpracę z firmą. W ten sposób zdobędziemy łatwy argument do dyskusji. Kolegom z działu sprzedaży możemy wtedy pokazać, w ilu przypadkach moglibyśmy mieć system wczesnego ostrzegania i możliwość zareagowania, zanim klient odszedł, gdyby model został zaimplementowany wcześniej. Konkretne przykłady i rzeczywiste liczby są najbardziej przekonujące. Etap IV analiza wstępna Jesteśmy na etapie, w którym prawie możemy przystąpić do modelowania. Prawie, ponieważ musimy jeszcze wybrać zbiór danych, na których zbudujemy nasz model, oraz zmienne, które ostatecznie włączymy do modelu. W tym miejscu po raz kolejny odniesiemy się do naszej praktyki. Analizę oparliśmy na około 40 tysiącach przypadków. Uznaliśmy to za liczbę wystarczającą do osiągnięcia wiarygodnych wyników, ale nie wpływającą na zbytnie wydłużenie czasu potrzebnego na obliczenia. Baza nie była wybrana losowo. Zadbaliśmy o jej właściwą strukturę, tzn. ponad 10% cechy badanej (czyli w naszym przypadku 10% klientów, którzy odeszli). Jeśli przypadków takich byłoby zbyt mało, trudno byłoby zbudować dobry model. Następnie bazę podzieliliśmy na dwa zbiory: uczący i testowy. Zbiór uczący losowaliśmy w ten sposób, aby zawierał 50% cech pozytywnych i 50% cech negatywnych, czyli w tym przypadku po połowie klientów, którzy odeszli i pozostali. Zbiór danych podzieliliśmy między próbę uczącą i testową w stosunku 1 do 2. Przy wyborze zmiennych chcielibyśmy zwrócić uwagę na kilka czynników, które mogą determinować liczbę i rodzaj zmiennych wybranych do modelu. Z naszego doświadczenia wynika, że w skoringach marketingowych, w przeciwieństwie do bankowych, dobrze jest ograniczyć się do maksymalnie 7 predyktorów. Jest to efektem cyklu życia modelu. W zadaniach marketingowych chcemy szybko analizować rezultaty naszych działań. Terminy liczymy raczej w tygodniach niż w miesiącach. Stąd też powinniśmy być pewni, że zmienne, które wejdą do modelu, będą szybko dostępne. Efektem tego może być nawet rezygnacja z niektórych predyktorów nie ze względu na ich wartość dla modelu, ale na czas ich pozyskiwania. Przed ostatecznym zbudowaniem modelu dokonujemy dyskretyzacji danych tam, gdzie uważamy to za biznesowo uzasadnione lub korzystne dla modelu. To trzeci moment 50 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2011

w czasie analizy churn, w którym proponujemy konsultacje z osobami znającymi specyfikę sprzedaży i parametry produktów. Mogą istnieć pewne zależności, o których nie wiemy lub łatwo możemy przeoczyć, a jednocześnie mogą mieć istotny wpływ na wyniki modelu. Przykładem tego typu zależności może być np. automatyczna zniżka w składce klienta po osiągnięciu pewnego progu sumy ubezpieczenia. Jeśli nie przewidzimy tej szczególnej sytuacji przy podziale zmiennej opisującej sumę ubezpieczenia, wyniki modelu mogą być trudne do interpretacji. Podział danych na odpowiednie przedziały może przebiegać bardzo różnie. W naszych analizach, w przypadku danych ilościowych, najczęściej dobrze sprawdzały się przedziały równoliczne. Dobrą praktyką jest również używanie relatywnie niedużej liczby przedziałów około 5. Znacząco inna sytuacja jest w przypadku zmiennych jakościowych. Tu liczba przedziałów może być bardzo różna (zdarzyło nam się dzielić zmienną tak na dwa, jak i na dwanaście przedziałów). Jest to kolejne miejsce, w którym wiedza kolegów spoza zespołu analityków o logice połączeń i podziałów zmiennych może okazać się bezcenna. Przykładem zmiennej dzielonej na dwa przedziały może być rodzaj miejsca zamieszkania Dwie wybrane grupy dom jednorodzinny (obejmujący wartości zmiennej takie jak: segment, bliźniak, dom wolnostojący) lub mieszkanie (z wartościami: mieszkanie, apartament). Zmienna, która może przyjmować wiele przedziałów, to np. marka i model samochodu. W zależności od biznesowych ustaleń i konkretnych potrzeb możemy ją podzielić i według klasy samochodu, i marki. W pierwszym przypadku będziemy mieli kilka przedziałów, w drugim kilkanaście, a to przecież wciąż ta sama zmienna. To już ostatni krok, który był do wykonania przed finałem, czyli zbudowaniem i oceną modelu. Etap V budowa modelu Mając odpowiednią liczbę przypadków, wybrane i odpowiednio przygotowane predyktory, możemy rozpocząć budowanie modelu. W STATISTICA jest to proces automatyczny, którego wynikiem jest gotowa tablica skoringowa. Zawiera ona wybrane przez nas predyktory oraz liczbę punktów przyporządkowaną każdej z wartości przyjmowanej przez zmienną. Ostatnią czynnością przed przyjemnością interpretacji wyników modelu jest jego testowanie. Jesteśmy zwolennikami dobierania próby testowej tak, aby zawierała ona relatywnie dużo przypadków z ostatniego okresu. Ocena modelu jest wtedy bardziej miarodajna. Podobnie jak budowa modelu, tak i ocena to proces automatyczny, dzięki czemu możliwe jest bardzo szybkie jej przeprowadzenie. Copyright StatSoft Polska 2011 www.statsoft.pl/czytelnia.html 51

Aby móc uznać budowę modelu za zakończoną, ustalamy na koniec punkt odcięcia, czyli graniczną liczbę punktów w skoringu klienta, od której uznajemy klienta za zagrożonego odejściem. Jest to według nas istotny punkt analizy i stanowi on dobry moment na kolejne spotkanie z tymi kolegami z firmy, którzy będą później korzystali z wyników naszego modelu. Nie zawsze punktem ostatecznie zastosowanym będzie ten wynikający z czystej statystyki. Kluczowy wpływ na jego wybór może mieć na przykład decyzja o wysokości kosztów, jakie decydujemy się ponosić na działania utrzymujące klientów. W statystycznej części decyzji o wyborze punktu odcięcia bardzo pomocny jest wykres zysku. 100% 90% 80% Wykres zysku Skumulowany procent złych 70% 60% 50% 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Skumulowany procent ogółem Linia ciągła na wykresie pokazuje nam wyniki modelu, a linia przerywana działania losowe. Wykres pokazuje, że np. chcąc objąć działaniami zapobiegającymi odejściom 10% wszystkich klientów, stosując model, powinniśmy dotrzeć do ok. 35% klientów zagrożonych odejściem (versus 10% takich klientów przy wyborze losowym). Do podjęcia decyzji biznesowej pomocny może być również wykres pokazujący rozkład przypadków według punktacji i statusu. Analiza poniższego wykresu może pokazać, jak dobrze model jest w stanie rozseparować klientów dobrych od złych, oraz zasugerować optymalny punkt odcięcia. Na naszym wykresie może to być poziom około 490 punktów. W podjęciu decyzji o określeniu optymalnego punktu odcięcia może dodatkowo wesprzeć nas analiza takich wykresów jak np.: wykres Kołmogorowa-Smirnowa lub wykres dochodowości w zależności od punktacji. 52 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2011

30 % rozkład przypadków wg punktacji i statusu 25 20 % przypadków 15 10 5 0 434-444 444-454 454-464 464-474 474-484 484-494 Procent dobrych Procent złych Punkt odcięcia=434 494-504 504-514 514-524 524-534 534-544 544-554 554-564 564-574 574-584 584-594 594-604 VI skuteczność modelu Prawdziwą skuteczność modelu marketingowego poznamy dopiero po zastosowaniu jego wyników w praktyce i porównaniu wskaźników odnowień z danymi historycznymi. Warto również pamiętać o tym, że model może nam pomóc w podniesieniu efektywności naszych działań odnowieniowych, ale nie wskaże nam 100% klientów, którzy chcą odejść i nie powie co zrobić, by ich zatrzymać. Statystyczną skuteczność modelu, rozumianą jako identyfikację klientów zagrożonych odejściem, możemy ocenić, analizując krzywą ROC. Poniżej widzimy wykres, jaki uzyskaliśmy dla naszego modelu. W oznaczonym punkcie zbudowany model pozwala na wytypowanie 40% klientów potencjalnie zagrożonych odejściem, jednocześnie w wybranej grupie znajdzie się 10% klientów, którzy odejść nie zamierzają. Informacja będzie jeszcze bardziej czytelna, jeśli porównamy to z analogicznym wynikiem dla losowej próby klientów (tu powinno się znaleźć 40% odchodzących, ale również 40% tych nieodchodzących). Copyright StatSoft Polska 2011 www.statsoft.pl/czytelnia.html 53

1,0 Wykres Roc 0,9 0,8 0,7 0,6 Czułość 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1-Specyficzność Etap VII rekomendacje wynikające z modelu i skuteczność działań Gwarancją sukcesu działań podjętych przy budowie modelu będzie ich późniejsze przełożenie na konkretne działania. Z pozycji zespołu analitycznego możemy przygotować: 1. Listę klientów zagrożonych odejściem 2. Listę globalnych zależności, wynikających z modelu, które mogą pomóc w zaplanowaniu odpowiednich działań. Na takiej liście może znaleźć się na przykład stwierdzenie, że klienci obsługiwani przez multiagentów mają większą skłonność do odejścia. W tym momencie intensywność prac nad wynikami powinna przenieść się z zespołu analitycznego na zespół biznesowy. W jego rękach będzie zbudowanie zestawu narzędzi możliwych do zastosowania zarówno przez firmę, jak i poszczególnych sprzedawców, którego celem będzie zmniejszenie ryzyka odejść klientów. W takim zestawie mogą pojawić się np.: mailing, promocje lub komunikat wysłany do sprzedawcy, którzy klienci w jego portfelu są zagrożeni odejściem. Do listy rekomendacji wynikających z modelu warto tutaj dodać wyniki badań klientów, którzy od nas odeszli nikt nie zna lepiej motywacji ich działań i ewentualnych możliwych akcji, które można by podjąć, by ich zatrzymać, niż oni sami. 54 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2011

Podstawowymi warunkami, które muszą zostać spełnione, by poziom odnowień po zastosowaniu modelu churn faktycznie wzrósł, według nas są: 1. Przekonanie pracowników działu sprzedaży do zaproponowanych działań. Jeżeli sprzedawcy zrozumieją dobrze zasady, cele akcji oraz dostrzegą płynące z niej korzyści, możemy powiedzieć, że mamy już połowę sukcesu. 2. Zestaw skutecznych narzędzi zapobiegających odejściu, z których mogą korzystać sprzedawcy. Ważne jest zebranie informacji na temat odpowiednich działań z różnych źródeł, takich jak: rekomendacje z modelu, wyniki badań (szczególnie skuteczne jest spojrzenie na wyniki badań klientów, którzy odeszli i jednocześnie byli wytypowani do odejścia przez skoring), wiedza ekspercka. 3. Użyteczność modelu punkt naszym zdaniem równie ważny, jak element drugi. To od modelu i jego dopasowania zależy, czy grupa klientów, do których skierujemy nasze działania, będzie odpowiednią grupą. Podsumowanie Marketingowe modele skoringowe różnią się od modeli bankowych. Na ogół muszą być wykonane szybciej, ze względu na jednorazowość z pominięciem kalibrowana, a po zamknięciu akcji marketingowej poddane jednokrotnej ocenie. Oczywiście czasami zdarzają się i takie, które wykorzystujemy długofalowo, jak omawiany model odejść, ale wymagają one częstych weryfikacji. Już nawet po roku zestaw cech wskazujących na prawdopodobieństwo zajścia modelowanego zdarzenia może zmienić się radykalnie. Głównym przesłaniem, które chcielibyśmy przekazać na koniec rozważań, jest konieczność współdziałania przedstawicieli wielu obszarów w procesie tego typu analizy. Bez takiej współpracy i szerokich konsultacji szanse na powodzenie są znikome. Chcemy również podkreślić, że analitycy zaangażowani w budowę modeli statystycznych powinni mieć w swoim gronie osobę, która potrafi przełożyć trudny dla większości język statystyki na proste i klarowne komunikaty pokazujące korzyści z jej stosowania. Copyright StatSoft Polska 2011 www.statsoft.pl/czytelnia.html 55