METODA KLASYFIKACJI KLIENTÓW OPERATORA TELEFONII KOMÓRKOWEJ W ANALIZIE ZJAWISKA REZYGNACJI1



Podobne dokumenty
ZAANGA OWANIE PRACOWNIKÓW W PROJEKTY INFORMATYCZNE

Harmonogramowanie projektów Zarządzanie czasem

INSTRUKCJA DLA UCZESTNIKÓW ZAWODÓW ZADANIA

Warunki Oferty PrOmOcyjnej usługi z ulgą

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

Edycja geometrii w Solid Edge ST

Jak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach.

CASE CPI może być wczesnym wskaźnikiem tendencji zmian cen w gospodarce

Podstawa prawna: Ustawa z dnia 15 lutego 1992 r. o podatku dochodowym od osób prawnych (t. j. Dz. U. z 2000r. Nr 54, poz. 654 ze zm.

Objaśnienia do Wieloletniej Prognozy Finansowej na lata

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

Segmentacja i plasowanie dr Grzegorz Mazurek. Wybór rynku docelowego. Istota segmentacji

Efektywna strategia sprzedaży

Projektowanie bazy danych

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

OGÓLNOPOLSKIE STOWARZYSZENIE KONSULTANTÓW ZAMÓWIEŃ PUBLICZNYCH Warszawa, ul. Trębacka 4 l: biuro@oskzp.pl

REGULAMIN przeprowadzania okresowych ocen pracowniczych w Urzędzie Miasta Mława ROZDZIAŁ I

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

PROJEKTOWANIE SYSTEMÓW LOGISTYCZNYCH PROJEKT SYSTEMY LOGISTYCZNE PODSTAWY TEORETYCZNE

Regulamin programu "Kredyt Hipoteczny Banku BPH. Obowiązuje od dnia: r.

Regulamin Obrad Walnego Zebrania Członków Stowarzyszenia Lokalna Grupa Działania Ziemia Bielska

PRÓG RENTOWNOŚCI i PRÓG

Zobacz to na własne oczy. Przyszłość już tu jest dzięki rozwiązaniu Cisco TelePresence.

Nowości w module: BI, w wersji 9.0

6. Projektowanie składu chemicznego stali szybkotn cych o wymaganej twardo ci i odporno ci na p kanie

System wielokryterialnej optymalizacji systemu traderskiego na rynku kontraktów terminowych

JUKAWA. Co dalej? Metoda analizy

wzór Załącznik nr 5 do SIWZ UMOWA Nr /

Praca badawcza. Zasady metodologiczne ankietowego badania mobilności komunikacyjnej ludności

Wiedza niepewna i wnioskowanie (c.d.)

Objaśnienia wartości, przyjętych do Projektu Wieloletniej Prognozy Finansowej Gminy Golina na lata

Załącznik nr 1 do specyfikacji BPM.ZZP UMOWA NR

U Z A S A D N I E N I E

WYMAGANIA OFERTOWE. Przetarg nr PZ-451

DE-WZP JJ.3 Warszawa,

Warszawska Giełda Towarowa S.A.

Infrastruktura krytyczna dużych aglomeracji miejskich wyznaczanie kierunków i diagnozowanie ograniczeńjako wynik szacowania ryzyka

Postanowienia ogólne. Usługodawcy oraz prawa do Witryn internetowych lub Aplikacji internetowych

REGULAMIN PROMOCJI: BĄDŹ GOTÓW NA VAT! WYBIERZ SYMFONIĘ

RZECZPOSPOLITA POLSKA. Prezydent Miasta na Prawach Powiatu Zarząd Powiatu. wszystkie

Krótkoterminowe planowanie finansowe na przykładzie przedsiębiorstw z branży 42

4.3. Struktura bazy noclegowej oraz jej wykorzystanie w Bieszczadach

OGÓLNODOSTĘPNE IFORMACJE O WYNIKACH EGZAMINÓW I EFEKTYWNOŚCI NAUCZANIA W GIMNAZJACH przykłady ich wykorzystania i interpretowania

Wprowadzenie do zarządzania procesami biznesowymi czym są procesy biznesowe: Part 1

KONCEPCJA NAUCZANIA PRZEDMIOTU RACHUNKOWOŚĆ SKOMPUTERYZOWANA" NA WYDZIALE ZARZĄDZANIA UNIWERSYTETU GDAŃSKIEGO

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Regulamin Promocji rachunek z premi. 1. Organizator Promocji

DANE UCZESTNIKÓW PROJEKTÓW (PRACOWNIKÓW INSTYTUCJI), KTÓRZY OTRZYMUJĄ WSPARCIE W RAMACH EFS

2) Drugim Roku Programu rozumie się przez to okres od 1 stycznia 2017 roku do 31 grudnia 2017 roku.

Akademia Młodego Ekonomisty

Działalność gospodarcza i działalność statutowa odpłatna organizacji pozarządowych. Tadeusz Durczok, 8 grudnia 2008

ZASTOSOWANIE TEORII ZBIORÓW PRZYBLI ONYCH DO OCENY PREFERENCJI KLIENTÓW MARKETINGOWEJ HURTOWNI DANYCH

URZĄD OCHRONY KONKURENCJI I KONSUMENTÓW

art. 488 i n. ustawy z dnia 23 kwietnia 1964 r. Kodeks cywilny (Dz. U. Nr 16, poz. 93 ze zm.),

4.3. Warunki życia Katarzyna Gorczyca

Bazy danych. Andrzej Łachwa, UJ, /15

S T A N D A R D V. 7

Stanowisko Rzecznika Finansowego i Prezesa Urzędu Ochrony Konkurencji i Konsumentów w sprawie interpretacji art. 49 ustawy o kredycie konsumenckim

ZAPYTANIE OFERTOWE z dnia r

AUTOR MAGDALENA LACH

Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows.

Jak korzystać z Group Tracks w programie Cubase na przykładzie EWQLSO Platinum (Pro)

Uchwała nr O III Krajowej Rady Izby Architektów RP z dnia 20 marca 2012 r. w sprawie wprowadzenia wzoru kontraktu menedżerskiego

BIZNESU I JĘZYKÓW OBCYCH

Ewaluacja projektu szkoleniowego Międzykulturowe ABC

OSZACOWANIE WARTOŚCI ZAMÓWIENIA z dnia roku Dz. U. z dnia 12 marca 2004 r. Nr 40 poz.356

SYSTEM FINANSOWANIA NIERUCHOMOŚCI MIESZKANIOWYCH W POLSCE

PK Panie i Panowie Dyrektorzy Izb Skarbowych Dyrektorzy Urzędów Kontroli Skarbowej wszyscy

Procedura dot. ustalenia wska nika rezultatu

CONSUMER CONFIDENCE WSKAŹNIK ZADOWOLENIA KONSUMENTÓW W POLSCE Q3 2015

Bielsko-Biała, dn r. Numer zapytania: R WAWRZASZEK ISS Sp. z o.o. ul. Leszczyńska Bielsko-Biała ZAPYTANIE OFERTOWE

Metodologia badania satysfakcji mieszkańców z realizacji polityk publicznych

Audyt SEO. Elementy oraz proces przygotowania audytu. strona

z dnia Rozdział 1 Przepisy ogólne

Szczegółowe wyjaśnienia dotyczące definicji MŚP i związanych z nią dylematów

WZÓR UMOWY. ul. Lubelska 13, Warszawa, NIP , REGON

Bojszowy, dnia r. Znak sprawy: GZOZ/P1/2010 WYJAŚNIENIE TREŚCI SIWZ

Ogólnopolska konferencja Świadectwa charakterystyki energetycznej dla budynków komunalnych. Oświetlenie publiczne. Kraków, 27 września 2010 r.

Zapytanie o propozycję nr 42/CP/2013/TZ

Umowa została zawarta w wyniku wyboru Wykonawcy w postępowaniu przetargowym nr... w trybie przetargu nieograniczonego.

UCHWAŁA... Rady Miejskiej w Słupsku z dnia...

POWIATOWY URZĄD PRACY

1 Przedmiot Umowy 1. Przedmiotem umowy jest sukcesywna dostawa: publikacji książkowych i nutowych wydanych przez. (dalej zwanych: Publikacjami).

Umowa na przeprowadzenie badań ilościowych

Od redakcji. Symbolem oznaczono zadania wykraczające poza zakres materiału omówionego w podręczniku Fizyka z plusem cz. 2.

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007

BADANIE RYNKU. Prof. dr hab. Andrzej Pomykalski. Katedra Innowacji i Marketingu

W Regulaminie dokonuje się następujących zmian:

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych?

Ogólna charakterystyka kontraktów terminowych

OPIS PRZEDMIOTU ZAMÓWIENIA

KOMISJA WSPÓLNOT EUROPEJSKICH. Wniosek DECYZJA RADY

ZAPYTANIE OFERTOWE. Niniejszy wydatek jest realizowany i finansowany ze środków publicznych umowa dotacyjna z Ministerstwem Gospodarki.

Regulamin organizacji przetwarzania i ochrony danych osobowych w Powiatowym Centrum Kształcenia Zawodowego im. Komisji Edukacji Narodowej w Jaworze

REGULAMIN PRZEPROWADZANIA OCEN OKRESOWYCH PRACOWNIKÓW NIEBĘDĄCYCH NAUCZYCIELAMI AKADEMICKIMI SZKOŁY GŁÓWNEJ HANDLOWEJ W WARSZAWIE

PROJEKTOWANIE PROCESÓW PRODUKCYJNYCH

Eksperyment,,efekt przełomu roku

ZAPYTANIE OFERTOWE dot. rozliczania projektu. realizowane w ramach projektu: JESTEŚMY DLA WAS Kompleksowa opieka w domu chorego.

Transkrypt:

METODA KLASYFIKACJI KLIENTÓW OPERATORA TELEFONII KOMÓRKOWEJ W ANALIZIE ZJAWISKA REZYGNACJI1 PIOTR SULIKOWSKI, RYSZARD BUDZI SKI Politechnika Szczeci ska Streszczenie Rezygnacja klientów stanowi powa ny problem dla ka dego operatora telefonii komórkowej. Wystarczaj co wczesna identyfikacja potencjalnych rezygnuj cych mogłaby pozwoli utrzyma ich w sieci danego operatora. Proponuje si wieloetapow procedur badawcz, umo liwiaj c identyfikacj czynników wpływaj cych na odej- cia, a nast pnie opracowanie klasyfikacyjnego modelu badanego zjawiska osobno dla ka dego segmentu klientów. Opisana metoda pozwala uwzgl dnia zarówno zmienne liczbowe, jak i lingwistyczne, a tak e element czasu charakteryzuj cy dane z ró nych okresów z przeszło ci. Słowa kluczowe: eksploracja danych, zbiory przybli one, churn, CRM, telefonia komórkowa 1. Wprowadzenie Według GSM World Association, czyli organizacji, która zrzesza operatorów GSM [ang. Global System for Mobile communication] i regulatorów telekomunikacyjnych z całego wiata, pod koniec roku 2007 w technologii GSM aktywnych było niemal 2,9 miliarda kart SIM [ang. Subscriber Identity Module] w ponad 220 krajach i terytoriach. Stanowiło to ponad 86% cyfrowej komunikacji mobilnej na wiecie [1]. Z bada ankietowych, których wyniki podano w [2] wynika, e ok. 3/4 Polaków ma telefon komórkowy, przy czym 10-11% posiada wi cej ni jedn komórk. Według Urz du Komunikacji Elektronicznej na koniec 2007 roku w Polsce aktywnych było 34 mln kart SIM, a zatem wska nik penetracji kształtował si na poziomie ok. 90%. Telefonia mobilna to niezwykle konkurencyjny sektor rynku, gdy operatorzy usilnie zabiegaj o klientów ich liczba bezpo rednio przekłada si przecie na wielko przychodów [3]. Odsetek klientów rezygnuj cych z dotychczasowej sieci telefonii mobilnej w Europie i Stanach Zjednoczonych wynosi przeci tnie 24-36% rocznie [4] i jego zmiany wykazuj tendencj wzrostow. Według danych Urz du Komunikacji Elektronicznej polscy operatorzy znajduj si w cisłej czołówce odsetek klientów odchodz cych w zale no ci od sieci wynosił od 32,5% do 37,2% w samym tylko roku 2007, w którym to odł czono w sumie a 13,5 mln (!) kart SIM. Osoby, które przestaj by klientami danej firmy np. na rzecz jej bezpo redniej konkurencji mog w istotny sposób decydowa o kształcie rynku. Jest to szczególnie widoczne w przypadku przedsi wzi, w których koszty pozyskania klienta s niewspółmiernie wysokie do kosztów jego 1 W artykule przedstawiono wybrane elementy pracy mgra in. Piotra Sulikowskiego napisanej pod kierunkiem promotora prof. dra hab. in. Ryszarda Budzi skiego. Przygotowanie odno nej pracy mo liwe było m.in. dzi ki uczestnictwu w mi dzynarodowym programie konkursowym SAS Fellowship Program oraz współpracy z operatorami telefonii komórkowej.

114 Piotr Sulikowski, Ryszard Budzi ski Metoda klasyfikacji klientów operatora telefonii komórkowej w analizie zjawiska rezygnacji utrzymania. Problem odej jest najbardziej dotkliwy, gdy dotyczy grupy najwa niejszych, najbardziej dochodowych klientów, tych o wysokiej warto ci yciowej LTV [ang. lifetime value]. Dogł bne poznanie problemu i wiedza o tym, kim s klienci, których nie udało si zatrzyma mo e przyczyni si do przewagi konkurencyjnej danej firmy. Dopiero pod koniec ubiegłego wieku wiedz tak zacz to wykorzystywa, analizuj c dane i tworz c modele, które z wi kszym lub mniejszym powodzeniem pozwalały wskazywa rezygnuj cych klientów [5]. Co istotne, kiedy potencjalnych odchodz cych uda si ju poprawnie zidentyfikowa, koszt działa zapobiegawczych wcale nie musi by wysoki cz sto wystarczy nawi zanie bezpo redniego kontaktu z klientem, np. przeprowadzenie ankiety czy zwykłej rozmowy telefonicznej, wypytanie klienta o poziom jego satysfakcji itp. Powstaje jednak problem, w jaki sposób klasyfikowa klientów jako potencjalnie pozostaj cych lub odchodz cych, aby móc przedsi wzi kroki zmierzaj ce do zmniejszenia odsetka rezygnacji. Rozwi zanie mog przynie ró nego rodzaju metody eksploracji danych i odkrywania wiedzy. Dzi ki wykorzystaniu danych, które s standardowo gromadzone w bazach operatora (tzn. nawet bez trudniej dost pnych danych o sytuacji na rynku czy satysfakcji klienta) mo na próbowa opracowa wystarczaj co dokładny klasyfikacyjny model odej, a nast pnie przenie odkryte reguły rz dz ce zjawiskiem dla badanych klientów w przeszło ci na przyszło. W toku bada wykorzystywano pakiet oprogramowania SAS, pozwalaj cy na zautomatyzowan realizacj pewnych standardowych zada analitycznych. Zastosowany j zyk programowania to SAS 4GL [ang. 4th Generation Language]. Ponadto korzystano z programu ROSE2, udost pnianego dla celów naukowych przez Zakład Inteligentnych Systemów Wspomagania Decyzji Instytutu Informatyki Politechniki Pozna skiej [6]. 2. Utrzymanie i rezygnacja Zagadnienia omawiane w niniejszym artykule nale y umie ci w kontek cie jednej z ogólnych filozofii działania przedsi biorstwa, jakim jest zarz dzanie relacjami z klientami CRM [ang. Customer Relationship Management]. Mówi ona, e w ka dej dziedzinie i na ka dym etapie funkcjonowania firmy preferencje, wymagania i przyzwyczajenia klienta oraz umiej tne budowanie relacji z nim s najwa niejsze. Filozofia CRM-u uwzgl dnia fakt, e ka dy klient jest indywidualn jednostk, wskazuj c, i ka dego trzeba traktowa nie w sposób masowy, ale taki, jakiego by sobie yczył [7]. W informatyce CRM-em nazywany jest system informatyczny, który w istotny sposób przyczynia si do realizacji zarysowanej powy ej strategii. Utrzymanie (retencja, zatrzymanie) klienta odnosi si do powtórnego zakupu produktów lub ponownego skorzystania z usług danego dostawcy przez danego klienta. Retencja jest oczywi cie zjawiskiem pozytywnym dla firmy, chyba e dotyczy pewnej grupy osób przynosz cych firmie straty lub szkody. Zwykle jednak im wi ksza baza warto ciowych klientów, tym wi ksze przychody i zyski firmy. Ponadto osoby wielokrotnie korzystaj ce z oferty danego przedsi biorstwa (tzw. klienci stali) s zazwyczaj mniej wra liwi na wzrost cen; wiele osób skłonnych jest płaci wy sz cen za produkty firmy, która jest ju im znana, i któr darz zaufaniem [8]. Poj ciem przeciwstawianym utrzymaniu jest rezygnacja, lub inaczej odej cie, cz sto okre lane te jako churn [czyt. czern]. Oznacza ono całkowite zaprzestanie nabywania pewnych produktów/usług lub tylko zmian dostawcy. Nale ałoby si odnie do dwóch głównych typów churnu: przymusowego [ang. involuntary churn], i dobrowolnego [ang. voluntary churn].

POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 16, 2008 115 W literaturze nie ma zgodno ci co do interpretacji ww. typów odej ; według autora mo na powy sze rozumie tak, e rezygnacja pierwszego rodzaju spowodowana jest okoliczno ciami, zazwyczaj niespodziewanymi, na które dostawca nie ma bezpo redniego wpływu, cho by zmian miejsca zamieszkania konsumenta poza obszar wiadczenia usług, jego zł sytuacj finansow czy te wzgl dami zdrowotnymi. Odej cie drugiego typu wynika [za ] z przyczyn, na które dostawca ma wpływ lub na które mo e skutecznie reagowa, np. braku satysfakcji z produktu, jego trudnej dost pno ci, dotychczasowych złych do wiadcze z nim, wzrostu opłat lub braku czytelno ci cennika, niskiej jako ci obsługi [9]. Stosowanych jest co najmniej kilka ró nych miar zjawiska. Najcz ciej stosowanym miernikiem jest tzw. wska nik rezygnacji CR [ang. churn rate], inaczej wska nik odej, wska nik utraty klienta lub wska nik churnu. Wyra a on redni roczny odsetek utraconych klientów [8]. Nale y wyja ni jednak, e wska nik utraty klienta mo e dotyczy okresów innych ni rok kalendarzowy. Ogólnie zatem okre la wielko grupy klientów, która nie dokonuje kolejnego zakupu w danej firmie w ci le okre lonym czasie (najcz ciej wynikaj cym ze specyfiki przedsi biorstwa i cyklu zakupowego) wzgl dem całej bazy klientów: n CR = c 100%, n gdzie n c liczba klientów, którzy nie dokonali powtórnego zakupu, n liczba wszystkich klientów. Wydaje si, e rzeczywist skal zjawiska opisuje wska nik, w którym liczba wszystkich klientów w mianowniku dotyczy pocz tku analizowanego okresu. Warto doda, e mened erowie firm dla uzyskania jak najlepszych warto ci wska nika cz sto preferuj tzw. wska nik odej netto, w którym uwzgl dniane s równie nowe osoby, zasilaj ce baz klientów firmy w analizowanym okresie. Nale y pami ta, e zjawisko odchodzenia klientów w specyficznych przypadkach nie musi by niekorzystne, podobnie jak utrzymywanie klientów nie zawsze jest opłacalne. Oczywi cie w zale no ci od polityki budowania lojalno ci w danej organizacji mo na podejmowa działania zmierzaj ce do zmiany klienta, którego nie warto utrzymywa, w takiego, który stanie si klientem warto ciowym i rentownym. Mo na zauwa y, i rezygnacja jest problemem niezwykle zło onym. Dlatego powszechne jest sformułowanie zarz dzanie churnem, okre laj ce zestaw działa zwi zanych z utrzymywaniem klientów i przeciwdziałaniem ich rezygnacjom. Przykładow struktur procesu zarz dzania rezygnacjami zaprezentowano na rys. 1. W bazie danych pokazanej na tym rysunku przechowywane s m.in. dane z biura obsługi klienta, dane dot. faktur i wykonanych operacji, dane benchmarkowe czy te dane z przeprowadzonych bada klientów dot. poziomu deklarowanej przez nich satysfakcji. Na ich podstawie nast puje identyfikacja potencjalnych odchodz cych oraz obliczanie yciowej warto ci klientów, co z kolei wykorzystywane jest do ich klasyfikacji. Klienci nierentowni powinni by sprawdzani pod k tem mo liwo ci ich transformacji w klientów rentownych. Je li oka e si to niemo liwe, firma prawdopodobnie powinna rozwa y rezygnacj z nich i uzna za kandydatów do odej cia przymusowego. Klienci rentowni lub maj cy chocia odpowiedni potencjał w tej kwestii zasługuj natomiast na wysiłki firmy zmierzaj ce do ich utrzymania. Efekty tych wysiłków, podobnie jak wyniki analiz bazy, wykorzystywane s do przewidywania mo liwych zachowa klientów. To z kolei mo e pozwoli na udoskonalenie całego procesu i prób eliminacji niektórych przyczyn rezygnacji. Warto prócz tego zauwa y, e

116 Piotr Sulikowski, Ryszard Budzi ski Metoda klasyfikacji klientów operatora telefonii komórkowej w analizie zjawiska rezygnacji wspomniana wcze niej identyfikacja potencjalnych odchodz cych, której w głównej mierze dotyczy niniejszy artykuł, znajduje si w centralnym miejscu opisywanego procesu [4]. baza danych kandydaci do odej cia przymusowego klienci nierentowni transformacja w klienta rentownego eliminacja przyczyn churnu identyfikacja potencjalnych odchodz cych obliczanie LTV klienta klienci rentowni predykcja przyszłych zachowa tworzenie i realizacja strategii utrzymania ródło: opracowanie własne na podst. [4] 3. Problem identyfikacji rezygnuj cych Rys. 1. Proces zarz dzania churnem Mo na zatem powiedzie, e kluczowym elementem zarz dzania churnem jest identyfikacja rezygnuj cych. Cho przewa nie trudno zbada, co dokładnie jest przyczyn odej cia konkretnego klienta, niezwykle wskazane byłoby, eby operator potrafił zidentyfikowa sytuacj wysokiego ryzyka, w której abonent zaczyna zastanawia si nad odej ciem lub te jest wysokie prawdopodobie stwo, i przestanie wywi zywa si z płatno ci, co b dzie skutkowa jego odł czeniem. W obu przypadkach, gdyby operator potrafił przewidzie takie sytuacje, mógłby spróbowa zapobiec odej ciom i maksymalizowa swój zysk aktualny, jak i przyszły. Przykładowo mo e zaproponowa specjaln ofert lojalno ciow (w pierwszym przypadku) czy te zasugerowa przej cie z systemu abonamentowego na bezabonamentowy (w drugim przypadku). Sygnałem wskazuj cym na ryzyko rezygnacji klienta z usług mo e by np. kontakt z działem obsługi klienta, gdzie u ytkownik sieci dowiaduje si o skutki przedwczesnego zerwania umowy lojalno ciowej. Innym niepokoj cym sygnałem mo e by zmiana zachowania u ytkownika sieci

POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 16, 2008 117 dot. np. czasu trwania rozmów, wysoko ci opłat za poł czenia, docelowych numerów poł cze czy odległo ci pomi dzy rozmówcami [10]. Dla celów identyfikacji potencjalnych rezygnuj cych mo na zatem bada cechy i zachowania klientów. Badanie takie słu y mo e odkrywaniu reguł rz dz cych zjawiskiem odej pomocne s tu metody eksploracji danych [ang. data mining] i odkrywania wiedzy w bazach danych KDD [ang. Knowledge Discovery in Databases]. Według definicji wiod cej agencji badawczokonsultingowej Gartner eksploracja danych to proces odkrywania znacz cych powi za, wzorców lub tendencji poprzez dokładne badanie du ych ilo ci danych przechowywanych w repozytoriach. Data mining wykorzystuje techniki rozpoznawania wzorców, jak te metody statystyczne i matematyczne [11, tłum. własne]. Eksploracja jest nazywana tak e zgł bianiem, dr eniem, ekstrakcj lub wydobywaniem danych2. Jednym z mo liwych podej do eksploracji danych i odkrywania wiedzy w analizie rezygnacji jest to wykorzystuj ce teori zbiorów przybli onych. Godn odnotowania ciekawostk jest, e sam twórca wspomnianej teorii, czyli Z. Pawlak, w [12] omawia metod jej wykorzystania na przykładzie wła nie odej klientów w telekomunikacji, co mo na w pewnym sensie uzna za fakt znamienny. W analizach opartych na tej teorii zazwyczaj uwzgl dnia si dane za jeden wybrany okres lub te jednakowo traktuje si dane z ró nych okresów. Ewentualnie te same czynniki dla ró nych okresów traktuje si jako de facto ró ne czynniki. Pewn wad tych podej jest to, e albo w niewystarczaj cy sposób uwzgl dniaj uwarunkowania czasowe gromadzonych danych, albo te nie pozwalaj ró nicowa danych pochodz cych z ró nych okresów w czytelny sposób. Wydaje si, e czas, jak wiadomo ma bardzo istotne znaczenie dla postrzegania rzeczywisto ci [13] i dobrze byłoby móc uwzgl dnia jego znaczenie w prowadzonych analizach. 4. Procedura analityczna Opisywana dalej procedura badawcza została wypracowana przez autora dla celu predykcji rezygnacji klientów, a tak e poznania reguł dot. cech i zachowa klientów w kontek cie tego zjawiska. Jej wst pny zarys przedstawiono wcze niej m.in. w [14]. Nale y zaznaczy, e proponowana procedura, w zgodzie z zało eniami popularnej metodologii CRISP-DM [ang. Cross-Industry Standard Process for Data Mining], pozwala na interwencj analityka na ka dym z etapów, a tak e powrót do faz wcze niejszych, tak aby uzyska jak najlepsze wyniki. Co wa ne, w opisywanej procedurze autor zakłada wykorzystanie danych z n okresów t i (i={- n+1,..., 0}): ostatniego okresu poddawanego analizie (t 0 ), ale tak e dodatkowo okresów wcze niejszych (t -1, t -2 itd.), ró nicuj c ich wpływ na tworzony regułowy model. Etapy tej procedury prezentuj si nast puj co: 1. Okre lenie zało e i przygotowanie danych. 2. Przegl dowa analiza danych. 3. Segmentacja klientów. 4. Analiza korelacji. 5. Badanie współliniowo ci. 6. Regresja logistyczna z metod wyboru krokowego. 7. Odkrywanie reguł z uwzgl dnieniem uwarunkowa czasowych. 2 Autorowi wydaje si, e dwa ostatnie okre lenia nie s jednak najbardziej trafne, gdy mog sugerowa zwykłe pobieranie danych z bazy, a nie ich twórcz analiz.

118 Piotr Sulikowski, Ryszard Budzi ski Metoda klasyfikacji klientów operatora telefonii komórkowej w analizie zjawiska rezygnacji Na pocz tku pierwszego etapu nale y przede wszystkim ustali, jaki dokładnie rodzaj rezygnacji podlega b dzie analizom i jak definiowane b dzie zdarzenie odej cia. Ponadto trzeba zdecydowa, co b dzie jednostk analiz czy b dzie to pojedyncza karta SIM czy te ka dy klient, który to mo e mie wi cej aktywnych kart i telefonów. Mo na na przykład przyj, e analizowane b d karty SIM aktywne na pocz tku okresu i na podstawie statusu ich aktywno ci na koniec badanego okresu warto zmiennej zale nej przyjmowa b dzie warto 0 (gdy karta nie pozostaje aktywna, czyli klient rezygnuje) lub 1 (w przeciwnym wypadku). Zakłada si, e badane s przynajmniej 2 kolejne równe co długo ci okresy z przeszło ci (czyli t 0, t -1 ), poprzedzaj ce pewien okre lony moment czasu. Ze wzgl du na charakter analizowanego zjawiska wydaje si logiczne, e zachowania klientów w ostatnim okresie (t 0 ) powinny by najbardziej istotne dla odkrywania reguł, które rz dz churnem i wykrywania zmiennych z nim powi zanych. W zwi zku z tym przyjmuje si, e okres t 0 ma zatem charakter priorytetowy i w pewnym sensie nadrz dny w stosunku do wszystkich okresów wcze niejszych. Ze wzgl du m.in. na cykl zmian ofertowych w sieciach komórkowych, proponuje si rozpatrywanie okresów półrocznych lub trzymiesi cznych. W ramach ka dego z analizowanych okresów t i uwzgl dniana b dzie odpowiednia liczba miesi cznych okresów rozliczeniowych (billingowych). Jeden z nich uznawany jest za miesi c bazowy, wzgl dem którego prowadzone s pewne obliczenia dynamiki itp., i po którym dla danego klienta nie uwzgl dnia si ju kolejnych miesi cy. Dla klientów nierezygnuj cych jako miesi c bazowy mo na przyjmowa ostatni z miesi cy ka dego z analizowanych okresów. Dla klientów rezygnuj cych lepiej jednak przyjmowa miesi c wcze niejszy, tzn. taki, w którym proces decyzyjny klienta dot. odej cia jeszcze si nie zako czył. Nale y uwzgl dni tak e pewne uwarunkowania techniczne operatora, gdy cz sto zdarza si, e po odej ciu klienta przez pewien czas, np. 2 miesi ce, figuruje on jako obiekt aktywny w systemie billingowym. Tak sytuacj nale ałoby zidentyfikowa, aby wła ciwie okre li bazowy miesi c rozliczeniowy. Z drugiej strony oczywi cie trzeba uwa a, aby nie si ga zbyt daleko wstecz dla danego okresu t i, gdy mo na natrafi na czas kiedy klient nie my lał jeszcze o rezygnacji. Przydatna jest tu oczywi cie pewna wiedza dziedzinowa. Na tym etapie poza tym warto popracowa nad dobrym zrozumieniem danych ródłowych i ich reprezentacj docelow. Z tego wzgl du bardzo cz sto jest to etap najbardziej pracoi czasochłonny; wymaga du ej wiedzy dot. zarówno modelowania, jak i wiedzy dziedzinowej. W du ej mierze od wła ciwego przygotowania danych zale e mo e ostateczna u yteczno opracowywanego modelu. Na kolejnym etapie procedury dokonuje si przegl dowej analizy danych, zwłaszcza dla okresu uznawanego za priorytetowy, czyli t 0. Dobrze jest np. dokładnie rozpozna typy cech, okre lanych przez zmienne w badanym zbiorze. W ramach przegl dowej analizy danych dobrze jest dokona syntetycznego opisu statystycznego badanej zbiorowo ci, przeanalizowa rozkłady empiryczne zmiennych, czy te zwróci uwag na to, jakie ewentualne czynniki badanego zjawiska nie zostały uwzgl dnione w posiadanym zbiorze danych. W nast pnym kroku wskazana jest segmentacja klientów na tzw. grupy wzgl dnie jednorodne. Trudno bowiem przyj, e identyczne reguły rz dz zachowaniami klientów np. abonamentowych i bezabonamentowych, czy te indywidualnych i biznesowych. Pewne wzgl dnie homogeniczne grupy przez samych operatorów nawet traktowane s zazwyczaj w ró ny sposób, co wpisuje si

POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 16, 2008 119 zreszt w popularn strategi tzw. działa zró nicowanych, okre lan jako tworzenie odr bnych strategii marketingowych dostosowanych dla potrzeb i oczekiwa ró nych grup klientów [15]. Ró nice mi dzy poszczególnymi grupami dotyczy mog tak e zakresu zmiennych, jakimi opisa mo na klientów. Je eli analityk uzna to za celowe, mo na pokusi si o jeszcze dalej id c segmentacj, np. w oparciu o tzw. taksonomi rozmyt. Sugeruje si, aby nast pne etapy procedury realizowa osobno dla ka dej z grup. Analiza korelacji przeprowadzana jest w kolejnym etapie. Stosuje si ró nego rodzaju miary korelacji. Nale y jednak pami ta, e nie ka d miar da si zastosowa dla ka dego typu zmiennych. Dobrze te, gdy wybrane współczynniki korelacji lub ich pochodne s mi dzy sob porównywalne, tak e mo na próbowa uszeregowa potencjalne predyktory według ich wpływu na zmienn zale n. Warto stosowa tzw. grup miar typu PRE [ang. Proportion/Percentage Reduction in Error], które s na poziomie ilorazowym, co pozwala podejmowa próby wnioskowania nt. wzgl dnej wa no ci poszczególnych zmiennych obja niaj cych. Poniewa wst pny model badanego zjawiska tworzony b dzie przy pomocy regresji logistycznej, pewien problem stanowi współliniowo [ang. collinearity], która wyst puje, kiedy mo na zaobserwowa silne zwi zki liniowe pomi dzy zmiennymi obja niaj cymi. Je li pewne zmienne s silnie współliniowe, trudno uzyska dobre oszacowanie ich wpływu na zmienn obja nian. Je eli pewna zmienna obja niaj ca b dzie mocno powi zana z inn zmienn obja niaj c, a nie b dzie mocno zwi zana ze zmienn zale n, przyjmuje si, e wówczas jedna z pary zmiennych niezale nych b dzie wył czona z analizy regresji. Gdy jednak nie para zmiennych jest silnie skorelowana, lecz w zale no ci mi dzy sob uwikłanych jest wiele zmiennych, opisane podej cie mo e nie by wystarczaj ce. Warto wówczas skorzysta z odpowiednich statystyk diagnozuj cych tzw. wielowspółliniowo [ang. multicollinearity]: tolerancji i czynnika inflacji wariancji VIF [ang. Variance Inflation Factor]. Do wst pnego modelowania badanego zjawiska na podstawie danych z okresu t 0 proponuje si zastosowa metod wielokrotnej binarnej regresji logistycznej, metody bardzo popularnej i ch tnie stosowanej w badaniach marketingowych. Poniewa pod uwag brane s obserwacje nt. ró nych klientów z tylko jednego okresu, mo na przyj, e zało enie o niezale no ci obserwacji jest tu spełnione. Na tym etapie procedury dokonuje si równie wyboru zmiennych do ko cowego modelu. Mniejsza liczba zmiennych ułatwia badaczowi obj cie umysłem zale no ci opisywanych przez model. Trzeba tak e pami ta, e ka da kolejna zmienna w równaniu regresji powodowa mo e wzrost oczekiwanych bł dów predykcji. Do wyboru zmiennych do modelu proponuje si wykorzystywa tzw. metod wyboru krokowego stepwise z poziomem istotno ci dla wej cia =0,16 [16] i poziomem istotno ci dla wyj cia =0,10. Ponadto wydaje si, e wskazane jest, aby analityk dysponował odpowiedni wiedz teoretyczn lub t wynikaj c z wcze niejszych do wiadcze dot. analizowanego zjawiska. Dzi ki temu mógłby korygowa ewentualne wnioski wynikaj ce z samych danych, w tym list uwzgl dnianych w ko cowym modelu zmiennych. W ko cu generowany jest regułowy model badanego zjawiska uwzgl dniaj cy i ró nicuj cy dane pochodz ce z ró nych okresów z przeszło ci. Do odkrywania reguł metod zbiorów przybli onych proponuje si wykorzystywa prób zrównowa on, tj. o równej lub zbli onej liczbie obiektów nale cych do ka dej z dwóch klas zmiennej decyzyjnej, czyli klientów pozostaj cych i rezygnuj cych. Odpowiednio du e próby losowe powinny zosta wygenerowane dla ka dego z okresów t i.

120 Piotr Sulikowski, Ryszard Budzi ski Metoda klasyfikacji klientów operatora telefonii komórkowej w analizie zjawiska rezygnacji Proponuje si uwzgl dnia tylko te zmienne obja niaj ce, które dobrano w poprzednich etapach i bez konieczno ci dalszego redukowania zbioru atrybutów. Sugeruje si podział tabeli informacyjnej dla okresu t 0 w stosunku 2:1 na cz ucz c (2m obiektów) i cz testow (m obiektów). Dodatkowo dla okresu t 0 proponuje si spo ród pozostałych obiektów w zbiorze wylosowa m przykładów o proporcjach przynale no ci do poszczególnych konceptów decyzyjnych odpowiadaj cych rzeczywisto ci (próba nie zrównowa ona). Dla wcze niejszych okresów t i losuje si zrównowa one próby po 2m obiektów ka da. Nast pnie zdyskretyzowa nale y warto ci zmiennych, chyba e analizowany zbiór jest ju w pełni zdyskretyzowany, np. zawiera tylko zakodowane warto ci lingwistyczne. Przyjmuje si, e normy dyskretyzacji wyznaczane s na podstawie ostatniego okresu t 0, a nast pnie aplikuje si je dla okresów wcze niejszych. Mo na zdecydowa si na wybór kilku metod dyskretyzacji i porówna, jakie efekty przynosz dla badanego zbioru danych. Ze wzgl du na mo liwe zmiany dziel ce poszczególne okresy wydaje si, e nale y ró nicowa wpływ danych z poszczególnych okresów t i na odkrywan wiedz regułow. Realizacja tego postulatu w proponowanej metodzie odbywa si poprzez po rednie wpływanie na wsparcie odkrywanych reguł decyzyjnych. Przyjmuje si, e w analizowanym zbiorze obserwacje z okresu poprzedniego mog by ł czone ze zwielokrotnionymi obserwacjami z okresów nast pnych. Proces zwielokrotnienia autor nazywa dalej równie klonowaniem. Kwesti istotn dla wnioskowania jest tutaj ustalenie, jakie zmiany dziel poszczególne okresy w stosunku do nadrz dnego okresu t 0. Wprowadza si współczynnik klonowania cc [z ang. cloning coefficient]. Dla ka dego z analizowanych okresów t i współczynnik cc i ustalany jest przez eksperta dziedzinowego na podstawie zmian dziel cych okresy. Niech cc i C (i={-n+1,..., 0}przy n analizowanych okresów). W najprostszym przypadku, gdy analizie poddawane s tylko 2 okresy: t 0 oraz t -1, ekspert okre lałby, o ile wi kszy wpływ na generowane reguły miałyby mie zachowania klientów z ostatniego okresu w stosunku do okresu poprzedniego. Przykładowo, je eli cc 0 = 2, a cc -1 = 1, wówczas dane z ostatniego okresu uwa ane s za dwa razy bardziej istotne ni te z okresu poprzedniego. Dla wi kszej liczby badanych okresów t i ci g warto ci cc i mo e odzwierciedla zarówno liniowy jak i nieliniowy charakter zale no ci mi dzy kolejnymi okresami. Warto zauwa y, e ekspert mo e tak e wył cza wybrane okresy z analiz (np. ze wzgl du na zbyt du e zmiany, jakie je dziel w stosunku do t 0 ). Wówczas dla tych okresów t i okre li odpowiednie cc i = 0. Po przygotowaniu ko cowego zbioru dokonuje si indukcji reguł. Warto nast pnie przeanalizowa powstałe reguły pod k tem miar je opisuj cych, np. siły, pewno ci, pokrycia itp. Dla analityka zainteresowanego zrozumieniem badanego zjawiska szczególnie cenne mog by reguły o najwi kszej sile. Warto te rozwa a reguły nie w kategoriach deterministycznych, lecz probabilistycznych, przybli onych, tzn. uwzgl dnia reguły nie do ko ca pewne, ale pozwalaj ce przyporz dkowa analizowane obiekty z wi kszym prawdopodobie stwem do jednej klasy ni innej. 5. Podsumowanie Problem zjawiska rezygnacji jest niezwykle istotny dla funkcjonowania wielu firm. Szczególne miejsce zajmuj po ród nich operatorzy telefonii komórkowej. Umiej tno wskazania, którzy klienci mog planowa np. przej cie ze swoim numerem do operatora konkurencyjnego, zadecydowa mo e o przewadze konkurencyjnej operatora. Skuteczna klasyfikacja pozwala na przedsi wzi cie rodków zaradczych, które mog doprowadzi do utrzymania klienta, a co za tym

POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 16, 2008 121 idzie zapewni firmie trwałe zyski. Niew tpliwie jest to jedna z przyczyn, dla których zainteresowanie metodami eksploracji danych i odkrywaniem wiedzy w biznesie nieustannie ro nie. Zaproponowana procedura pozwala na zautomatyzowany wybór predyktorów i bogat mo liw interpretacj zwi zków mi dzy nimi a zmienn obja nian. Uwzgl dnianie czasu pozwala ró nicowa dane pochodz ce z ró nych okresów i w lepszy sposób czerpa z nich wiedz ni gdyby traktowane były one identycznie. Proponowane podej cie uwzgl dniaj ce dane z przeszło ci bardziej odległej ni okres t 0 nabiera ponadto szczególnego znaczenia dla analiz, w których dysponuje si przekrojowym zbiorem danych nt. pewnej stosunkowo niewielkiej liczby przykładów, ale z wielu okresów z przeszło ci. Wówczas ograniczanie si tylko do okresu ostatniego mo e nawet uniemo liwia odkrycie reguł, zwłaszcza przy odpowiednio du ej liczbie atrybutów. Z drugiej strony jednakowe traktowanie danych z ró nych okresów mo e zupełnie nie mie sensu, gdy ignorowałoby de facto poj cie czasu i zmian, jakie w nim zachodz. Co istotne, proponowana metoda pozwala tak e na interwencje eksperta i analityka niemal w ka dym momencie. Na zako czenie warto doda, e metod zastosowano do opracowania klasyfikacyjnego modelu rezygnacji klientów abonamentowych dla jednego z operatorów komórkowych. Uzyskane wyniki okazały si bardzo zadowalaj ce. Ze wzgl du na ograniczenie miejsca zostan one szczegółowo zaprezentowane w nast pnych planowanych publikacjach. Bibliografia 1. GSM World News Statistics [online]. GSM World Association, 2008-02-06 [dost p 21 maja 2008]. Dost pny w Internecie: < http://www.gsmworld.com /news/statistics/index.shtml>. 2. T. widerek: Aktywnych kart SIM jest o 7,5 mln mniej ni według GUS. W: Gazeta Prawna [online]. 2008-04-07 [dost p 21 maja 2008]. Dost pny w Internecie: <http://biznes.gazetaprawna.pl/artykuly/12942,aktywnych_kart_sim_jest_o_7_5_mln_mni ej_niz_wedlug_gus.html>. 3. Sulikowski P., Budzi ski R.: Zastosowanie teorii zbiorów przybli onych do definiowania reguł zachowania si klientów operatora telefonii komórkowej. W: Drelichowski L. (red.): Studia i materiały Polskiego Stowarzyszenia Zarz dzania Wiedz, t. 4. Bydgoszcz: PSZW, 2005, s. 193-204. 4. Strouse K.G.: Customer-Centered: Telecommunications Services Marketing. Norwood, MA: Artech House, 2004. 5. Dyché J.: CRM. Relacje z klientami. Gliwice: HELION, 2002. 6. Laboratory of Intelligent Decision Support Systems of the Poznan University of Technology: ROSE2 2.2 (build 25.02.2004) [online]. Pozna : Politechnika Pozna ska, 2004 [dost p 10 lutego 2008]. Dost pny w Internecie: <http://wwwidss.cs.put.poznan.pl/site/rose.html>. 7. Langford-Wood N., Salter B.: CRM in a week. London: Hodder & Stoughton, 2002. 8. Rudawska E.: Lojalno klientów. Warszawa: Polskie Wydawnictwo Ekonomiczne, 2005. 9. Sulikowski P.: Zastosowanie teorii zbiorów przybli onych w analizie lojalno ci jako element systemu zarz dzania relacjami z klientami (CRM). W: Kiełtyka L. (red.):

122 Piotr Sulikowski, Ryszard Budzi ski Metoda klasyfikacji klientów operatora telefonii komórkowej w analizie zjawiska rezygnacji Multimedia w biznesie i edukacji. Białystok: Fundacja Współczesne Zarz dzanie, 2005, t.ii, s. 60-66. 10. Todman Ch.: Projektowanie hurtowni danych. Zarz dzanie kontaktami z klientami (CRM). Warszawa: Wydawnictwa Naukowo-Techniczne, 2003. 11. The Gartner Glossary of Information Technology and Acronyms and Terms [online]. [Stamford, CT]: Gartner Inc., 2004 [dost p: 10 maja 2008]. Dost pny w Internecie: <http://www.gartner.com/6_help/glossary/gartner_it_glossary.pdf>. 12. Pawlak Z.: Rough set theory and its applications. Journal of Telecommunications and Information Technology 2002, Nr 3, s. 7-10. 13. Budzi ski R.: Komputerowy system przetwarzania danych ekonomiczno-finansowych w przedsi biorstwie. Warszawa-Szczecin: Wydawnictwo Naukowe Uniwersytetu Szczeci skiego, 2000, Seria Badania Systemowe, t.24, Instytut Bada Systemowych PAN. 14. Sulikowski P.: Mobile Operator Customer Classification in Churn Analysis. In: Proceedings of the SAS Global Forum 2008 Conference, 16-19.03.2008, San Antonio, Texas. SAS Institute Inc., Cary, NC, 2008, Paper 344-2008. 15. Drelichowski L.: Elementy teorii i praktyki zarz dzania z technikami informacyjnymi w przedsi biorstwie. Bydgoszcz: Wydawnictwa Uczelniane Akademii Techniczno- Rolniczej, 2000. 16. Shtatland E.S., Kleinman K., Cain E.M.: Stepwise Methods in Using SAS PROC LOGISTIC and SAS Enterprise Miner for Prediction. In: Proceedings of the 28th Annual SAS Users Group International Conference, Seattle, WA, March 30 April 2, 2003. Cary, NC: SAS Institute Inc, 2003, Paper 258-28.

POLSKIE STOWARZYSZENIE ZARZ DZANIA WIEDZ Seria: Studia i Materiały, nr 16, 2008 123 MOBILE OPERATOR CUSTOMER CLASSIFICATION METHOD IN CHURN ANALYSIS Summary Customer churn is a grave problem for all mobile operators. Early identification of potential churners could help retain them in the operator s network. A multistage research procedure is proposed. It allows the identification of significant churn factors and then the establishing of a classification model of the phenomenon for each customer segment. The method outlined in the paper relies on both qualitative and quantitative data as well as takes into account the element of time, which characterises data from different periods. Keywords: data mining, rough sets, churn, CRM, mobile telephony Piotr Sulikowski Katedra Systemów Informatycznych Zarz dzania Instytut Systemów Informatycznych Ryszard Budzi ski Dyrektor Instytutu Systemów Informatycznych Wydział Informatyki Politechniki Szczeci skiej Szczecin, ul. ołnierska 49 http://www.wi.ps.pl e-mail: psulikowski@wi.ps.pl e-mail: rbudzinski@wi.ps.pl http://www.wi.ps.pl