DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a
WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument, ma na celu omówienie krótkie omówienie możliwych do wykorzystania zastosowań Dataminingu. Należy zwrócić uwagę, że Data- mining może być wykorzystywany w bardzo różnorodny sposób i dokładne możliwości jego zastosowania pojawiają się zazwyczaj dopiero w procesie analizy biznesowej. Rysunek 1 Wróżenie za pomocą szklanej kuli- jedna z przestarzałych, ale nadal wykorzystywanych metod klasy knowledge discovery. Skuteczność nigdy nie została potwierdzona. W przeciwieństwie do Comarch Business Intelligence. 2 S t r o n a
DATA MINING Data mining jest jednym z wielu procesów klasy Knowledge Discovery (odkrywania wiedzy), do którego należy odpowiednie przygotowanie danych, ich czyszczenie, redukcja, i przeprowadzenie prognozowania. Modele i struktury data- miningowe powstałe w efekcie analizy biznesowej, będące częścią platformy analitycznej Comarch Business Intelligence, mogą mieć różnorodne zastosowanie w zależności od specyfiki działalności firmy. Dzięki zastosowaniu algorytmów predykcyjnych, na podstawie danych historycznych możliwe jest faktyczne spojrzenie w przyszłość danej organizacji i uzyskanie predykcji reakcji klientów na przykład na kampanie marketingowe, oszacowanie spłacalności kredytów, oszacowanie, wartości sprzedaży dla nowego produktu, w oparciu o historyczną sprzedaż innych podobnych produktów. Korzyści płynące z zastosowania modeli data- miningowych to przede wszystkim: Możliwość predykcji przyszłych wartości niektórych zmiennych Możliwość odkrycia ukrytych zależności pomiędzy danymi Szansa na przewidzenie niektórych zdarzeń przyszłych w oparciu o analizę zdarzeń podobnych Możliwość odnalezienia odpowiedzi na pytania, na które na co dzień musi odpowiadać firma, a na które nie można znaleźć odpowiedzi w standardowych sprawozdaniach i raportach. Rysunek 2 Prognozowanie sprzedaży paliwa na jednej ze stacji benzynowych 3 S t r o n a
STANDARDOWE ZASTOSOWANIA DATA MINING Credit Scoring- Dzięki zastosowaniu metod data miningowych możliwe jest dokonanie błyskawicznych analiz pozwalających na: Oszacowanie parametrów ryzyka kredytowego/ ryzyka spłaty należności Ocenę potencjalnej straty z tytułu niewykonania zobowiązań Ocenę wielkości długu w okresie zaniechania Prawdopodobieństwo zaniechania spłaty kredytu przez klienta. Dzięki zastosowaniu metod data- minigowych możliwe jest także utworzenie karty scoringowej, o lepszych parametrach oceny ryzyka niż metody eksperckie, modele generyczne, czy biura ratingowe. W trakcie budowy modeli data- mingowych, niezbędna jest identyfikacja czynników ryzyka, oraz wag dla każdego z czynników. Dzięki temu możliwe staje się szacowanie parametrów ryzyka kredytowego zgodnie z wymaganiami nowej umowy kapitałowej- czyli indywidualne szacowanie parametrów ryzyka kapitałowego. Przy zastosowaniu data miningu do umów kredytowych możliwe jest wykorzystanie scoringu aplikacyjnego (dla nowych klientów), oraz scoringu opartego o dane historyczne, dla klientów z danymi historycznymi. W związku z powyższym możliwa jest znacząca automatyzacja ścieżki rozpatrywania wniosków kredytowych, a co za tym idzie znaczące przyśpieszenie decyzji kredytowej. Fraud Identification- czyli wykrywanie nadużyć, to metoda data- miningowa pozwalająca na znaczącą poprawę wykrywalności przestępstw, na jakie narażone są instytucje finansowe. Poprzez identyfikację grup rachunków, o podwyższonym ryzyku, analizę danych historycznych i implementację algorytmów wykrywających potencjalne i rzeczywiste nadużycia. Fraud Identyfication, pozwala na wykrywanie nadużyć, przede wszystkim w obszarze kart płatniczych i kredytów. Dzięki zaimplementowaniu odpowiednich algorytmów i zaszyciu ich w modelach data- miningowych, możliwe jest odnalezienie pojedynczych przypadków nadużyć, poprzez statystyczną analizę całości zgromadzonych historycznych danych. Obszar CRM- to także pole dla popisu dla algorytmów data- miningowych. Poprzez dogłębną statystyczną, analizę zachowań klientów sklasyfikowanych według odpowiednich grup takich jak starz, wiek, miejsce zamieszkania, zarobki (dot. klientów indywidualnych), możliwa jest analiza i predykcja zachowań klientów wobec zastosowanych kampanii marketingowych i innych działań CRM. Pozwala to na: Identyfikację grupy docelowej dla kampanii marketingowej Określenie intensywności kampanii Predykcję zachowań klientów wobec kampanii marketingowej Oszacowanie opłacalności kampanii, na danej grupie docelowej(zwłaszcza dotyczy kampanii cyklicznych) Wypracowanie standardów kampanijnych dla wybranych segmentów klientów, na przykład w podziale na grupy wiekowe, staż, region zamieszkania. Określenie efektów kampanii w długim horyzoncie czasowym. 4 S t r o n a
Forecasting- ma zastosowanie do estymowania spodziewanego zużycia, przychodów ze sprzedaży, wzrostu, lub spadku ilości potrzebnego surowca, estymowania kosztów surowców. Forecasting jest możliwy przy wykorzystaniu trendów czasowych, metod analizy regresji. Możliwa jest także automatyczna identyfikacja cykli. Forecasting umożliwia, estymowanie zmiennych, nie tylko na podstawie danych historycznych, ale także na podstawie innych parametrów wprowadzanych przez użytkownika. 5 S t r o n a