Wykorzystanie informacji kredytowej w procesie oceny ryzyka ubezpieczeniowego w ubezpieczeniach komunikacyjnych Ubezpieczeniowy Fundusz Gwarancyjny mgr Karolina Pasternak-Winiarska mgr Kamil Gala Zagadnienia Aktuarialne teoria i praktyka Warszawa, 22-24 września 2014 Ubezpieczeniowy Fundusz Gwarancyjny 1
Plan referatu 1. Ocena ryzyka w ubezpieczeniach komunikacyjnych 2. Wykorzystanie informacji kredytowej do oceny ryzyka w ubezpieczeniach komunikacyjnych 3. Aktuarialne metody taryfikacji a priori Metody tradycyjne Uogólnione modele liniowe Rozszerzenia 4. Badanie UFG BIK Cel badania i jego założenia Przygotowanie danych Eksploracja danych Omówienie wyników i wnioski 5. Podsumowanie 6. Literatura Ubezpieczeniowy Fundusz Gwarancyjny 2
Ocena ryzyka w ubezpieczeniach komunikacyjnych Kalkulacja składki Taryfikacja a priori i taryfikacja a posteriori Niejednorodny portfel klientów Grupy taryfowe a priori Ubezpieczeniowy Fundusz Gwarancyjny 3
Wykorzystanie informacji kredytowej do oceny ryzyka w ubezpieczeniach komunikacyjnych Czy istnieje korelacja między historią kredytową ubezpieczonego a jego szkodowością? Czy taka korelacja nie jest pozorna? Czy można wskazać związki przyczynowo-skutkowe między zjawiskami kredytowymi i ubezpieczeniowymi? Jeśli tak, to które informacje kredytowe wskazują na zwiększony lub zmniejszony potencjał szkodowy ubezpieczonego i jakie jest ich znaczenie w porównaniu do pozostałych danych dostępnych ubezpieczycielowi? Jakie są uwarunkowania i konsekwencje wykorzystania danych kredytowych do oceny ryzyka ubezpieczeniowego? Ubezpieczeniowy Fundusz Gwarancyjny 4
Aktuarialne metody taryfikacji a priori. Metody tradycyjne. Założenia: Zmienne taryfowe x i y o mx i my poziomach odpowiednio. x i i y j - stawki składki dla i-tego poziomu zmiennej x oraz j-tego poziomu zmiennej y w ij - ekspozycja na ryzyko umów ubezpieczenia znajdujących się w grupie wyznaczonej przez kombinację poziomów i oraz j zmiennych taryfowych x i y r ij - statystyka szkodowa odpowiadająca tej grupie model multiplikatywny, tzn. dodatkowe warunki normalizujące np. x 1 = y 1 = 1 Ubezpieczeniowy Fundusz Gwarancyjny 5
Aktuarialne metody taryfikacji a priori. Metody tradycyjne. metody analizy jednokierunkowej metody oparte na tablicy kontyngencji Metoda Baileya-Simona Metoda sum brzegowych Metoda najmniejszych kwadratów Ubezpieczeniowy Fundusz Gwarancyjny 6
Aktuarialne metody taryfikacji a priori. Uogólnione modele liniowe. Zmienna zależna nie musi mieć rozkładu normalnego. Trzy podstawowe elementy: składnik losowy Jeżeli to składnik systematyczny Ubezpieczeniowy Fundusz Gwarancyjny 7
Aktuarialne metody taryfikacji a priori. Uogólnione modele liniowe. funkcja wiążąca (ang. link function) różniczkowalna, odwracalna Jeśli to - kanoniczna funkcja wiążąca. Parametry szacowane metodą MNW stosowanie formalnych metod wnioskowania statystycznego Przykładowo, dla funkcji wiążącej logarytmicznej mamy: Multiplikatywna taryfa składki. W badaniu UFG i BIK zastosowano składnik systematyczny postaci: Ubezpieczeniowy Fundusz Gwarancyjny 8
Badanie UFG - BIK. Cel badania i założenia. Cel: Sprawdzenie zdolności predykcyjnych zagregowanych danych statystycznych pochodzących z baz UFG i BIK, w zakresie ryzyka ubezpieczeniowego w obszarze ubezpieczeń komunikacyjnych. Hipoteza badawcza: Negatywna historia kredytowa klienta jest powiązania z wyższym ryzykiem po stronie ubezpieczyciela. Ubezpieczeniowy Fundusz Gwarancyjny 9
Badanie UFG - BIK. Cel badania i założenia. ubezpieczenia komunikacyjne AC oraz OC p.p.m., umowy ubezpieczenia zawarte przez osoby fizyczne, agregacja danych na poziomie: o kodu pocztowego, o miesiąca zawarcia umowy ubezpieczenia, o przedziału wiekowego, o płci (wymiary łączące), rodzaj umowy (OC/AC), okres obserwacji: dane dotyczące umów zawartych w kolejnych miesiącach w latach 2011-2012. Ubezpieczeniowy Fundusz Gwarancyjny 10
Badanie UFG - BIK. Cel badania i założenia. 1. Ryzyko związane z umową ubezpieczenia: Częstość zdarzeń = liczba zdarzeń ubezpieczeniowych zaszłych w okresie obowiązywania umowy ekspozycja na ryzyko (okres obowiązywania umowy w latach) 2. Modelowane prawdopodobieństwo: Pr(wystąpienie co najmniej 1 zdarzenia w okresie ochrony) 3. Stosowane modele: Liczba zdarzeń: regresja Poissona regresja ujemna dwumianowa Prawdopodobieństwo wystąpienia szkody: regresja logistyczna Ubezpieczeniowy Fundusz Gwarancyjny 11
Badanie UFG - BIK. Przygotowanie danych. Obszary informacyjne danych kredytowych BIK: poziom zadłużenia, nadmierne zadłużenie, obciążenia klienta, opóźnienia w spłacie, podejrzenie wyłudzenia, ocena punktowa. Obszary informacyjne danych ubezpieczeniowych UFG: dane o umowach ubezpieczenia i obciążających je szkodach, cechy demograficzne ubezpieczonego (wiek i płeć), region zamieszkania ubezpieczonego, liczba szkód obciążających poprzednie umowy ubezpieczonego, informacja, czy ubezpieczony pojazd ma historię ubezpieczenia w bazie OI UFG. Ubezpieczeniowy Fundusz Gwarancyjny 12
Badanie UFG - BIK. Przygotowanie danych. 6,5 mln obserwacji agregacja względem wymiarów łączących: o połączenie niektórych grup wiekowych o agregacja kodów pocztowych: Według pierwszych 3 cyfr 14,5 tys. obserwacji Agregacja mieszana 18 tys. obserwacji estymacja parametrów zbiór uczący - umowy zawarte w 2011 roku, weryfikacja modelu zbiór walidacyjny - umowy zawarte w 2012 roku. Klienci bez historii ubezpieczenia a klienci z obszerną historią ubezpieczenia syntetyczny wskaźnik opisujący przeszłą szkodowość - predyktor credibility z modelu Bühlmanna-Strauba Ubezpieczeniowy Fundusz Gwarancyjny 13
Badanie UFG - BIK. Eksploracja danych. sprawdzenie rozkładów poszczególnych zmiennych analiza siły związku między zmiennymi objaśniającymi a modelowanymi wskaźnikami (współczynniki korelacji Pearsona, Kendalla i Spearmana). Rys. 1 Rozrzut punktów dla częstości zdarzeń OC i średniej sumy sald kredytów hipotecznych wraz z miarami korelacji Macierz korelacji dla zbioru uczącego i porównanie współczynników korelacji dla podprób z 2011 i 2012r. Dla większości zmiennych korelacja stabilna w czasie co do kierunku. Ubezpieczeniowy Fundusz Gwarancyjny 14
1. Dane zagregowane. Badanie UFG - BIK. Metodyka. Podział modeli analitycznych ze względu na: rodzaj umowy ubezpieczenia AC / OC, zmienną objaśnianą liczba zdarzeń / liczba umów szkodowych, rodzaj agregacji agregacja na 3 cyfrach kodu pocztowego / agregacja mieszana. Selekcja zmiennych objaśniających: opisowa, krokowa. Kryterium oceny zmiennych objaśniających: istotność statystyczna, wpływ na wartość bayesowskiego kryterium informacyjnego (BIC). Ubezpieczeniowy Fundusz Gwarancyjny 15
Wyniki i wnioski: Badanie UFG - BIK. Omówienie wyników i wnioski. zmienne kredytowe statystycznie istotne (większa liczba dla umów OC), większa rola w modelowaniu liczby zdarzeń niż w liczby umów szkodowych, dla większości zmiennych dot.: o wykorzystania limitów kredytowych, o udziału salda należności wymagalnych w sumie sald, o łącznej kwoty rat, o sumy sald bez kredytów mieszkaniowych znak parametru zgodny z hipotezą badawczą, znak przeciwny różne oddziaływanie zjawisk kredytowych na zjawiska ubezpieczeniowe brak jednoznacznej interpretacji. zmniejszenie błędu prognozy wynikające z uwzględnienia zmiennych kredytowych: do 10-15%. największa korzyść z wykorzystania danych kredytowych - częstość zdarzeń z umów OC (przy umowach AC efekt mniej zauważalny). Ubezpieczeniowy Fundusz Gwarancyjny 16
2. Dane indywidualne. Badanie UFG - BIK. Metodyka. Łączenie: kod pocztowy (według agregacji mieszanej), rok, wiek ubezpieczonego. Modele: liczba zdarzeń (regresja Poissona) prawdopodobieństwo wystąpienia zdarzenia szkodowego (regresja logistyczna). Selekcja zmiennych metodą krokową, analogicznie do analizy danych zagregowanych. W przypadku umów AC kryterium BIC zbyt restrykcyjne kryterium AIC. Ubezpieczeniowy Fundusz Gwarancyjny 17
Badanie UFG - BIK. Omówienie wyników i wnioski. zmienne kredytowe statystycznie istotne (większe znaczenie dla umów OC), najważniejsze zmienne dotyczą: o udziału sumy salda należności wymagalnych bez kredytów mieszkaniowych w sumie salda bez kredytów mieszkaniowych, o łącznej kwoty rat, o sumy sumę sald bez kredytów mieszkaniowych, a kierunek ich oddziaływania jest zgodny z hipotezą badawczą. odsetek klientów o niskiej ocenie punktowej znak przeciwny (np. wpływ sytuacji kredytowej na użytkowanie pojazdu lub korelacja oceny punktowej z wielkością miejscowości zamieszkania.) Dla zmiennych ubezpieczeniowych: duży wpływ historii szkodowej ubezpieczonego również dla danych indywidualnych. interakcja między wiekiem a płcią, rodzaj pojazdu, informacja, czy w bazie UFG występuje historia ubezpieczeniowa pojazdu lub podmiotu. Ubezpieczeniowy Fundusz Gwarancyjny 18
Badanie UFG - BIK. Podsumowanie. Najważniejsza z analizowanych zmiennych - liczba przeszłych zdarzeń ubezpieczeniowego. Zmienne kredytowe są statystycznie istotne w większości zbudowanych modeli. Wykorzystanie informacji kredytowej może poprawić dopasowanie modelu do danych oraz zmniejszyć błąd prognozy na zbiorze walidacyjnym. Najlepsze wyniki uzyskane zostały dla częstości zdarzeń dla umów OC p.p.m. na poziomie zagregowanym. Wpływ zmiennych kredytowych wydaje się większy w przypadku umów OC. Znak parametru przy niektórych zmiennych kredytowych nie jest zgodny z hipotezą badawczą. Wykorzystanie informacji kredytowej w taryfikacji może być w przyszłości interesującym kierunkiem działań ubezpieczycieli, przy czym należy wziąć pod uwagę również ograniczenia prawne i etyczne z tym związane. Ubezpieczeniowy Fundusz Gwarancyjny 19
Dziękujemy za uwagę! mgr Karolina Pasternak-Winiarska KPasternakWiniarska@ufg.pl mgr Kamil Gala KGala@ufg.pl Ubezpieczeniowy Fundusz Gwarancyjny 20
Literatura Bühlmann H., Gisler A. (2005), A Course In Credibility Theory and Its Applications, Springer. Denuit M., Maréchal X., Pitrebois S., Walhin J. (2007) - Actuarial Modelling of Claim Counts: Risk Classification, Credibility and Bonus-Malus Systems, John Wiley & Sons Ltd. Miller M., R. A. Smith (2003), "The Relationship of Credit-based Insurance Scores to Private Passenger Automobile Insurance Loss Propensity", Actuarial Study Monaghan, J. E. (2000), "The Impact of Personal Credit History on Loss Performance in Personal Lines", Casualty Actuary Society Forum-Winter: 79-19-05. Wu C.-S. P., Guszcza J.C. (2003), "Does Credit Score Really Explain Insurance Losses? Multivariate Analysis From a Data Mining Point of View", Proceedings of the Casualty Actuarial Society 113-138. Ubezpieczeniowy Fundusz Gwarancyjny 21