Niepewność wartości parametrów przy wycenie nieproporcjonalnych kontraktów reasekuracyjnych. Ogólnopolska Konferencja Naukowa Zagadnienia Aktuarialne Teoria i Praktyka, Warszawa 9-11 czerwca 2008 Jakub Borowicz
Przegląd prezentacji Wstęp Niepewność wartości parametrów Umowa nadwyżki szkody (excess of loss) Model ryzyka łączonego do kalkulacji składki Niepewność wartości składki i jej rozkład Wyniki końcowe
Wstęp Do modeli aktuarialnych estymujemy parametry z ograniczonej liczby danych ponieważ często mamy zbyt mały odcinek czasu w którym je obserwujemy. Wahanie danych sprawia, że estymacja jest mniej pewna. Okres w którym zebraliśmy dane może nie zawierać wszystkich zdarzeń, które powinny być odzwierciedlone w parametrach rozkładów. Dane mogą być zanieczyszczone. Obserwowana populacja może różnić się od populacji którą ubezpieczamy.
Wstęp ( ) and therefore some prudence is expected to be included in the estimate in order to cover model and parameter uncertainties. [Solvency II QIS3 Technical Specifications, str 45.] ( ) parameters themselves may not be fixed and might follow their own distribution. Sophisticated ICAs will therefore include some allowance for parameter uncertainty. [Lloyds 2006 ICA Guidance and Instructions]
Niepewność Wartości Parametrów (NWP) Wygenerujmy losowo 2 próby z rozkładu Poissona z parametrem λ = 4: Średnia 3 1 5 5 2 3 8 7 4.25 5 6 5 8 5 0 7 2 4.75 Na podstawie tych prób: w pierwszym przypadku estymacja metodą największej wiarygodności dałaby: λ MLE = 4.25 w drugim: λ MLE = 4.75 Po wymiernej próbie nie jesteśmy w stanie oszacować prawdziwego parametru!
Szacowanie NWP Klasyczna Statystyka Asymptotyczna normalność estymatorów największej wiarygodności Bootstrapping Losujemy z powtórzeniami pseudo-próby z próby Do każdej pseudo-próby dopasowujemy parametry Statystyka Bayes owska Używając twierdzenia Bayes a do oszacowania rozkładu prawdopodobieństwa parametrów a posteriori mając dane i przekonania a priori.
Klasyczna Statystyka Asymptotyczny rozkład estymatorów największej wiarygodności: Niech n wtedy estymator dąży do wielowymiarowego rozkładu normalnego, z parametrami: Średnią θ I macierzą wariancji-kowariancji: 2 l E 2 θ W przypadku rozkładu Poissona, mamy: ˆ λ λ N λ, n θˆ 1
Bootstrapping Oryginalna Próba Średnia 3 1 5 5 2 3 8 7 4 5 4.3 Sim Bootstrapping Średnia 1 8 3 8 8 5 7 4 7 3 5 5.8 2 8 2 1 8 5 5 5 3 1 5 4.3........................ 10000 1 5 4 8 5 2 5 7 2 5 4.4
Statystyka Bayes owska (1/2) Używając twierdzenia Bayes a, mając do dyspozycji dane i rozkład prawdopodobieństwa parametrów a priori wyznaczamy rozkład a posteriori: p( y θ ) p( θ ) p( θ y) = p y ( ) ( ) Skoro p y θ jest zwykłą funkcją wiarygodności a jest stałą, możemy zapisać rozkład a posteriori, jako: p( y ) co oznacza: ( θ ) ( θ) ( θ) p y p y p rozkład a posteriori wiarygodność rozkład a priori
Statystyka Bayes owska (2/2) Mając dany rozkład jednostajny a priori poprzednie równanie skraca się do: ( θ ) ( θ ) p y p y p ( θ ) = cst Dla rozkładu Poissona, można udowodnić, że: ( λ ) p y Gamma Gdzie: 1 E[ λ y] = yi + 1 n i 1 Var ( λ y ) = y + 1 2 i n i
Umowa nadwyżki szkody (1/3) Reasekuracja nieproporcjonalna Podział zobowiązań następuje w odniesieniu do wysokości ewentualnych roszczeń Reasekurator pokrywa określony przedział wielkości szkód: przerastający zachowek cedenta czyli udział własny zakładu ubezpieczeń aż do wysokości limitu pokrycia reasekuracyjnego czyli pojemności
Umowa nadwyżki szkody (2/3) Istnieją dwie formy pokrycia: nadwyżki liczonej w stosunku do ryzyka nadwyżki liczonej w stosunku do zdarzenia Z góry też ustalane są dodatkowe warunki: franczyza zagregowana (aggregate deductible) nieograniczona liczba wznowień (unlimited reinstatements) lub liczba wznowień płatnych / bezpłatnych
Umowa nadwyżki szkody (3/3) Wysokość szkody w tys. Przykład : (1M xs 1M) z nieograniczona liczba wznowień 2 250 2 000 1 800 1 600 1 400 limit pokrycia pojemność = 1 000 1 000 625 zachowek cedenta = 1 000 1 2 3 4 Szkody
Umowa nadwyżki szkody (3/3) Wysokość szkody w tys. Przykład : (1M xs 1M) z nieograniczona liczba wznowień i franczyza zagregowana 1M 2 250 2 000 1 800 1 600 1 400 limit pokrycia pojemność = 1 000 1 000 625 zachowek cedenta = 1 000 1 2 3 4 Szkody
Umowa nadwyżki szkody (3/3) Wysokość szkody w tys. Przykład : (1M xs 1M) z 1 wznowieniem bezpłatnym 2 250 2 000 1 800 1 600 1 400 limit pokrycia pojemność = 1 000 1 000 625 zachowek cedenta = 1 000 1 2 3 4 Szkody
Jak wyliczyć składkę (1/3) Metody Exposure Rating benczmarki współczynniki increased limits ISO Metody Experience Rating metody burning cost model ryzyka łączonego Połączenie obydwu metod i opinii underwriterów
Jak wyliczyć składkę (2/3) Rok Liczba Szkody powyżej 500tys. (wartość ostateczna*) w tys. 1998 1999 2000 Brak danych 2001 2002 2003 1 505 2004 7 616 574 800 989 553 763 1 025 2005 3 647 782 3 161 2006 4 653 1 314 666 997 2007 5 588 804 543 833 564 * Zakładamy że szkody zawierają IBNER i wyrażone są (uwzględniając inflację szkodowości) w dzisiejszej skali pieniądza. W dalszym przykładzie nie bierzemy pod uwagę IBNR ow
Jak wyliczyć składkę (2/3) Rok Liczba Szkody powyżej 500tys. (wartość ostateczna) w tys. 1998 1999 2000 Brak danych 2001 2002 2003 1 2004 7 25 2005 3 1 000 2006 4 314 2007 5 Składka nieobciążona (1M xs 1M) z nieograniczonymi wznowieniami metoda burning cost = 25 + 1 000 + 314 1 339 = = 267,8 5 5
Jak wyliczyć składkę (3/3) Metoda burning cost może zaniżyć cenę umowy reasekuracyjnej kiedy mamy malo danych co zrobić jeśli żadna z historycznych szkód nie przekroczyła franczyzy? Kalkulacja składki przy użyciu modelu ryzyka łączonego : daje więcej możliwości (możemy wyliczyć cenę warstwy umowy reasekuracyjnej która historycznie nie została użyta) trzeba też wziąć pod uwagę, że mamy do czynienia z ograniczoną ilością danych - oszacowanie niepewności wartości parametrów pozwoli nam na formalne oszacowanie błędu naszej wyceny
Model ryzyka łączonego (1/3) Model gdzie szkoda zagregowana (S), modelowana jest jako suma N dużych indywidualnych szkód (X i ) : = N S X i = 1 i X i są od siebie niezależne i są niezależne od N Dla przykładu wybieramy bardzo klasyczne rozkłady: X i ~ uogólniony rozkład Pareto (GPD) N ~ rozkład Poissona σ FX i x x ξ ( ) = 1 1+ ( τ ) 1 ξ σ parametr skali ξ parametr ksztaltu τ prog
Model ryzyka łączonego (2/3) Jeśli mamy Poisson/GPD dla pewnego τ, N = 3 N = 4 N = 0 N = 2
Model ryzyka łączonego (2/3) Jeśli mamy Poisson/GPD dla pewnego τ, to podwyższając τ mamy dalej Poisson/GPD N = 3 N = 4 N = 0 N = 2
Model ryzyka łączonego (3/3) Jeśli mamy Poisson/GPD dla pewnego τ, to podwyższając τ mamy dalej Poisson/GPD (z innymi parametrami) N = 1 N = 4 N = 0 N = 2
Model ryzyka łączonego (3/3) Estymacja metoda największej wiarygodności dla naszego przykładu : Rok Liczba Odszkodowania powyżej 500tys (wartość ostateczna) w tys. 1998 1999 2000 Brak danych! 2001 2002 2003 1 505 2004 7 616 574 800 989 553 763 1 025 2005 3 647 782 3 161 2006 4 653 1 314 666 997 2007 5 588 804 543 833 564
Model ryzyka łączonego (3/3) Estymacja metoda największej wiarygodności dla naszego przykładu : Mając te Rok Liczba Częstość: parametry 1998 składka za 1999 ˆ 20 λ (1M xs 1M) MLE = x = = 4 2000 5 2001 da się Parametry GPD: 2002 policzyć 2003 1 analitycznie 2004 7 2005 3 2006 4 2007 5 ˆ σ ˆ ξ MLE MLE τ = = 250,8 = 0,3107 500 Składka nieobciążona P = 358
Model ryzyka łączonego (3/3) Estymacja metoda największej wiarygodności dla innego przykładu : Rok Liczba Szkody powyżej 500tys. (wartość ostateczna) w tys. 1998 1999 2000 Brak danych 2001 2002 2003 1 505 2004 7 616 574 800 989 553 763 1 025 2005 3 647 782 3 161 2006 4 653 1 314 666 997 2007 5 588 804 543 833 564
Model ryzyka łączonego (3/3) Estymacja metoda największej wiarygodności dla innego przykładu : Rok Liczba Szkody powyżej 500tys. (wartość ostateczna) w tys. 1998 3 1 312 746 763 1999 7 988 568 1 190 657 544 640 572 2000 1 975 2001 5 2 374 728 501 502 1 183 2002 4 609 595 1 118 503 2003 1 505 2004 7 616 574 800 989 553 763 1 025 2005 3 647 782 3 161 2006 4 653 1 314 666 997 2007 5 588 804 543 833 564
Model ryzyka łączonego (3/3) Estymacja metoda największej wiarygodności dla innego przykładu : Ten przykład Rok Liczba Częstość: daje prawie 1998 3 ˆ 40 takie same 1999 7 λ MLE = x = = 4 10 parametry 2000 1 2001 5 2002 4 2003 1 2004 7 2005 3 2006 4 2007 5 Parametry GPD: ˆ σ ˆ ξ MLE MLE τ = = 250,9 = 0,3108 500 Nowa składka: P = 359 Dla przypomnienia poprzednia: P = 358
Model ryzyka łączonego (3/3) Obydwie próbki dopasowują się do tego samego GPD:
Statystyka Bayes owska (3/3) Za zwyczaj, rozkład prawdopodobieństwa parametrów a posteriori p(θ y) jest niestandardowym (wielowymiarowym) rozkładem Generalised Pareto Distribution: Do oszacowania tego rozkładu używamy łańcuchów markowa Monte Carlo (MCMC) i algorytmów losujących: Adaptive Rejection Sampling (ARS) Adaptive Rejection Metropolis Sampling (ARMS) Random Walk Metropolis Gibbs Sampling ξ σ p y Π1 = yi i n ( σξτ,, ) σ 1+ ( τ) n 1 + 1 ξ
Przykład
Statystyka Bayes owska (3/3)
Przykład W obydwu przypadkach, wyliczyliśmy składkę: P 358 Przedział ufności 90% dla składki 20 : [250 ; 680] Przedział ufności 90% dla składki 40 : [ 265 ; 564]
Jak uwzględnić NWP przy kalkulacji składki Możliwość 1: Użyć rozkładu prawdopodobieństwa składki (maksimum wiarygodności) użyć na przykład mediany: Składka 900 800 700 600 500 Malejący przedział ufnosci wraz z wzrostem liczby danych Składka 20: P = 494 Składka 40: P = 405 400 300 200 0 20 40 60 80 100 120 140 160 180 200 220 240 Liczba danych do szacowania składki
3 5 0 3 0 0 2 5 0 2 0 0 1 5 0 1 0 0 5 0 0 3 5 0 3 0 0 2 5 0 2 0 0 1 5 0 1 0 0 5 0 0 D e n s i t y : A g g r e g a t e L o s s e s 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0 2 2 0 2 4 0 2 6 0 2 8 0 D e n s i t y : A g Rg a r ne g ge a t e L o s s e s 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0 2 2 0 2 4 0 2 6 0 2 8 0 R a n g e 350 300 250 200 150 100 50 0 400 350 300 250 200 150 100 50 0 0 50 100 150 200 250 300 350 Range 0 50 100 150 200 250 300 350 R a n g e Jak uwzględnić NWP przy kalkulacji składki Możliwość 2: Policzyć składkę używając rozkładu oryginalnych szkód uwzględniających NWP Nie biorąc pod uwagę NWP D ensity: Aggregate Losses Dane historyczne θ 1 θ 2 Density Biorąc pod uwagę NWP D ensity: Aggregate Losses Dane historyczne Density Density Density
Jak uwzględnić NWP przy kalkulacji składki Jak generować symulacje z NWP: 1. Wylosować lambdę 2. używając tej lambdy wylosować liczbę szkód z rozkłądu Poisson(Lambda) 3. Wylosować skalę i kształt 4. Dla każdej szkody używając parametrów z (3.) losujemy GPD(Scale,Shape) Symulacja 1 2 Parametr Lambda 4,132 3,234 Liczba szkód 5 2 Parametr skali 0,23 0,43 Parametr kształtu 0,45 0,44 Skoda 1 2343 503 Skoda 2 553 666 Skoda 3 1234 Skoda 4 697 Skoda 5 1112 Skoda 6 Suma szkód 5939 1169
Jak uwzględnić NWP przy kalkulacji składki 4000 3500 3000 2500 2000 1500 Rozkład szkód do umowy (1 xs 1) Składka bez NWP: P = 358 Składka 20: P = 563 1000 500 0 0% 20% 40% 60% 80% 100% Składka 40: P = 458 Szkody bez NWP Szkody 40 Szkody 20
Wyniki końcowe Posługując się technikami Bayes owskimi można bardzo formalnie oddać NWP Uwzględnienie NWP w wycenie programów reasekuracyjnych wpływa na nieobciążoną składkę w zależności od ilości danych. Niepewność wartości parametrów jest ważnym czynnikiem do rozpatrzenia przy modelizacji stochastycznej (nie tylko modelowaniu dużych szkód, ale też ryzyka rezerw, i innych)
Dziękuję