Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka
Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja parametrów rozkładu przy pomocy MNW i Pseudo-MNW Przykłady
Konstrukcja optymalnego systemu BM Mamy obserwacje dotyczące ilości szkód generowanych przez T lat przez N ubezpieczonych: X, X,..., X,..., X 1,1 1,2 1, T N, T Zakładamy, że X i,j dla różnych ubezpieczonych są niezależne i pochodzą z rozkładu Poissona z parametrem λ i,j, i, j x czyli: e λ λ ( ) i, j Pr Xi, j= x λ = x!
Konstrukcja systemu BM, c.d. Rozkłady ilości szkód różnią się między ubezpieczonymi wartością oczekiwaną ilości szkód (λ i,j ). Można przyjąć, że: λ = exp ( z β ) i, j i, j gdzie z i,j to wektor charakterystyk indywidualnych i-tego ubezpieczonego w j- tym okresie, zaś β to wektor parametrów do oszacowania.
Konstrukcja systemu BM, c.d. Wtedy ilość szkód będzie mieć rozkład Poissona o wartości oczekiwanej i wariancji równej λ i,j. Charakterystyki indywidualne zapewne nie w pełni wyjaśnią zróżnicowanie λ i,j w populacji.
Konstrukcja systemu BM, c.d. Często przyjmuje się następującą specyfikację modelu: ( z ) λ = exp β + ε i, j i, j i gdzie ε i to błąd wynikający z pominięcia nieobserwowalnych istotnych charakterystyk ubezpieczonego lub błąd czysto losowy.
Konstrukcja systemu BM, c.d. Jeżeli przyjmie się, że exp(ε i ) ma rozkład Gamma(α,1/α), wtedy bezwarunkowy rozkład ilości szkód to rozkład ujemny dwumianowy: ( ) ( ( ) ) x Γ x + α exp z ( ) i, jβ / α Pr Xi, j x zi, j x α ( α ) x β α + o wartości oczekiwanej i wariancji = = Γ! 1+ exp / Var x ( z ) i, j i, j ( ( z ) ) i, j = ( ) = exp( ) E x z z β i, j i, j i, j exp ( z ) i, jβ ( z β ) ( 1+ exp ) i, j / α
Konstrukcja systemu BM, c.d. Problem decyzyjny: L(λ,S(X 1,, X t )) strata, gdy λ jest prawdziwą wartością parametru, a przyjęta została wartość S(X 1,, X t ). R S (λ) funkcja ryzyka estymatora S: S ( ( )) 1 2 t ( ), (,,..., ) R λ = E L λ S X X X
Konstrukcja systemu BM, c.d. Cel: znalezienie estymatora S, dla którego ryzyko będzie najmniejsze. - z reguły nie jest możliwe zminimalizowanie ryzyka dla wszystkich wartości parametru λ jednocześnie.
Konstrukcja systemu BM, c.d. Ryzyko bayesowskie estymatora S dla gęstości a priori f(λ): ( ) ( ) ( ) R S = R f d S λ λ λ Poszukujemy estymatora, który zminimalizuje powyższą funkcję ryzyka.
Konstrukcja systemu BM, c.d. Przyjmując kwadratową funkcję straty R S (λ) oraz wykorzystując twierdzenie Bayesa, otrzyma się następującą postać składki netto: ( ) P f X X X d = λ λ λ,,..., 1 2 t gdzie f(λ X 1,, X t ) to funkcja gęstości a posteriori parametru λ.
Konstrukcja systemu BM, c.d. Optymalnym estymatorem częstości szkód w powyżej opisanym modelu w momencie t+1 jest: ˆ α + ( ) j= 1 i, j λit, + 1 = exp zit, + 1β t α + exp j= 1 i, j β t X ( z )
Estymacja parametrów α i β Jeżeli exp(ε i ) ma faktycznie rozkład Gamma(α,1/α), wtedy oszacowania α i β można uzyskać przy pomocy Metody Największej Wiarogodności. Takie estymatory są zgodne i asymptotycznie efektywne.
Estymacja parametrów, c.d. Jeżeli exp(ε i ) ma inny rozkład niż zakładany, otrzymane oszacowania mogą nie być zgodne. W takim przypadku lepiej posłużyć się estymatorami Pseudo-MNW.
Estymatory Pseudo-MNW Są to estymatory uzyskane przez maksymalizację funkcji wiarogodności opartej na rodzinie rozkładów, która nie musi zawierać prawdziwego rozkładu zmiennej zależnej. Gourieroux et al. [1] określają rodzinę funkcji pseudo-wiarogodności, dla których oszacowania uzyskane przez maksymalizację owej funkcji, są zgodne i asymptotycznie normalne.
Estymatory Pseudo-MNW Jeżeli funkcja pseudo-wiarogodności należy do liniowej rodziny wykładniczej, wtedy maksymalizując funkcję wiarogodności opartą o te rozkłady, otrzymamy zgodne estymatory pierwszych momentów prawdziwego rozkładu zmiennej zależnej.
Do liniowej rodziny wykładniczej należy np. rozkład Poissona, ujemny dwumianowy, normalny, Gamma. Czyli przy zastosowaniu MNW z funkcją gęstości rozkładu ujemnego dwumianowego powinniśmy uzyskać zgodne oszacowania wektora β.
Aby uzyskać przy pomocy Pseudo-MNW zgodne estymatory drugich momentów prawdziwego rozkładu, funkcja pseudo-wiarogodności musi należeć do kwadratowej rodziny wykładniczej. Gourieroux et al. [1] pokazują, że rozkład ujemny dwumianowy nie spełnia warunku koniecznego do zgodności estymatorów Pseudo-MNW estymatory MNW drugich momentów mogą zatem być niezgodne.
Przykład numeryczny: exp(ε i ) ma rozkład Gamma(0.3,3.33), β=[1, -0.15] Oszacowania uzyskane MNW wraz ze wzrostem liczności próby zbliżają się do prawdziwych wartości
alfa 0.36 0.35 0.34 0.33 0.32 0.31 0.30 0.29 0.28 0.27 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs
beta1 1.04 1.03 1.02 1.01 1.00 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82 0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs
beta2-0.139-0.140-0.141-0.142-0.143-0.144-0.145-0.146-0.147-0.148-0.149-0.150-0.151-0.152-0.153-0.154-0.155 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs
Estymator Pseudo-MNW uzyskany na podstawie maksymalizacji funkcji wiarogodności dla coraz większej próby dla rozkładu Poissona zachowuje się podobnie jak estymator MNW.
alfa 1 0-1 -2-3 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs
beta1 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs
beta2-0.136-0.137-0.138-0.139-0.140-0.141-0.142-0.143-0.144-0.145-0.146-0.147-0.148-0.149-0.150-0.151-0.152-0.153-0.154-0.155-0.156-0.157-0.158-0.159-0.160-0.161-0.162-0.163-0.164 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs
Przykładowy system BM oszacowany na podstawie Pseudo-MNW: k t 0 1 2 3 4 0 100.00 1 82.97 103.29 143.88 164.2 184.47 2 68.97 102.71 119.57 136.01 153.31 3 57.66 85.86 99.50 114.84 128.17 4 48.44 72.13 83.97 95.82 107.66 5 40.85 62.09 70.82 80.80 90.79
exp(ε i ) ma rozkład log-n(-0.13,0.26), β=[1, -0.15] Aby znaleźć zgodne oszacowanie wariancji Pseudo-MNW rozkładu zmiennej zależnej, można wykonać regresję pomocniczą: ( exp( β) ) exp( β) αexp( 2 β) gdzie E(u)=0. 2 X z z = z + u i, j i, j i, j i, j i, j
Estymatory Pseudo-MNW: alfa 1 0-1 -2 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs
Estymatory MNW: war 0.52 0.50 0.48 0.46 0.44 0.42 0.40 0.38 0.36 0.34 0.32 0.30 0.28 0.26 0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs
beta1 1.30 1.28 1.26 1.24 1.22 1.20 1.18 1.16 1.14 1.12 1.10 1.08 1.06 1.04 1.02 1.00 0.98 0.96 0.94 0.92 0.90 0.88 0.86 0.84 0.82 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs
beta2-0.141-0.142-0.143-0.144-0.145-0.146-0.147-0.148-0.149-0.150-0.151-0.152-0.153-0.154-0.155-0.156-0.157-0.158-0.159-0.160-0.161-0.162-0.163-0.164 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs
exp(ε i ) ma rozkład U(0.9,1.07), β=[1, -0.15] alfa 170 160 150 140 130 120 110 100 90 80 70 60 50 40 30 20 10 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs
beta1 1.10 1.09 1.08 1.07 1.06 1.05 1.04 1.03 1.02 1.01 1.00 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs
Podsumowanie: Estymatory Pseudo-MNW pozwalają dokonać oszacowań parametrów bez konieczności pełnego określenia rozkładu ilości szkód. Estymator MNW oparty na gęstości z liniowej rodziny wykładniczej pozwala uzyskać zgodne oszacowania pierwszych momentów rozkładu. Nie zawsze musi on prowadzić do uzyskania zgodnych oszacowań drugich momentów rozkładu.
Literatura: [1] Dionne G., Vanasse C., Automobile Insurance Rating in The Presence of Asymmetrical Information, Journal of Applied Econometrics, Vol. 7, No. 2, 1992, s. 149-165. [2] Dionne G., Vanasse C., A Generalization of Automobile Insurance Rating Models: The Negative Binomial Distribution with a Regression Component, ASTIN Bulletin, Vol. 19, 1989, s. 199-212. [3] Gourieroux C., Monfort A., Trognon A., Pseudo Maximum Likelihood Methods: Theory, Econometrica, Vol. 52, No. 3., 1984, s.681-700. [4] Gourieroux C., Monfort A., Trognon A., Pseudo Maximum Likelihood Methods: Theory, Econometrica, Vol. 52, No. 3., 1984, s.701-720.
DZIĘKUJĘ ZA UWAGĘ