Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Podobne dokumenty
Uogolnione modele liniowe

Zawansowane modele wyborów dyskretnych

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Agata Boratyńska Statystyka aktuarialna... 1

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Matematyka ubezpieczeń majątkowych r.

Metody systemowe i decyzyjne w informatyce

Metoda największej wiarogodności

N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r.

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Modele zapisane w przestrzeni stanów

Ekonometryczne modele nieliniowe

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Spis treści 3 SPIS TREŚCI

Matematyka ubezpieczeń majątkowych r.

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Matematyka ubezpieczeń majątkowych r.

Natalia Neherbecka. 11 czerwca 2010

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Własności statystyczne regresji liniowej. Wykład 4

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

O ŚREDNIEJ STATYSTYCZNEJ

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka aktuarialna i teoria ryzyka, model indywidualny i zespołowy, rozkłady złożone

ANALIZA MOŻLIWOŚCI ZASTOSOWANIA HIERARCHICZNYCH ESTYMATORÓW WIARYGODNOŚCI WYŻSZEGO RZĘDU W UBEZPIECZENIACH KOMUNIKACYJNYCH

Matematyka ubezpieczeń majątkowych r.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Zadanie 1. Zmienne losowe X 1, X 2 są niezależne i mają taki sam rozkład z atomami:

Rozpoznawanie obrazów

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2

Metody systemowe i decyzyjne w informatyce

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

Stanisław Cichocki. Natalia Nehrebecka

Metody systemowe i decyzyjne w informatyce

STATYSTYKA

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Matematyka ubezpieczeń majątkowych r.

Imputacja brakujacych danych binarnych w modelu autologistycznym 1

Stanisław Cichocki. Natalia Nehrebecka

Modele długości trwania

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

STATYSTYKA MATEMATYCZNA

Estymatory nieobciążone

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Rozpoznawanie obrazów

Statystyczna analiza danych (molekularnych) estymacja bayesowska i MLE

Testowanie hipotez statystycznych.

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Metody systemowe i decyzyjne w informatyce

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka

Statystyka matematyczna dla leśników

Statystyka i Analiza Danych

Estymacja gęstości prawdopodobieństwa metodą selekcji modelu

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Metoda największej wiarygodności

Estymacja parametru rozkładu Rayleigha i logistycznego w terminach k-tych wartości rekordowych

Wojciech Skwirz

Monte Carlo, bootstrap, jacknife

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Wybrane metody szacowania rezerw techniczno-ubezpieczeniowych

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Stanisław Cichocki. Natalia Nehrebecka

SPOTKANIE 3: Regresja: Regresja liniowa

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Uogólniona Metoda Momentów

Ważne rozkłady i twierdzenia c.d.

Prawdopodobieństwo i statystyka r.

Składki zaufania z zastosowaniem niesymetrycznych funkcji strat

Stanisław Cichocki. Natalia Nehrebecka

Komputerowa analiza danych doświadczalnych

WYKŁAD 2 i 3. Podstawowe pojęcia związane z prawdopodobieństwem. Podstawy teoretyczne. autor: Maciej Zięba. Politechnika Wrocławska

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Komputerowa analiza danych doświadczalnych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Transkrypt:

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka

Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja parametrów rozkładu przy pomocy MNW i Pseudo-MNW Przykłady

Konstrukcja optymalnego systemu BM Mamy obserwacje dotyczące ilości szkód generowanych przez T lat przez N ubezpieczonych: X, X,..., X,..., X 1,1 1,2 1, T N, T Zakładamy, że X i,j dla różnych ubezpieczonych są niezależne i pochodzą z rozkładu Poissona z parametrem λ i,j, i, j x czyli: e λ λ ( ) i, j Pr Xi, j= x λ = x!

Konstrukcja systemu BM, c.d. Rozkłady ilości szkód różnią się między ubezpieczonymi wartością oczekiwaną ilości szkód (λ i,j ). Można przyjąć, że: λ = exp ( z β ) i, j i, j gdzie z i,j to wektor charakterystyk indywidualnych i-tego ubezpieczonego w j- tym okresie, zaś β to wektor parametrów do oszacowania.

Konstrukcja systemu BM, c.d. Wtedy ilość szkód będzie mieć rozkład Poissona o wartości oczekiwanej i wariancji równej λ i,j. Charakterystyki indywidualne zapewne nie w pełni wyjaśnią zróżnicowanie λ i,j w populacji.

Konstrukcja systemu BM, c.d. Często przyjmuje się następującą specyfikację modelu: ( z ) λ = exp β + ε i, j i, j i gdzie ε i to błąd wynikający z pominięcia nieobserwowalnych istotnych charakterystyk ubezpieczonego lub błąd czysto losowy.

Konstrukcja systemu BM, c.d. Jeżeli przyjmie się, że exp(ε i ) ma rozkład Gamma(α,1/α), wtedy bezwarunkowy rozkład ilości szkód to rozkład ujemny dwumianowy: ( ) ( ( ) ) x Γ x + α exp z ( ) i, jβ / α Pr Xi, j x zi, j x α ( α ) x β α + o wartości oczekiwanej i wariancji = = Γ! 1+ exp / Var x ( z ) i, j i, j ( ( z ) ) i, j = ( ) = exp( ) E x z z β i, j i, j i, j exp ( z ) i, jβ ( z β ) ( 1+ exp ) i, j / α

Konstrukcja systemu BM, c.d. Problem decyzyjny: L(λ,S(X 1,, X t )) strata, gdy λ jest prawdziwą wartością parametru, a przyjęta została wartość S(X 1,, X t ). R S (λ) funkcja ryzyka estymatora S: S ( ( )) 1 2 t ( ), (,,..., ) R λ = E L λ S X X X

Konstrukcja systemu BM, c.d. Cel: znalezienie estymatora S, dla którego ryzyko będzie najmniejsze. - z reguły nie jest możliwe zminimalizowanie ryzyka dla wszystkich wartości parametru λ jednocześnie.

Konstrukcja systemu BM, c.d. Ryzyko bayesowskie estymatora S dla gęstości a priori f(λ): ( ) ( ) ( ) R S = R f d S λ λ λ Poszukujemy estymatora, który zminimalizuje powyższą funkcję ryzyka.

Konstrukcja systemu BM, c.d. Przyjmując kwadratową funkcję straty R S (λ) oraz wykorzystując twierdzenie Bayesa, otrzyma się następującą postać składki netto: ( ) P f X X X d = λ λ λ,,..., 1 2 t gdzie f(λ X 1,, X t ) to funkcja gęstości a posteriori parametru λ.

Konstrukcja systemu BM, c.d. Optymalnym estymatorem częstości szkód w powyżej opisanym modelu w momencie t+1 jest: ˆ α + ( ) j= 1 i, j λit, + 1 = exp zit, + 1β t α + exp j= 1 i, j β t X ( z )

Estymacja parametrów α i β Jeżeli exp(ε i ) ma faktycznie rozkład Gamma(α,1/α), wtedy oszacowania α i β można uzyskać przy pomocy Metody Największej Wiarogodności. Takie estymatory są zgodne i asymptotycznie efektywne.

Estymacja parametrów, c.d. Jeżeli exp(ε i ) ma inny rozkład niż zakładany, otrzymane oszacowania mogą nie być zgodne. W takim przypadku lepiej posłużyć się estymatorami Pseudo-MNW.

Estymatory Pseudo-MNW Są to estymatory uzyskane przez maksymalizację funkcji wiarogodności opartej na rodzinie rozkładów, która nie musi zawierać prawdziwego rozkładu zmiennej zależnej. Gourieroux et al. [1] określają rodzinę funkcji pseudo-wiarogodności, dla których oszacowania uzyskane przez maksymalizację owej funkcji, są zgodne i asymptotycznie normalne.

Estymatory Pseudo-MNW Jeżeli funkcja pseudo-wiarogodności należy do liniowej rodziny wykładniczej, wtedy maksymalizując funkcję wiarogodności opartą o te rozkłady, otrzymamy zgodne estymatory pierwszych momentów prawdziwego rozkładu zmiennej zależnej.

Do liniowej rodziny wykładniczej należy np. rozkład Poissona, ujemny dwumianowy, normalny, Gamma. Czyli przy zastosowaniu MNW z funkcją gęstości rozkładu ujemnego dwumianowego powinniśmy uzyskać zgodne oszacowania wektora β.

Aby uzyskać przy pomocy Pseudo-MNW zgodne estymatory drugich momentów prawdziwego rozkładu, funkcja pseudo-wiarogodności musi należeć do kwadratowej rodziny wykładniczej. Gourieroux et al. [1] pokazują, że rozkład ujemny dwumianowy nie spełnia warunku koniecznego do zgodności estymatorów Pseudo-MNW estymatory MNW drugich momentów mogą zatem być niezgodne.

Przykład numeryczny: exp(ε i ) ma rozkład Gamma(0.3,3.33), β=[1, -0.15] Oszacowania uzyskane MNW wraz ze wzrostem liczności próby zbliżają się do prawdziwych wartości

alfa 0.36 0.35 0.34 0.33 0.32 0.31 0.30 0.29 0.28 0.27 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs

beta1 1.04 1.03 1.02 1.01 1.00 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82 0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs

beta2-0.139-0.140-0.141-0.142-0.143-0.144-0.145-0.146-0.147-0.148-0.149-0.150-0.151-0.152-0.153-0.154-0.155 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs

Estymator Pseudo-MNW uzyskany na podstawie maksymalizacji funkcji wiarogodności dla coraz większej próby dla rozkładu Poissona zachowuje się podobnie jak estymator MNW.

alfa 1 0-1 -2-3 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs

beta1 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs

beta2-0.136-0.137-0.138-0.139-0.140-0.141-0.142-0.143-0.144-0.145-0.146-0.147-0.148-0.149-0.150-0.151-0.152-0.153-0.154-0.155-0.156-0.157-0.158-0.159-0.160-0.161-0.162-0.163-0.164 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 110000 120000 130000 140000 150000 160000 170000 180000 190000 200000 nobs

Przykładowy system BM oszacowany na podstawie Pseudo-MNW: k t 0 1 2 3 4 0 100.00 1 82.97 103.29 143.88 164.2 184.47 2 68.97 102.71 119.57 136.01 153.31 3 57.66 85.86 99.50 114.84 128.17 4 48.44 72.13 83.97 95.82 107.66 5 40.85 62.09 70.82 80.80 90.79

exp(ε i ) ma rozkład log-n(-0.13,0.26), β=[1, -0.15] Aby znaleźć zgodne oszacowanie wariancji Pseudo-MNW rozkładu zmiennej zależnej, można wykonać regresję pomocniczą: ( exp( β) ) exp( β) αexp( 2 β) gdzie E(u)=0. 2 X z z = z + u i, j i, j i, j i, j i, j

Estymatory Pseudo-MNW: alfa 1 0-1 -2 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs

Estymatory MNW: war 0.52 0.50 0.48 0.46 0.44 0.42 0.40 0.38 0.36 0.34 0.32 0.30 0.28 0.26 0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs

beta1 1.30 1.28 1.26 1.24 1.22 1.20 1.18 1.16 1.14 1.12 1.10 1.08 1.06 1.04 1.02 1.00 0.98 0.96 0.94 0.92 0.90 0.88 0.86 0.84 0.82 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs

beta2-0.141-0.142-0.143-0.144-0.145-0.146-0.147-0.148-0.149-0.150-0.151-0.152-0.153-0.154-0.155-0.156-0.157-0.158-0.159-0.160-0.161-0.162-0.163-0.164 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs

exp(ε i ) ma rozkład U(0.9,1.07), β=[1, -0.15] alfa 170 160 150 140 130 120 110 100 90 80 70 60 50 40 30 20 10 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs

beta1 1.10 1.09 1.08 1.07 1.06 1.05 1.04 1.03 1.02 1.01 1.00 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 100000 nobs

Podsumowanie: Estymatory Pseudo-MNW pozwalają dokonać oszacowań parametrów bez konieczności pełnego określenia rozkładu ilości szkód. Estymator MNW oparty na gęstości z liniowej rodziny wykładniczej pozwala uzyskać zgodne oszacowania pierwszych momentów rozkładu. Nie zawsze musi on prowadzić do uzyskania zgodnych oszacowań drugich momentów rozkładu.

Literatura: [1] Dionne G., Vanasse C., Automobile Insurance Rating in The Presence of Asymmetrical Information, Journal of Applied Econometrics, Vol. 7, No. 2, 1992, s. 149-165. [2] Dionne G., Vanasse C., A Generalization of Automobile Insurance Rating Models: The Negative Binomial Distribution with a Regression Component, ASTIN Bulletin, Vol. 19, 1989, s. 199-212. [3] Gourieroux C., Monfort A., Trognon A., Pseudo Maximum Likelihood Methods: Theory, Econometrica, Vol. 52, No. 3., 1984, s.681-700. [4] Gourieroux C., Monfort A., Trognon A., Pseudo Maximum Likelihood Methods: Theory, Econometrica, Vol. 52, No. 3., 1984, s.701-720.

DZIĘKUJĘ ZA UWAGĘ