Agata Boratyńska Statystyka aktuarialna... 1 Statystyka aktuarialna i teoria ryzyka LITERATURA Bowers N. i in. (1986 lub 1997) Actuarial mathematics, Hossak J.B., Pollard J.H. (1983 lub 1990), Introductory statistics with applications in general insurance, Cambridge University Press. Otto W. (2004), Ubezpieczenia majątkowe; t. I - Teoria ryzyka, WN-T, Warszawa. Zarządzanie ryzykiem w ubezpieczeniach, red. Ronka-Chmielowiec W., Wyd. AE we Wrocławiu, Wrocław 2000. Kaas, R., Goovaerts, M., Dhaene, J., Denuit, M. (2001), Modern Actuarial Risk Theory, Kluwer Academic Publishers, Boston. Kowalczyk P., Poprawska E., Ronka-Chmielowiec W. (2006), Metody aktuarialne, zastosowania matematyki w ubezpieczeniach, PWN, Warszawa. Klugman S., Panjer H., Willmot G. (1998 lub 2008) Loss Models, From Data to Decisions, Wiley Buhlmann H. i Gisler A. (2005), A Course in Credibility Theory and its Applications, Springer Niemiro Wojciech Teoria ryzyka w ubezpieczeniach, http://www-users.mat.umk.pl/ wniem/ryzyko/ryzykoub.pdf Wüthrich M.V., Merz M. (2008), Stochastic claims reserving methods in insurance, Wiley
Agata Boratyńska Statystyka aktuarialna... 2 Ubezpieczenie - urządzenie gospodarcze zapewniające pokrycie przyszłych potrzeb majątkowych, wywołanych u poszczególnych jednostek przez zdarzenia losowe, w drodze rozłożenia ciężaru tego pokrycia na wiele jednostek, którym te same zdarzenia zagrażają. Umowa ubezpieczeniowa (polisa) - umowa między ubezpieczanym (ubezpieczającym) a ubezpieczycielem (zakładem ubezpieczeń) w której ubezpieczany zobowiazuje się uiścić opłatę - składkę ubezpieczeniową (jednorazowo lub ratalnie) na rzecz zakładu ubezpieczeń, zakład ubezpieczeń zobowiązuje się do wypłacenia w razie zajścia wypadku ubezpieczeniowego określonego w polisie lub w ściśle określonym terminie sumy ubezpieczenia, wartości ubezpieczenia, odszkodowania na rzecz określonych w ubezpieczeniu osób. Reasekuracja - ubezpieczenie jednego zakładu ubezpieczeń w innym na wypadek zbyt dużych roszczeń
Agata Boratyńska Statystyka aktuarialna... 3 Wskaźniki: ekonomiczno - ubezpieczeniowe: gdzie B - suma składek, Y - dochód narodowy B Y B m O m gdzie B m - suma składek na ubezpieczenia majątkowe, O m - suma o jaką zwiększyły się oszczędności, wskaźnik mówi o skłonności do zawierania ubezpieczeń; wskaźnik powszechności = liczba ubezpieczonych pole ubezpieczeń wskaźnik pełności = odszkodowania wypłacone suma rzeczywistych szkód
Agata Boratyńska Statystyka aktuarialna... 4 wskaźniki techniczno-ubezpieczeniowe: wskaźnik szkodowości losowej = S U gdzie S - suma odszkodowań wypłaconych, U - suma ubezpieczenia szkodowość (szkodowość finansowa) = S B stopa zmiany szkodowości = wskaźnik kosztów = Koszty B szkodowość oczekiwana szkodowość 1 wskaźnik częstości = c = N n gdzie N - liczba wypadków, n - liczba ubezpieczonych wskaźnik rozszerzalności = liczba szkód N
Agata Boratyńska Statystyka aktuarialna... 5 Rozkład gęstość f(x) F (x) EX V arx ( ) bin(n, θ) n x θ x (1 θ) n x nθ nθ(1 θ) θ (0, 1) x = 0, 1,..., n λ λx P oiss(λ) e x! λ λ λ > 0 x = 0, 1, 2,... bin Γ(r+x) (r, p) x!γ(r) pr (1 p) x r(1 p) r(1 p) p p 2 r > 0, p (0, 1) x = 0, 1, 2,... Γ(α+β)x Beta(α, β) α 1 (1 x) β 1 α Γ(α)Γ(β) B(α, β, x) α+β α, β > 0 x (0, 1) x (0, 1) N(µ, σ 2 ) 1 2πσ exp ( ) (x µ) 2 2σ 2 αβ (α+β) 2 (α+β+1) Φ( x µ σ ) µ σ2 σ > 0 wykładniczy θe θx 1 e θx 1 θ Ex(θ) θ > 0 x > 0 β Gamma(α, β) α Γ(α) xα 1 e βx α Γ(α, βx) β α, β > 0 x > 0 β IGamma α Γ(α) x α 1 e β x Γ(α, β x ) β α 1 α, β > 0 x > 0 β α τ T Gamma Γ(α) xατ 1 e βxτ Γ(α, βx τ ) α, β, τ > 0 x > 0 β α (ln x) α 1 Γ(α+ 1 τ ) Γ(α)β 1 τ 1 θ 2 α β 2 β 2 (α 1) 2 (α 2) EX 2 = Γ(α+ 2 τ ) Γ(α)β 2 τ ( ) α ( ) α ( ) 2α β β β 1 β 2 β β 1 LG(α, β) x β+1 Γ(α) Γ(α, β ln x) α, β > 0 x > 0 β > 1 β > 2 λ P areto(θ, λ) θ θ (λ+x) 1 λθ λ θ+1 (λ+x) θ θ 1 λ, θ > 0 x > 0 θ > 1 θ > 2 exp[ 1 2 ( ln x µ σ ) 2 ] LN(µ, σ) xσ 2π µ R, σ > 0 x > 0 Burr(θ, λ, τ) τθλ θ xτ 1 (λ+x τ ) θ+1 1 ( λ λ 2 θ (θ 1) 2 (θ 2) ln x µ Φ( σ ) e µ+ 1 2 σ2 e 2µ+σ2 (e σ2 1) ) θ Γ(θ 1 λ+x τ τ )Γ(1+ 1 τ ) λ 1 τ Γ(θ) τ, λ, θ > 0 x > 0 τθ > 1 EX 2 = λ 2 τ Γ(θ 2 τ )Γ(1+ 2 τ ) Γ(θ) τθ > 2 W eibull(c, τ) cτx τ 1 e cxτ 1 e cxτ Γ(1+ 1 τ ) c 2/τ c, τ > 0 x > 0 Γ(θ+τ)λ GP areto θ x τ 1 λτ Γ(θ)Γ(τ)(λ+x) B(τ, θ, u) θ+τ θ 1 (θ, λ, τ) u = x x+λ θ > 1 θ > 2 c 1/τ Γ(1+ 2 τ ) Γ(1+ 1 τ ) λ 2 τ(θ+τ 1) (θ 1) 2 (θ 2)
Agata Boratyńska Statystyka aktuarialna... 6 ILE JESTEŚMY SKŁONNI ZAPŁACIĆ ZA UBEZPIECZENIE u - funkcja użyteczności, awersja do ryzyka - u > 0, u < 0 PRZYKŁAD: u(w) = ln w, u(w) = exp( βw), u(w) = w βw 2 Rozważmy ubezpieczenie pełne majątku w narażonego na stratę losową X, wtedy maksymalna opłata H za ubezpieczenie spełnia E (u(w X)) = u(w H) Przy u odpowiadającej awersji do ryzyka H spełnia H > EX.
Agata Boratyńska Statystyka aktuarialna... 7 ZADANIE 1. Dwa zakłady ubezpieczeniowe A i B posługują się funkcją użyteczności u(w). Zakład A dysponuje kapitałem 10 8 ECU, zakład B kapitałem 6 10 7 ECU. Zakłady A i B otrzymały ofertę ubezpieczenia statku o wartości 2 10 7 ECU od całkowitego zniszczenia (zatonięcia). Prawdopodobieństwo tego zdarzenia jest równe q. 1. Wyznacz składkę minimalną jaką powinny ustalić zakłady pracując a) oddzielnie (każdy sam ubezpiecza cały statek) b) wspólnie ( dwa przypadki: koasekuracja po równo, koasekuracja proporcjonalna do majątku). Przyjmij q = 0.1, 0.01, 0.009, 0.001 u(w) = 1 2 w 2. Wyznacz maksymalne akceptowane składki dla ubezpieczającego się, gdy wartość jego całkowitego majątku jest równa 21 10 6, 60 10 6, 100 10 6, 200 10 6, 500 10 6, 1000 10 6 Rozważ dwie funkcje użyteczności u(w) = 1 2 w u(w) = ln w
Agata Boratyńska Statystyka aktuarialna... 8 GENEROWANIE ZMIENNYCH LOSOWYCH O USTALONYM ROZKŁADZIE Wieczorkowski R., Zieliński R. (1997), Komputerowe generatory liczb losowych, WNT, Warszawa. Funkcja LOS() - generuje zmienną U U(0, 1) X - zmienna o rozkładzie dyskretnym gdzie p i = 1. Niech X w 1 w 2... w k P (X = w i ) p 1 p 2... p k f 0 = 0, f i = f i 1 + p i, i = 1, 2,..., k ALGORYTM: 1. generuj U U(0, 1); 2. jeśli U (f i 1, f i ], to X := w i. X - zmienna o rozkładzie ciągłym i ściśle rosnącej dystrybuancie F LEMAT. Jeżeli X F i F jest ciągłą i ściśle rosnącą dystrybuantą, to zmienna F (X) ma rozkład jednostajny U(0, 1). DOWÓD. Wyznaczmy dystrybuantę zmiennej F (X) w punkcie z P (F (X) z) = P ( X F 1 (z) ) = F (F 1 (z)) = z dla z (0, 1).
Agata Boratyńska Statystyka aktuarialna... 9 ALGORYTM: 1. generuj U U(0, 1); 2. X := F 1 (U). ZADANIE. Wygeneruj po n = 50 wartości zmiennych losowych o rozkładach: 1. zero-jedynkowym P (X = 1) = 0, 1; 2. równomiernym o wartościach 1, 2, 3, 4, 5; 3. Ex(2); Gamma(2, 4); 4. P areto(3, 2); 5. N(0, 1); N(2, 9). Wyznacz EX, V arx oraz odpowiedniki próbkowe. Zadanie powtórz dla n = 200. Wykorzystywanie własności i zależności między zmiennymi 1. PROCEDURA log and trig - generuje zmienne z rozkładu nomalnego Jeżeli U, V sa niezależnymi zmiennymi losowymi z rozkładu U(0, 1), to X = 2 ln U cos(2πv ) Y = 2 ln U sin(2πv ) są niezależnymi zmiennymi losowymi z rozkładu N(0, 1). ZADANIE. Wygeneruj po 50 wartości zmiennych losowych o rozkładach N(2, 9) i N(4, 5) korzystając z procedury log and trig. 2. Jeżeli X Ex(c), to Y = X τ 1 ma rozkład Weibulla o gęstości f(x) = cτx τ 1 exp( cx τ ).
Agata Boratyńska Statystyka aktuarialna... 10 3. Jeżeli X 1, X 2,..., X k są i.i.d. z rozkładu N(0, 1), to Z = k i=1 X i ma rozkład chi-kwadrat z k stopniami swobody 4. Jeżeli X 0, X 1, X 2,... są i.i.d. z rozkładu Ex(1) to N = min j : j i=0 X i > λ jest zmienną losową o rozkładzie Poissona o wartości oczekiwanej λ. DOWÓD. k i=0 X i Gamma(k + 1, 1) P (N = k) = P (N k) P (N k 1) = P k i=0 X i > λ P + 1 λ k! xk e x dx + λ całkując przez części otrzymujemy P (N = k) = 1 k! xk e x k 1 i=0 X i > λ 1 (k 1)! xk 1 e x dx + λ = e λλk k! ALGORYTM: 1. N := 1; S := 0; 2. dopóki S λ powtarzaj generuj X Ex(1); S := S + X; N := N + 1; 3. zwróć N.
Agata Boratyńska Statystyka aktuarialna... 11 Wykorzystanie rozkładów granicznych do generowania zmiennej o rozkładzie Poissona Z CTG: jeżeli N P oiss(λ) i λ +, to N λ λ N(0, 1) ALGORYTM: 1. generuj Z N(0, 1); 2. N := λz + λ. Aproksymacja Anscombe jeżeli N P oiss(λ) i λ +, to gdzie P (N k) Φ (A λ (k)) A λ (k) = 3 k + 5 2 8 2 3 λ 1 6 3 2 λ + 1 ALGORYTM: 1. generuj Z N(0, 1); 2. N := (Z + b) 3 2a c, gdzie b = 1, 5 λ 1 24 λ, a = 8 27 24 λ λ, c = 5 8 ZADANIE. Wygeneruj po 50 wartości zmiennych losowych z rozkładów P oiss(1), P oiss(2), P oiss(20), P oiss(100).
Agata Boratyńska Statystyka aktuarialna... 12 PODZIAŁ RYZYKA (RODZAJE POLIS) strata, wypadek ubezpieczeniowy (loss), roszczenie (claim) X, S - zmienna losowa odszkodowanie (indemnity) I(X) - zmienna losowa, - ubezpieczenie pełne 0 I(X) X I(X) = X Wtedy EI(X) = EX i V ari(x) = V arx - pokrycie częściowe 0 I(X) < X U = X I(X) - udział ubezpieczonego w szkodzie PRZYKŁAD: Wartość szkody x 0 2 4 9 Odszkodowanie I(x) 0 0,4 2 6 P (X = x) 0,8 0,1 0,06 0,04 Wyznacz EX, V arx, EI(X), V ari(x) EX = 0, 8 V arx = 3, 96 EI(X) = 0, 4 V ari(x) = 1, 536
Agata Boratyńska Statystyka aktuarialna... 13 1. Kontrakt proporcjonalny I(X) = ax a (0, 1) 2. Polisa z franszyzą integralną (warunkową) I(X) = 0 gdy X < d X gdy X d 3. Polisa z udziałem własnym d (z franszyzą redukcyjną - bezwarunkową, stop-loss, deductible) I(X) = 0 gdy X < d X d gdy X d 4. Polisa z udziałem własnym d i górnym limitem odpowiedzialności M 0 gdy X < d I(X) = X d gdy d X M M d gdy X > M 5. Polisa z indywidualną franszyzą redukcyjną (ubezpieczenie częściowe z udziałem własnym) I(X) = 0 gdy X < d a(x d) gdy X d a (0, 1)
Agata Boratyńska Statystyka aktuarialna... 14 6. Ubezpieczenie częściowe warstwy ograniczonej górnym limitem odpowiedzialności M i udziałem własnym d I(X) = 0 gdy X < d a(x d) gdy d X M a(m d) gdy X > M 7. Ubezpieczenie ze znikającą franszyzą redukcyjną I(X) = 0 gdy X < d X d gdy d X M X gdy X > M 8. Ubezpieczenia na pierwsze ryzyko (first loss) I(X) = X d gdy X < d gdy X d a (0, 1) 9. Ubezpieczenia na pierwsze ryzyko z udziałem własnym i pełnym pokryciem strat w granicach ustalonych limitów I(X) = 0 gdy X < d X d gdy d X m X gdy m < X < M M gdy X M
Agata Boratyńska Statystyka aktuarialna... 15 TWIERDZENIE o optymalnym ubezpieczeniu Jeżeli pewien decydent 1. posiada początkowy zasób majątku w 2. przejawia awersję do ryzyka 3. narażony jest na stratę X 4. gotów jest przeznaczyć kwotę P na zakup ubezpieczenia i 0 P (1 + θ)ex oraz rynek ubezpieczeniowy oferuje wszystkie możliwe kontrakty I takie, że 0 I(X) X o ustalonej EI(X) po cenie (1 + θ)ei(x), to decydent osiągnie max oczekiwanej użyteczności zakupując kontrakt I 0 gdy X d (X) = X d gdy X > d gdzie P = (1 + θ)ei (X).
Agata Boratyńska Statystyka aktuarialna... 16 SKŁADKA S - zmienna losowa równa wysokości odszkodowań (świadczeń zakładu w pewnej grupie ryzyka) w przyszłości zdyskontowaną na moment zawierania umowy B - składka brutto, H składka (premium) H > ES B = H + K H = Π + R(S) Π = ES - składka netto (czysta składka), równa oczekiwanej wypłacie, nie odzwierciedla ryzyka związanego z ubezpieczeniem, wyznaczana w drodze analiz aktuarialnych; R(S) - składka na ryzyko związane z losowością szkód oraz z popytem i podażą (narzut związany z ryzykiem), wyznaczana w drodze analiz aktuarialnych i ekonomicznych; K - składka na pokrycie kosztów, wyznaczana w drodze analiz finansowo-księgowych, często wyrażana jako K = βb, wtedy B = H 1 β
Agata Boratyńska Statystyka aktuarialna... 17 PRAKTYCZNE ZASADY USTALANIA SKŁADEK Niech S oznacza wielkość odszkodowań, ryzyko A) zasada równoważności (zasada czystej składki) H = Π = ES B) zasada wartości oczekiwanej H = (1 + a)es C) zasada wariancji H = ES + αv ars D) zasada odchylenia standardowego H = ES + β V ars E) zasada percentyli - H spełnia warunek P (S > H) = ε Liczby a, α, β, ε ustalane przez zakład ubezpieczeniowy. H ES - narzut bezpieczeństwa
Agata Boratyńska Statystyka aktuarialna... 18 TEORETYCZNE METODY USTALANIA SKŁADKI zasada zerowej użyteczności u - funkcja użyteczności ubezpieczyciela W - majątek ubezpieczyciela u(w ) = Eu(W + H S) ZADANIE. Wyznacz składkę odpowiadającą funkcji F) składka wykładnicza u(x) = 1 e cx c H = 1 c ln E ( e cs) POŻĄDANE WŁASNOŚCI SKŁADKI 1) H ES 2) H max odszkodowanie 3) H(S + c) = H(S) + c 4) S 1 i S 2 ryzyka niezależne, to H(S 1 + S 2 ) = H(S 1 ) + H(S 2 ) 5) H(H(S Y )) = H(S)
Agata Boratyńska Statystyka aktuarialna... 19 ZADANIE. Sprawdź, które własności posiadają wymienione składki własność A B C D E F 1 + + + + - + 2 + - - - + + 3 + - + + + + 4 + + + - - + 5 + - - - - + ZADANIE 2. Wygeneruj szkody dla polis z kolejnych lat wg rozkładu P (N = 1) = 0, 1 P (N = 0) = 0, 9, gdzie N jest liczbą szkód z jednej polisy. Wygeneruj wartości X szkód wg rozkładu P (X = 100) = 0, 5, P (X = 200) = 0, 25, P (X = 500) = 0, 25. Szkody o wartości 500 są regulowane w roku następnym szkody o pozostałych wartościach w roku zajścia. Wylicz składki na każdy rok w następujący sposób: składka I: w latach 1980-1981 składka po 25, w latach następnych składka=średnia ze szkód wypłaconych w roku poprzednim razy częstość szkód w roku poprzednim razy 1,1 składka II: w latach 1980-1981 składka po 25, w latach następnych - w roku n - składka=średnia ze szkód zaistniałych w roku n 2 razy częstość szkód w roku n 2 razy 1,1 Którą z metod uważasz za rozsądniejszą i dlaczego. Uwaga: Średnia ze szkód i częstość szkód jest liczona na podstawie symulacji. Wyniki przedstaw w tabelach. Wyznacz też składki nie opierając się na symulacjach ale na parametrach odpowiednich rozkładów. Porównaj wyniki.
Agata Boratyńska Statystyka aktuarialna... 20 Szkody uregulowane (K - liczba, s - wartość) l.polis l.szkód 1980 1981 1982 1983 1984 1985 K s K s K s K s K s K s 1980 1000 1981 4000 1982 8000 1983 6000 1984 4000 1985 4000 suma średnia Wielkość szkód do zapłaty w roku 1986 = Porównanie składek rok składka kwota wartość H1-S składka kwota H2-S I składek H1 szkód S II składek H2 1980 25 25000 25 25000 1981 25 100000 1982 1983 1984 1985 suma suma
Agata Boratyńska Statystyka aktuarialna... 21 MODEL RYZYKA INDYWIDUALNEGO Pojedyncze ryzyko (polisa) może generować co najwyżej jedną szkodę X wielkość ryzyka (dla jednej polisy) gdzie I = X = IY 1 z prwdopodobieństwem q 0 z prwdopodobieństwem 1 q Y F - wartość szkody, zmienna o rozkładzie ciągłym, F (0) = 0, EY = µ, V ary = σ 2 Rozkład zmiennej X (rozkład mieszany): F X (x) = 0 gdy x 0 (1 q) + qf (x) gdy x > 0 EX = qey = qµ V arx = qv ary + (EY ) 2 (q q 2 ) = qσ 2 + µ 2 q(1 q) Portfel ryzyka - założenia: polisy niezależne n - liczba polis ustalona liczba zgłoszeń z polisy - co najwyżej jedno S = X 1 + X 2 +... + X n - łączna wartość szkód z portfela Rozkład zmiennej S = X 1 + X 2 gdy X 1 F 1, X 2 F 2 F S (s) = P (X 1 + X 2 s) = P (X 1 s X 2 ) = F R 1(s x)df 2 (x) = F 1 F 2 (s)
Agata Boratyńska Statystyka aktuarialna... 22 METODY APROKSYMACJI S 1. Aproksymacja rozkładem normalnym CTG: Jeżeli X 1, X 2,..., X n i.i.d. EX i = m i V arx i = σ 2 i S n = X 1 + X 2 +... + X n, to z lim P S n nm n + σ n Model indywidualny, X 1, X 2,..., X n i.i.d. Podstawowe estymatory: ˆq = częstość = ES = nqµ z = Φ(z) V ars = n ( qσ 2 + µ 2 q(1 q) ) liczba szkód w okresie liczba jednostek ryzyka = N n suma wartości szkód w okresie ˆµ = = 1 liczba szkód w okresie N ˆΠ = nˆq ˆµ N Y j j=1 ˆσ 2 = 1 N N j=1 (Y j ˆµ) 2
Agata Boratyńska Statystyka aktuarialna... 23 Zad. 1. Portfel składa się z n niezależnych polis. Pojedyncza polisa może generować co najwyżej jedną szkodę z prawdopodobieństwem q, a prawdopodobieństwem 1 q nie generuje szkody. Rozkład wysokości szkody jest zmienną losową o wartości oczekiwanej µ i wariancji σ 2. Składka przypadająca na jedno ryzyko (polisę) jest skalkulowana tak H = 1 + θ n ES gdzie S oznacza sumaryczną wysokość szkód i θ oznacza narzut bezpieczeństwa dobrany tak by P (S > nh) = 0, 01. W portfelu mamy n = 1000 q = 0, 05 µ = 10 σ = 10. Wyznacz θ. Zad 2. Rozważamy portfel ubezpieczeń na życie. Dane podaje tabela. k n k - liczba q k - p-stwo b k polis w k-tej grupie zgonu - the benefit 1 4000 0.01 10 2 2000 0.02 10 3 1000 0.01 20 Wyznacz θ taką, aby P (S > (1 + θ)es) = 0, 05.
Agata Boratyńska Statystyka aktuarialna... 24 Zad. 3. Tysiąc mężczyzn wykupiło polisę na życie na rok. Prawdopodobieństwo śmierci w ciągu roku dla każdego z mężczyzn wynosi 0,001, a świadczenie 1 jednostkę. Jakie jest prawdopodobieństwo, że całkowite świadczenia w tej grupie wyniosą co najmniej 4 jednostki. Zastosuj aproksymację rozkładem normalnym i rozkładem Poissona, porównaj wyniki.
Agata Boratyńska Statystyka aktuarialna... 25 Funkcja tworząca momenty zmiennej X > 0 Przykład. X Ex(λ) M X (t) = 0 M X (t) = Ee tx dla t < λ i M(t) = dla t λ. e tx λe λx dx = λ λ t WŁASNOŚCI: 1. M X (0) = 1; 2. M (k) X (t) = dk M dt k X (t) = dk Ee tx = E(X k e tx ) dla k = 1, 2,...; [ dt k d 3. k ] M dt k X (t) = t=0 EXk ; 4. V arx = M X(0) (M X(0)) 2 ; 5. jeżeli Y = ax to M.G.F. Y jest równa M Y (t) = M X (at). 6. Niech S = X + Y, gdzie X i Y niezależne, wtedy M S (t) = M X (t)m Y (t). 7. jeżeli Y = a + X to M.G.F. Y jest równa M Y (t) = Ee ta+tx = e ta M X (t). 8. Jeżeli M X (t) = M Y (t) dla t (a, b), to X = Y wg rozkładu 9.Niech X n 0 i X n X wg rozkładu, to M Xn (t) M X (t) dla t < 0.
Agata Boratyńska Statystyka aktuarialna... 26 rozkład X M X (t) Bin(p, n) [1 + p(e t 1)] n P oiss(λ) exp(λ(e t 1)) Bin (r, p) ( p U(a, b) 1 (1 p)e t ) r e tb e ta t(b a) N(m, σ) exp(tm + 1 2 σ2 t 2 ) Gamma(α, β) ( β β t )α
Agata Boratyńska Statystyka aktuarialna... 27 Funkcja tworząca kumulanty zmiennej X > 0 C X (t) = ln M X (t) WŁASNOŚCI: 1. C X(t) = M X(t) M X (t) = C X(0) = M X(0) = EX 2. 3. 4. C X(t) = M X(t)M X (t) (M X(t)) 2 (M X (t)) 2 = C X(0) = V arx C (3) X (0) = E(X EX) 3 = γ X = C(3) X (0) (C X(0)) 3 2 C (4) X (0) = E(X EX) 4 3V ar 2 X = κ X = E(X EX)4 V ar 2 X i=1 3 = C(4) X (0) (C X(0)) 2 Niech S = n i=1 X i, X i niezależne 5. C S (t) = n ln M Xi (t) = n C Xi (t) 6. stąd i=1 C (3) S (t) = n C (3) X i (t) i=1 E(S ES) 3 = n E(X i EX i ) 3 i=1
Agata Boratyńska Statystyka aktuarialna... 28 γ S = n i=1 C (3) X i (0) ( n i=1 V arx i ) 3 2 = n i=1 γ Xi (V arx i ) 3 2 ( n i=1 V arx i ) 3 2 W szczególności jeżeli X i i.i.d. γ Xi = γ i V arx i = σ 2, to σ3 γ S = nγ (nσ 2 ) 3 2 = γ n
Agata Boratyńska Statystyka aktuarialna... 29 2. Aproksymacja rozkładem gamma Z Gamma(α, β, x 0 ), to Z x 0 Gamma(α, β) gęstość p α,β,x0 (x) = βα Γ(α) (x x 0) α 1 exp( β(x x 0 )) x > x 0 M Z (t) = e tx β 0 β t C Z (t) = tx 0 + α ln β α ln(β t) α EZ = x 0 + α β γ Z = 2 α V arz = α β 2 κ Z = 6 α = 3 2 γ2 Z Jeżeli S ma rozkład Gamma(α, β, x 0 ), to parametry α, β, x 0 wyznaczamy z układu równań x 0 + α β = µ S α = σ 2 β 2 S 2 α = γ S gdzie ES = µ S, V ars = σs, 2 γ S = E(S ES)3. σs 3
Agata Boratyńska Statystyka aktuarialna... 30 Model indywidualny, X 1, X 2,..., X n i.i.d. ES = nqµ V ars = n ( qσ 2 + µ 2 q(1 q) ) γ S = γ X n γ X = qe(y 3 ) 3q 2 µ(µ 2 + σ 2 ) + 2q 3 µ 3 ( qσ 2 + µ 2 q(1 q)) 3 Jeżeli S = S 1 +S 2 +...+S k, gdzie S i niezależne (ale niekoniecznie o tym samym rozkładzie) to γ S = k i=1 γ Si ES = k i=1 V ars = k i=1 ES i (V ars i ) 3 2 ( k i=1 V ars i )3 2 = Jeżeli składka H ma spełniać warunek i S Gamma(α, β, x 0 ), to V ars i P (S > H) = ε H = F 1 Gamma(α,β) (1 ε) + x 0 k i=1 E(S i ES i ) 3 (V ars) 3 2
Agata Boratyńska Statystyka aktuarialna... 31 Zadanie 1. Rozważmy trzy grupy ryzyka k n k - liczba q k - p-stwo polis w k-tej grupie szkody 1 100 0.1 2 150 0.2 3 200 0.08 Wartość szkody jest równa 2. Wyznacz składkę łączną H w każdej grupie osobno i łącząc grupy po dwie według zasady P (S > H) = 0, 02 stosując aproksymację rozkładem normalnym i rozkładem gamma. Zadanie 2. Wygeneruj 1000 polis wg modelu indywidualnego z prawdopodobieństwem szkody q = 0, 2 i wartością szkody a) Y Ex(0, 01) b) Y P areto(5, 400). Na podstawie otrzymanych danych oszacuj odpowiednie parametry rozkładu liczby i wartości szkód, a następnie korzystająć z tych estymatorów oszacuj składkę łączną H, dla portfela złożonego z 1000 polis tego samego typu, tak, by P (S > H) = 0, 05, gdzie S suma szkód. Zastosuj aproksymację rozkładem normalnym i gamma. Wylicz też H wykorzystując rzeczywiste parametry rozkładu, a nie wartości estymatorów otrzymanych na podstawie próby losowej.
Agata Boratyńska Statystyka aktuarialna... 32 MODEL RYZYKA ŁĄCZNEGO ZAŁOŻENIA: N(i) - liczba szkód na jedno ryzyko (jeden ubezpieczony), zmienna losowa o wartościach naturalnych Y - wielkość szkody, o dystrybuancie F Y X i = Y i,1 + Y i,2 +... + Y i,n(i) - wartość szkód na jedno ryzyko S - suma roszczeń z portfela S = X 1 + X 2 +... + X n = Y 1 + Y 2 +... + Y N gdzie N - łączna liczba szkód, n - liczba polis Y i - niezależne zmienne losowe o dystrybuancie F = F Y Wartość szkody jest niezależna od liczby szkód S ma złożony rozkład prawdopodobieństwa (jest suma zmiennych o losowej liczbie składników) określa się go przez podanie rozkładu zmiennej Y i zmiennej N Model indywidualny (szczególny przypadek modelu łącznego) S - ma złożony rozkład dwumianowy Cbin(n, p, F )
Agata Boratyńska Statystyka aktuarialna... 33 Pewne własności rozkładów złożonych F S (x) = P (S x) = P (S x N = 0) + P (S x N = 1) +... = + k=0 P (S x N = k)p (N = k) Rozkład warunkowy S pod warunkiem N = k jest rozkładem sumy k zmiennych losowych niezależnych MGF (S) M S (t) = Ee ts = EE(e ts ( (Ee ty N) = E ) N ) M S (t) = E ( (M Y (t)) N ) = M N (ln M Y (t)) ES = µen V ars = σ 2 EN + µ 2 V arn gdzie µ = EY, σ 2 = V ary E(S ES) 3 = E(Y EY ) 3 EN+3EY V ary V arn+(ey ) 3 E(N EN) 3
Agata Boratyńska Statystyka aktuarialna... 34 ZŁOŻONY ROZKŁAD POISSONA CP oiss(λ, F ) N P oiss(λ) F S (x) = + k=0 e λλk k! F k (x) ES = λµ V ars = λ(µ 2 + σ 2 ) = λe(y 2 ) M S (t) = M N (ln M Y (t)) = exp (λ(m Y (t) 1)) C S (t) = λ(m Y (t) 1) C S(t) = λm Y (t) C S(t) = λm Y (t) C (3) S (t) = λm (3) Y (t) stąd ES = λey V ars = λe(y 2 ) E(S ES) 3 = λe(y 3 ) WNIOSEK. S ma rozkład asymetryczny o skośności prawostronnej γ S = λe(y 3 ) E(Y 3 ) = (λe(y 2 )) 3 2 λ(e(y 2 )) 3 2 oraz lim γ S = 0 λ
Agata Boratyńska Statystyka aktuarialna... 35 TWIERDZENIE 1. Niech S 1, S 2,..., S n będą niezależnymi zmiennymi losowymi o rozkładach CP oiss(λ i, F i ), i = 1, 2,..., n. Niech A = S 1 + S 2 +... + S n. Wtedy gdzie Λ = n i=1 λ i. A CP oiss Λ, 1 Λ n i=1 λ i F i PRZYKŁAD. S 1 CP oiss(100, F 1 ), S 2 CP oiss(200, F 2 ), S 1, S 2 niezależne F 1 - dystrybuanta rozkładu wykładniczego Ex(α), F 2 - dystrybuanta rozkładu wykładniczego Ex(β). Wyznacz rozkład zmiennej S 1 + S 2. ODP. S 1 + S 2 CP oiss(λ, F ) gdzie Λ = 300 i F (x) = 1 1 3 exp( xα) 2 3 exp( xβ) Interpretacja: łączna liczba roszczeń ma rozkład Poissona z parametrem 300, z prawdopodobieństwem 1 3 wielkość szkody pochodzi z rozkładu Ex(α) i z prawdopodobieństwem 2 3 z rozkładu Ex(β).
Agata Boratyńska Statystyka aktuarialna... 36 ZAD 1. Dla pewnego portfela ryzyka liczba szkód ma rozkład Poissona z wartością oczekiwaną 10, wysokość pojedynczej szkody jest zmienną o rozkładzie Ex(200). Ubezpieczyciel pokrywa nadwyżkę szkody ponad 100. Podaj wartość oczekiwaną i wariancję sumy wypłaconych odszkodowań. ZAD 2. Portfel ryzyk składa się z dwóch niezależnych podportfeli. Liczba szkód N i w i-tym podportfelu jest zmienną losową o rozkładzie P oiss(λ i ), zaś wysokość szkody jest ustalona równa b i. Niech λ 1 = 120 λ 2 = 30 b 1 = 1 b 2 = 3 Jaki rozkład ma łączna wartość szkód z portfela. Oblicz wartość oczekiwaną i wariancję łącznej wartości szkód jeśli wiadomo, że N 1 + N 2 = 200. ZAD 3. Dla pewnego portfela ryzyka liczba szkód ma rozkład Poissona z wartością oczekiwaną 5, wysokość pojedynczej szkody jest zmienną o rozkładzie Gamma(2, 10). Aproksymujemy łączną wartość szkód przesuniętym rozkładem gamma Gamma(α, β, x 0 ), zachowując przy tym wartości pierwszych trzech momentów. Wyznacz parametry α, β, x 0.
Agata Boratyńska Statystyka aktuarialna... 37 TWIERDZENIE 2. Niech S n = n i=1 I ni Y ni, gdzie I ni = 1 z prawdopodobieństwem q ni 0 z prawdopodobieństwem 1 q ni Y ni są zmiennymi losowymi ciągłymi o dystrybuancie F ni i wszystkie zmienne I ni, Y ni są niezależne. Jeżeli lim n n i=1 q ni = λ n q ni n lim i=1 λ F n i (x) = F (x) to lim S n n = S (wg rozkładu), gdzie S ma złożony rozkład Poissona CP oiss(λ, F ).
Agata Boratyńska Statystyka aktuarialna... 38 ROZKŁAD UJEMNY DWUMIANOWY Zmienna N ma rozkład ujemny dwumianowy bin (r, p) wtt P (N = k) = r > 0, p (0, 1) - parametry Γ(r + k) p r (1 p) k k = 0, 1, 2,... Γ(r)k! Szczególny przypadek: r naturalne - interpretacja: N liczba porażek do uzyskania r-tego sukcesu gdzie q = 1 p stąd M N (t) = C N (t) = r ln p 1 e t (1 p) r = 1 q 1 e t q r p 1 e t (1 p) = r ln p r ln(1 et (1 p)) r(1 p) EN = = rq p 1 q r(1 p) rq V arn = = p 2 (1 q) 2 γ N = 1 + q rq
Agata Boratyńska Statystyka aktuarialna... 39 Rozkład ujemny dwumianowy otrzymujemy jeśli przyjmiemy, że liczba szkód jest wynikiem dwuetapowego doświadczenia: pierwszy etap polega na wylosowaniu ryzyka, a drugi etap na wygenerowaniu przez to ryzyko liczby szkód, dokładniej ryzyko charakteryzuje się przez wartość parametru λ, odpowiadającego za wartość oczekiwaną liczby szkód z ryzyka przy znanym λ liczba szkód z ryzyka N ma rozkład P oiss(λ). stąd f λ (x) = P (N = k) = P (N = k λ) = λk k! e λ βα Γ(α) xα 1 e βx x > 0 Γ(α + k) Γ(α)k! β 1+β β 1 + β α 1 1 + β podstawiając r = α i p = otrzymujemy wzór na prawdopodobieństwo w rozkładzie ujemnym dwumianowym. k
Agata Boratyńska Statystyka aktuarialna... 40 Rozkład ujemny dwumianowy jako rozkład złożony K - liczba wypadków z jednego ryzyka K P oiss(λ) N = J 1 + J 2 +... + J K - liczba szkód z jednego ryzyka (jeden wypadek może generować więcej niż jedną szkodę) Niech J i ma rozkład logarytmiczny 1 c k P (J i = k) = ln(1 c) k gdzie c (0, 1) parametr. N ma złożony rozkład Poissona MGF M J (t) = ln(1 cet ) ln(1 c) M N (t) = Ee tn = EE(e tn K) M N (t) = M K (ln M J (t)) = exp (λ(m J (t) 1)) = exp wstawiając c = q i r = ln 1 ce t 1 c λ ln(1 c) λ ln(1 c) otrzymujemy M N (t) = Zatem N bin (r, 1 q) p 1 e t (1 p) r
Agata Boratyńska Statystyka aktuarialna... 41 Estymacja parametrów rozkładu bin (r, p) N 1, N 2,..., N n i.i.d. bin (r, p) EMM rozwiązujemy układ równań stąd r(1 p) p 2 r(1 p) p = S 2 = 1 n = N n i=1 (N i N) 2 EMM(p) = N S 2 EMM(r) = N 2 S 2 N
Agata Boratyńska Statystyka aktuarialna... 42 ZADANIE. Tabela podaje liczbę kierowców w pewnej grupie ryzyka, którzy zgłosili 0,1,2,3,itd szkód w ciągu roku. k - liczba szkód n k - liczba ryzyk 0 88585 1 10577 2 779 3 54 4 4 5 1 > 5 0 Dopasuj rozkład Poissona (kierowcy stanowią grupę jednorodną) rozkład ujemny dwumianowy (kierowcy nie stanowią grupy jednorodnej, parametr λ odpowiadający za średnia liczbę wypadków waha się w populacji) wyznacz parametry α i β rozkładu gamma opisującego wahanie parametru λ w populacji i oszacuj odsetek kierowców o średniej liczbie zgłoszeń przekraczającej 0,24.
Agata Boratyńska Statystyka aktuarialna... 43 ENW Niech: m 0 = n m 1 - liczba obserwacji o wartości co najmniej 1; m 2 - liczba obserwacji o wartości co najmniej 2;... m M - liczba obserwacji o wartości co najmniej M; M - maksymalna zaobserwowana wartość, m M+1 = 0 Funkcja wiarogodności L(m 1, m 2,..., m M, n, r, p) = m M p rn (rq) m 1 m 2 r(r + 1) 2 m 3 q 2 Γ(r + M) m... 2 M!Γ(r) qm = p rn (rq) m r + 1 m 1 2 q 2 r + 2 m 3 q 3 r + M 1... M ln L = nr ln(1 q) + M m i ln q + M 1 m i+1 ln r + i i=1 i=0 i + 1 Różniczkując po r i q otrzymujemy równania n ln(1 q) + m 1 r + m 2 r + 1 +... + m M r + M 1 = 0 nr 1 q + n N = 0. q Z drugiego równania mamy p = 1 q = r r + N, wstawiając do równania pierwszego otrzymujemy równanie r n ln r + N + m 1 r + m 2 r + 1 +... + m M r + M 1 = 0, które rozwiązujemy numerycznie. m M q.
Agata Boratyńska Statystyka aktuarialna... 44 ZŁOŻONY ROZKŁAD UJEMNY DWUMIANOWY Cbin (r, p, F ) S = Y 1 + Y 2 +... + Y N i N bin (r, p), Y i F MGF P (S s) = = i=0 i=0 P (S s N = i)p (N = i) Γ(r + i) p r q i F i (s) Γ(r)i! M S (t) = Ee N ln M Y (t) = Parametry: jeśli EY i = µ, V ary i = σ 2 to p 1 qm Y (t) ES = µen = µr 1 p p V ars = r 1 p p σ2 + r 1 p µ 2 p 2 TWIERDZENIE. Jeżeli S i, i = 1, 2,..., k mają rozkłady Cbin (r i, p, F ) i są niezależne, to S = k i=1 S i ma rozkład Cbin ( k i=1 r i, p, F ). r
Agata Boratyńska Statystyka aktuarialna... 45 REZERWY TECHNICZNO-UBEZPIECZENIOWE 1) rezerwa składek 2) rezerwa na ryzyka niewygasłe 3) rezerwa na niewypłacone odszkodowania lub świadczenia, w tym rezerwa na skapitalizowaną wartość rent 4) rezerwa na wyrównanie szkodowości (ryzyka) 5) rezerwa ubezpieczeń na życie 6) rezerwa ubezpieczeń na życie, gdy ryzyko lokaty ponosi ubezpieczający 7) rezerwy na premie i rabaty dla ubezpieczonych 8) rezerwy na zwrot składek dla członków 9) inne rezerwy techniczno-ubezpieczeniowe określone w statucie. Rezerwa składek - ( UEPR - Unearned Premium Reserve) wyznaczana indywidualnie dla każdej umowy ubezpieczenia, określa część składki przeniesioną na następne okresy sprawozdawcze w związku z tym, że okres na jaki składka została przypisana nie pokrywa się z bieżącym okresem sprawozdawczym. Rezerwa składek powinna stanowić pokrycie przyszłych przewidywanych szkód, które zrealizują się po dacie bilansowej. Współczynnik przeniesienia W P - część składki przeniesiona na następne okresy sprawozdawcze Metody wyznaczania: metoda 50% metoda 1/12, 1/24 itd, metoda proporcjonalna do ryzyka.
Agata Boratyńska Statystyka aktuarialna... 46 Rezerwa na ryzyka niewygasłe - tworzona jest w zakładach ubezpieczeń działu II i stanowi swego rodzaju uzupełnienie ich rezerwy składek. Służy na pokrycie przyszłych odszkodowań, świadczeń i innych kosztów, jakie mogą powstać z zawartych umów ubezpieczenia, które nie wygasają z końcem danego okresu sprawozdawczego, a wysokość rezerwy składek może być niewystarczająca na pokrycie zobowiązań zakładu ubezpieczeń. Rezerwa na niewypłacone odszkodowania i świadczenia - zwana także rezerwą szkód, związana jest ze zobowiązaniami zakładu ubezpieczeń związanym ze szkodami, które wystąpiły w danym okresie sprawozdawczym, ale odszkodowania i świadczenia z nich wynikające jeszcze nie zostały wypłacone. Wyróżniamy trzy grupy rezerw: rezerwa na szkody zgłoszone, dla których wysokość odszkodowania została już wyznaczona, ale jeszcze nie została wypłacona; rezerwa na szkody zgłoszone, dla których wysokość odszkodowania jeszcze nie została oszacowana, rezerwa na szkody zaistniałe, ale jeszcze niezgłoszone zakładowi ubezpieczeń ( IBNR - incurred but not reported)
Agata Boratyńska Statystyka aktuarialna... 47 IBNR Trójkąt szkód liczba lat opóźnienia (j) rok zajścia szkód (i) 0 1... n 2 n 1 n 0 C 0,0 C 0,1... C 0,n 2 C 0,n 1 C 0,n 1 C 1,0 C 1,1... C 1,n 2 C 1,n 1 2 C 2,0 C 2,1... C 2,n 2........................ n 1 C n 1,0 C n 1,1 n C n,0 Metoda łańcuchowa (chain ladder) Założenia: C i,j są wartościami skumulowanymi (np: C i,j oznaczają łączną wartość szkód z roku zajścia i zgłoszoną do roku opóźnienia j włącznie, czyli C i,j = j k=0 X i,k, gdzie X i,k oznacza łączną wartość szkód z roku zajścia i zgłoszoną w roku opóźnienia k); Zmienne C i,j, C k,j dla k i są niezależne; istnieją stałe f j, j = 0 = 1, 2,..., n takie, że dla każdego i = 0, 1,..., n i dla każdego j E(C i,j+1 C i,j ) = f j+1 C i,j. Współczynniki łańcuchowe - estymatory parametrów f j b j = C 0,j + C 1,j +... + C n j,j C 0,j 1 + C 1,j 1 +... + C n j,j 1
Agata Boratyńska Statystyka aktuarialna... 48 Oszacowanie dolnego trójkąta wartości skumulowanych gdzie j > n i Ĉ i,j = C i,n i b n i+1... b j Uwagi: metoda Chain Ladder była opracowana jako algorytm bez podstaw teoretycznych (metoda heurystyczna) i została rozpowszechniona jeszcze zanim rozwój metod statystycznych w XX wieku w dużym stopniu wpłynął na kształt praktyki ubezpieczeniowej; metoda nie uwzględnia inflacji; pojawienie się danej nietypowej (dana katastoficzna) może drastycznie zmienić wyniki (metoda nieodporna); metoda nie uwzględnia być może występującego trendu związanego z latami zajścia szkód; dane powinny być zdyskontowane na jeden okres; do szacowania rezerw należy dodatkowo uwzględnić przyszłe zyski i inflację; współczynniki łańcuchowe b j są estymatorami nieobciążonymi współczynników f j ; własności statystyczne współczynników wyznaczonych metodą Chain Ladder podają między innymi prace: T. Mack, Distribution-free Calculation of the Standard Error of Chain-Ladder Reserve Estimates, ASTIN Bulletin 23(2), 1993, Przy założeniu X ij P oiss(α i β j ), gdzie β j = 1, oraz X ij niezależne, predyktory C in otrzymane w oparciu o estymatory największej wiarogodności parametrów pokrywają się z predyktorami otrzymanymi metoda łańcuchową.
Agata Boratyńska Statystyka aktuarialna... 49 ROZKŁADY WARTOŚCI SZKÓD Podstawowe własności: rozkłady skupione na dodatniej półosi X 0; rozkłady ciągłe, przy limicie odpowiedzialności rozkłady mieszane P (X = M) > 0, gdzie M limit odpowiedzialności; rozkłady prawostronnie asymetryczne, często z grubymi ogonami.
Agata Boratyńska Statystyka aktuarialna... 50 Podstawowe rozkłady Rozkład gęstość F (x) EX V arx wykładniczy θe θx 1 e θx 1 1 θ θ 2 Ex(θ) θ > 0 x > 0 β Gamma(α, β) α Γ(α) xα 1 e βx α α Γ(α, βx) β β 2 α, β > 0 x > 0 β IGamma(α, β) α Γ(α) x α 1 e β x Γ(α, β x ) β β 2 α 1 (α 1) 2 (α 2) α, β > 0 x > 0 β α τ Γ(α+ 1 τ ) EX 2 = Γ(α+ 2 Γ(α)β τ 1 τ ) Γ(α)β τ 2 T Gamma(α, β, τ) Γ(α) xατ 1 e βxτ Γ(α, βx τ ) α, β, τ > 0 x > 0 β α (ln x) α 1 ( ) α ( ) α ( ) 2α β β β 1 β 2 β β 1 LG(α, β) x β+1 Γ(α) Γ(α, β ln x) α, β > 0 x > 0 β > 1 β > 2 λ P areto(θ, λ) θ θ (λ+x) 1 λθ λ θ+1 (λ+x) θ θ 1 λ, θ > 0 x > 0 θ > 1 θ > 2 exp[ 1 2 ( ln x µ σ ) 2 ] LN(µ, σ) xσ 2π µ R, σ > 0 x > 0 λ 2 θ (θ 1) 2 (θ 2) ln x µ Φ( σ ) e µ+ 1 2 σ2 e 2µ+σ2 (e σ2 1) Burr(θ, λ, τ) τθλ θ xτ 1 (λ+x τ ) θ+1 1 ( λ λ+x τ ) θ λ 1 τ Γ(θ 1 τ )Γ(1+ 1 τ ) Γ(θ) EX 2 = τ, λ, θ > 0 x > 0 τθ > 1 λ 2 τ Γ(θ 2 τ )Γ(1+ 2 τ ) Γ(θ) τθ > 2 W eibull(c, τ) cτx τ 1 e cxτ 1 e cxτ Γ(1+ 1 τ ) c 2/τ c, τ > 0 x > 0 Γ(θ+τ)λ GP areto θ x τ 1 λτ Γ(θ)Γ(τ)(λ+x) B(τ, θ, u) θ+τ θ 1 (θ, λ, τ) u = x x+λ θ > 1 θ > 2 IP areto(θ, γ) θ > 0, γ > 0 γθx θ 1 (γ+x) θ+1 ( x γ+x ) θ c 1/τ Γ(1+ 2 τ ) Γ(1+ 1 τ ) λ 2 τ(θ+τ 1) (θ 1) 2 (θ 2)
Agata Boratyńska Statystyka aktuarialna... 51 ZALEŻNOŚCI MIĘDZY ROZKŁADAMI Funkcje od zmiennych losowych: mnożenie przez stałą - parametr skali F Y (y) = P PRZYKŁAD ( X y ) c Y = cx ( ) y = F X c f Y (y) = 1 c f X 1) X Ex(1) = Y = cx EX( 1 c ) 2) X Gamma(α, 1) = Y = X β Gamma(α, β) 3) X W eibull(1, τ) = Y = X a W eibull(aτ, τ) przekształcenie wykładnicze Y = e X ( ) y c F Y (y) = P (X ln y) = F X (ln y) f Y (y) = 1 y f X(ln y) PRZYKŁAD X N(µ, σ 2 ) = Y = e X LN(µ, σ 2 ) przekształcenie potęgowe τ > 0 - rozkład transformowany Y = X 1 τ τ < 0 - rozkład odwrócony transformowany τ = 1 - rozkład odwrócony F Y (y) = F X (y τ ) f Y (y) = f X (y τ ) τy τ 1
Agata Boratyńska Statystyka aktuarialna... 52 PRZYKŁAD 1. X Ex(θ) = Y = X 1 τ W eibull(θ, τ) 2. X Gamma(α, β). = Y = X 1 IGamma(α, β) 3. X P areto(θ, λ) = Y = X 1 τ Burr, τ > 0 mieszanki rozkładów mieszanki dyskretne: f 1, f 2,..., f k - gęstości zmiennych X 1, x 2,..., X k p 1, p 2,..., p k > 0, p i = 1 - wagi Y zmienna o rozkładzie z gęstością f = p i f i mieszanki ciągłe - ryzyka heterogeniczne: f θ (x) = f(x θ), θ Π wtedy f(x) = Θ f θ(x)π(dθ) PRZYKŁAD: X Ex(γ) i γ Gamma(θ, λ) rozkład brzegowy X - P areto(θ, λ) X Gamma(τ, β) i β Gamma(θ, λ) rozkład brzegowy X - GP areto(θ, λ, τ)
Agata Boratyńska Statystyka aktuarialna... 53 OGON ROZKŁADU Funkcją przeżycia zmiennej X o gęstości f i dystrybuancie F nazywamy funkcję S(x) = 1 F (x) = F (x) Duża wartość S dla dużych x - ciężki ogon Porównywanie ogonów zmiennych X i Y : to X cięższy ogon niż Y S X (x) lim x + S Y (x) = + to X lżejszy ogon niż Y S X (x) lim x + S Y (x) = 0 PRZYKŁAD: Porównaj ogony rozkładów: Gamma, Pareto, Lognormalnego, Weibulla Średnia długość przyszła życia (średnia nadwyżka szkody ponad wartość x) e(x) = E(X x X > x) = + x S(t)dt S(x), założenie EX < +. Duże e(x) dla dużych x świadczy o grubym ogonie. Estymator próbkowy ê n (x) = xj >x(x j x) {x j > x}
Agata Boratyńska Statystyka aktuarialna... 54 Estymator w oparciu o szereg rozdzielczy: ê n (c i ) = x>ci (x c i ) n(1 F n (c i )) = j>i c j n j j>i n j c i PRZYKŁADY: X Ex(λ), wtedy e(x) = 1 λ X P areto(θ, λ) wtedy e(x) = λ+x θ 1 X LN(µ, σ 2 ) wtedy e(x) = exp ( ) ln x µ σ 2 µ + 1 1 Φ 2 σ2 σ 1 Φ ( ) x ln x µ σ
Agata Boratyńska Statystyka aktuarialna... 55 MODELE Z NIEKOMPLETNYMI DANYMI, DANE OBCIĘTE I OKROJONE (FRANSZYZA WARUNKOWA I BEZWARUN- KOWA, LIMIT ODPOWIEDZIALNOŚCI) dane obcięte - brak obserwacji z pewnego zakresu dane okrojone - znana jest liczba obserwacji z pewnego zakresu ale nie znane są konkretne wartości PRZYKŁADY: X - szkoda 1. limit odpowiedzialności Y = X M próbka Y 1, Y 2,..., Y n - dane okrojone 2. franszyza warunkowa płatność dla szkody Y = gdy X < M gdy X M 0 gdy X < d X gdy X d próbka Y 1, Y 2,..., Y n - dane okrojone ale często ubezpieczyciel nie ma informacji o szkodach mniejszych niż d płatność ubezpieczyciela V = X gdy X > d próbka V 1, V 2,..., V m - dane obcięte
Agata Boratyńska Statystyka aktuarialna... 56 3. franszyza bezwarunkowa płatność dla szkody Y = 0 gdy X < d X d gdy X d próbka Y 1, Y 2,..., Y n - dane okrojone ale często ubezpieczyciel nie ma informacji o szkodach mniejszych niż d płatność ubezpieczyciela V = X d gdy X > d próbka V 1, V 2,..., V m - dane obcięte 4. Płatność reasekuratora przy płatności ubezpieczyciela do limitu odpowiedzialności M płatność dla szkody Z = 0 gdy X < M X M gdy X M próbka Z 1, Z 2,..., Z n - dane okrojone ale często reasekurator nie ma informacji o szkodach mniejszych niż M płatność reasekuratora W = X M gdy X > M próbka W 1, W 2,..., W m - dane obcięte
Agata Boratyńska Statystyka aktuarialna... 57 Funkcja wiarogodności i wartość oczekiwana X zmienna o dystrybuancie F i gęstości f 1. X gdy X < M Y = M gdy X M próbka: Y 1, Y 2,..., Y n o wartościach mniejszych niż M, k liczba obserwacji o wartości M funkcja wiarogodności L(y 1, y 2,..., y n, k) = n EY = E(X M) = M 0 Współczynnik eliminacji szkody 2. LER X (M) = i=1 f(y i ) (1 F (M)) k xf(x)dx + M(1 F (M)) E(X M) EX 0 gdy X < d Y = X gdy X d próbka Y 1, Y 2,..., Y m większe od 0, k - liczba obserwacji o wartości 0 - dane okrojone funkcja wiarogodności L(y 1, y 2,..., y m, k) = m EY = + d i=1 xf(x)dx f(y i )F (d) k Jeśli dane obcięte V 1, V 2,..., V m czyli dotyczące zmiennej V = X gdy X > d, to funkcja wiarogodności m L(v 1, v 2,..., v m ) = i=1 f(v i ) (1 F (d)) m
Agata Boratyńska Statystyka aktuarialna... 58 3. EV = + d xf(x)dx 1 F (d) = e X (d) + d 0 gdy X < d Y = X d gdy X d próbka Y 1, Y 2,..., Y m większe od 0, k - liczba obserwacji o wartości 0 - dane okrojone funkcja wiarogodności L(y 1, y 2,..., y m, k) = m i=1 f(y i + d)f (d) k EY = + (x d)f(x)dx = e d X (d)(1 F (d)) Jeśli dane obcięte V 1, V 2,..., V m czyli dotyczące zmiennej V = X d gdy X > d, to funkcja wiarogodności L(v 1, v 2,..., v m ) = EV = + d (x d)f(x)dx 1 F (d) m i=1 f(v i + d) (1 F (d)) m = e X (d)
Agata Boratyńska Statystyka aktuarialna... 59 Przydatne wiadomości ze statystyki ESTYMACJA PARAMETRYCZNA EMM (estymacja metodą momentów) X 1, X 2,..., X n i.i.d z rozkładu P θ, θ- nieznany parametr 1. θ R (jednowymiarowa przestrzeń parametrów), rozwiąż: E θ X = X 2. θ = (θ 1, θ 2,..., θ k ) (k-wymiarowa przestrzeń parametrów), rozwiąż układ: gdzie µ = E θ X. Przykład: E θ X = X V ar θ X = S 2 E θ (X µ) 3 = 1 (Xi n X) 3...... E θ (X µ) k = 1 (Xi n X) k X = (X 1, X 2,..., X n ) X i LN(µ, σ), EMM(µ) =? i EMM(σ 2 ) =?. Otrzymujemy układ: St ad: X 2 ˆµ = ln (S 2 + X 2 ) 1 2 e µ+ 1 2 σ2 = X e 2µ+σ2 (e σ2 1) = S 2 ˆσ 2 = ln S2 X + 1 2 Estymatory parametrów możemy również otrzymać wykorzystując własność: X LN(µ, σ) Y = ln X N(µ, σ). Niech Y i = ln X i, wtedy ˆµ = Ȳ i ˆσ2 = S 2 Y. Zad: Wyznaczyć EMM parametrów w rozkładzie P areto(θ, λ).
Agata Boratyńska Statystyka aktuarialna... 60 Rozwiązanie: Otrzymujemy układ: Stąd: ˆθ = 2S2 S 2 X i ˆλ = X(ˆθ 1). 2 λ θ 1 = X λ 2 θ (θ 1) 2 (θ 2) = S2
Agata Boratyńska Statystyka aktuarialna... 61 EMK (estymacja metodą kwantyli) X 1, X 2,..., X n i.i.d z rozkładu P θ, θ- nieznany parametr 1. θ R (jednowymiarowa przestrzeń parametrów), rozwiąż: 2. θ = (θ 1, θ 2 ), rozwiąż układ: q 1 2 (θ) = Q 1 2 F θ(q 1 2 ) = 1 2 lub układ równoważny: q 1 4 (θ) = Q 1 4 i q 3 4 (θ) = Q 3 4 F θ (Q 1 4 ) = 1 4 i F θ (Q 3 4 ) = 3 4 3. θ = (θ 1, θ 2, θ 3 ). Otrzymujemy układ: F θ (Q 1 4 ) = 1 4 i F θ (Q 1 2 ) = 1 2 i F θ (Q 3 4 ) = 3 4 4. θ = (θ 1, θ 2, θ 3, θ 4 ). Rozważamy kwantyle rzędu 1 8, 3 8, 5 8 i 7 8.
Agata Boratyńska Statystyka aktuarialna... 62 Przykład: Niech X 1, X 2,..., X n i.i.d z rozkładu W eibull(c, τ). Otrzymujemy układ: 1 e cqτ 1 4 = 1 4 i 1 e cqτ 3 4 = 3 4. St ad Estymatory mają postać: ln 0.75 = cq τ 1 Q 1 4 Q 3 4 4 τ ˆτ = log Q 14 Q 34 i ln 0.25 = cq τ 3 4 = ln 0.75 ln 0.25 ( ) ln 0.75 ln 0.25 ĉ = ln 0.75 Qˆτ 1 4
Agata Boratyńska Statystyka aktuarialna... 63 EMNW (estymacja metodą największej wiarogodności) Niech X będzie obserwowaną zmienną losową o gęstości f θ (x), gdzie θ jest nieznanym parametrem. Funkcją wiarogodności nazywamy funkcję L(θ, x) = f θ (x) Estymatorem największej wiarogodności parametru θ (EN W (θ)) nazywamy argument maksimum funkcji L jako funkcji θ, ENW (θ) = arg max L(θ, x). θ Zachodzi: arg max θ L(θ, x) = arg max θ ln L(θ, x). Jeżeli θ = (θ 1,..., θ k ) jest parametrem ciągłym i L jest funkcją różniczkowalną, to ENW wyznaczamy rozwiązując układ równań: lub równoważny układ: L(θ, x) θ j = 0, j = 1, 2,..., k ln L(θ, x) θ j = 0, j = 1, 2,..., k. Własności i uwagi: 1. Niech X 1, X 2,..., X n i.i.d z rozkładu o gęstości f θ, gdzie θ jest nieznanym parametrem. Przy pewnych warunkach regularności, jeżeli układ równań Σ n ln L(θ, X i ) i=1 = 0, j = 1, 2,..., k θ j ma dokładnie jedno rozwiązanie, to jest ono ENW (θ) i jest to estymator zgodny. 2. Jeżeli dodatkowo istnieją 2 ln L(θ,x) θ, j = 1, 2,..., k i spełnione są założenia umożliwiające zamianę kolejności operacji różniczkowania po θ j 2 j lub 2 θ 2 j i całkowania i I(θ) jest dodatnio określona, to EN W (θ) jest asymptotycznie normalny i asymptotyczna macierz kowariancji ma postać I 1 (θ), gdzie I(θ) = E ln f θ(x) θ θ i ln f θ(x) θ j i,j=1...k
Agata Boratyńska Statystyka aktuarialna... 64 jest informacją Fishera. Uwaga: Jeżeli θ R, to I(θ) = E θ ( ln fθ (X) θ ) 2 ( ) = 2 ln f θ (X) Eθ θ. 2 3. Jeżeli g jest różniczkowalna i g (θ) 0 i ˆθ n jest ENW (θ) opartym na próbie n-elementowej asymptotycznie normalnym, to g(ˆθ) = ENW (g(θ)) i (g(ˆθ n ) g(θ)) n N(0, [g (θ)] 2 I 1 (θ)). Zad. Wyznacz asymptotyczną macierz kowariancji dla EN W w modelu lognormalnym. Stąd ln L(µ, σ, X) = ln X 0.5 ln(2π) 0.5 ln σ 2 2 ln L = 1 µ 2 σ 2 2 ln L (σ 2 ) = 1 (ln X µ)2 2 2σ4 σ 6 2 ln L X µ) = (ln µ σ2 σ 4 I(µ, σ 2 ) 1 = σ2 0 0 σ 4 (ln X µ)2 2σ 2
Agata Boratyńska Statystyka aktuarialna... 65 ESTYMACJA W PRZYPADKU GDY DANE SĄ POGRUPOWANE Szereg rozdzielczy przedziały liczebności częstości (c 0, c 1 ] n 1 f 1 = n 1 n (c 1, c 2 ] n 2 f 2 = n 2 n......... (c k 1, c k ] n k f k = n k n Zakładamy, że nie obserwujemy wartości poniżej c 0 i wypłacamy max c k. Funkcja wiarogodności: L(θ) = lub za pomocą dystrybuanty: ( cl c l 1 f θ (x)dx ) n l ( ck c 0 f θ (x)dx ) n L(θ) = [F t(c l ) F θ (c l 1 )] n l [F θ (c k ) F θ (c 0 )] n W szczególności może być F θ (c 0 ) = 0 i F θ (c k ) = 1. Wyznaczamy θ dla którego L(θ) lub ln L(θ) osiąga max. Wykorzystujemy metody numeryczne dla znalezienia punktu zerowania się pochodnej np metodę Newtona.
Agata Boratyńska Statystyka aktuarialna... 66 ESTYMACJA PRZEDZIAŁOWA Niech X 1, X 2,..., X n i.i.d. z rozkładu o gęstości f θ (x), θ - nieznany parametr Niech ˆθ = ENW (θ) i ˆθ ma asymptotyczny rozkład normalny z wariancją asymptotyczną I(θ) 1. Wtedy ˆθ N(θ, (ni(θ)) 1 ) dla dużych n. Dodatkowo I(ˆθ) jest estymatorem zgodnym funkcji I(θ), stąd (ˆθ θ ) ni(ˆθ) N(0, 1). Otrzymujemy więc asymptotyczny przedział ufności dla θ na poziomie ufności 1 α postaci Przykład: ˆθ u 1 α 2 1 ni(ˆθ), ˆθ + u 1 α 2 1 ni(ˆθ) Niech X 1, X 2,..., X n i.i.d. z rozkładu Weibulla o gęstości f θ (x) = θx exp( θx2 2 ), θ > 0 - nieznany parametr. Funkcja. ln L(θ) = n ln θ + Σ ln x i θ 2 Σx2 i a stąd oraz I(θ) = E θ 2 ln f θ (X) θ 2 ENW (θ) = 2n Σx 2 i = E θ 2 (ln θ θx2 θ 2 2 ) = 1 θ 2. Otrzymujemy przedział ufności dla θ 2n Σx 2 i n u1 α 2, 2n n Σx 2 i n + u1 α 2. n
Agata Boratyńska Statystyka aktuarialna... 67 Zauważmy, że w tym modelu niekoniecznie musieliśmy wyznaczać EN W (I(θ)). Z własności asymptotycznych EN W (θ) mamy Stąd przy n P (ENW (θ) θ) n θ ENW (θ) θ 1 N(0, 1) n u1 α 1 α Przekształcając nierówność i wstawiając postać EN W (θ) otrzymujemy przedział 2n n Σx 2, 2n n i n + u1 α Σx 2 2 i n u1 α 2 Korzystając z własności, że ENW (g(θ)) = g(ˆθ), gdzie ˆθ = ENW (θ), i (przy odpowiednich warunkach regularności ) ( ) ( g(ˆθ) g(θ) n N 0, [g (θ)] 2 I 1 (θ) ) w analogiczny sposób otrzymujemy asymptotyczny przedział ufności dla funkcji g(θ) na poziomie ufności 1 α. 2
Agata Boratyńska Statystyka aktuarialna... 68 TESTOWANIE HIPOTEZ O ZGODNOŚCI Niech X 1, X 2,..., X n i.i.d. z rozkładu o nieznanej dystrybuancie F H 0 : F = F 0, F 0 ustalona 1. Test Kołmogorowa-Smirnowa Założenie: F 0 - ciągła, ściśle rosnąca dystrybuanta Statystyka testowa: D n = sup F n (t) F 0 (t), t R gdzie F n (t) = F n (X 1, X 2,..., X n, t) jest dystrybuantą empiryczną. gdzie D + n = max i=1...n ( i n z i) w przypadku szeregu przedziałowego D + n = max i=1...k (F n(c i ) F 0 (c i )) D n = max(d + n, D n ) D n = max i=1...n (z i i 1 n ) z i = F 0 (x i:n ) D n = max i=1...k (F 0(c i ) F n (c i 1 )) TEST: Jeżeli D n > c(α, n), to hipotezę H 0 odrzucamy. Wybór c(α, n): Rozkład statystyki D n przy prawdziwości hipotezy H 0 nie zależy od postaci F 0. Zatem c(α, n) są stablicowane. Dla n dużych korzystamy z wartości przybliżonych, kilka z nich podaje Tabela poniżej. α 0.20 0.10 0.05 0.01 c 1.07/ n 1.22/ n 1.36/ n 1.63/ n
Agata Boratyńska Statystyka aktuarialna... 69 2. Test Chi-kwadrat F 0 - dystrybuanta rozkładu dyskretnego, wtedy rozkład zmiennej X skupiony jest w punktach a 1, a 2,..., a k. Niech p j = P (X = a j ). Niech N j =liczba elementów próby losowej równych a j. Statystyka testowa: χ 2 = Σ k (N j np j ) 2 j=1 np j. Jeżeli n, to zmienna losowa χ 2 dąży według rozkładu do zmiennej losowej o rozkładzie Chi-kwadrat o k 1 stopniach swobody (χ 2 k 1) TEST: H 0 odrzucamy, gdy χ 2 1 α w rozkładzie χ 2 k 1. F 0 - dystrybuanta rozkładu ciągłego. > χ 2 k 1(α), gdzie χ 2 k 1(α) kwantyl rzędu Dzielimy nośnik rozkładu na k przedziałów o końcach c 0, c 1,..., c k. Niech p j = F 0 (c j ) F 0 (c j 1 ), N j =liczba elementów próby należących do przedziału (c j 1, c j ]. Następnie stosujemy test jak przy rozkładzie dyskretnym. Uwaga: Hipotezy złożone. Jeżeli H 0 : F {F θ : θ Θ}, to najpierw estymujemy parametr θ (np. stosując EN W ). Jeżeli estymujemy parametr d wymiarowy, to asymptotyczny rozkład statystyki χ 2 jest rozkładem Chi-kwadrat o k d 1 stopniach swobody.
Agata Boratyńska Statystyka aktuarialna... 70 TESTOWANIE HIPOTEZ PARAMETRYCZNYCH (testy oparte na ilorazie wiarogodności) Niech X 1, X 2,..., X n i.i.d. z rozkładu P θ, θ Θ Statystyka testowa: lub gdzie L(θ) funkcja wiarogodności. Obszar krytyczny: lub H 0 : θ Θ 0 H 1 : θ Θ 1 = Θ Θ 0 Λ 0 = sup θ Θ 1 L(θ) sup θ Θ0 L(θ) Λ = sup θ Θ L(θ) sup θ Θ0 L(θ), K = {(x 1, x 2,..., x n ) : Λ > λ(α)} K = {(x 1, x 2,..., x n ) : Λ 0 > c(α)}, gdzie λ(α), c(α) wartości krytyczne dobrane tak by θ Θ 0 P θ (K) α.