Agata Boratyńska Statystyka aktuarialna... 1 Statystyka aktuarialna i teoria ryzyka LITERATURA Bowers N. i in. (1986 lub 1997) Actuarial mathematics, Hossak J.B., Pollard J.H. (1983 lub 1990), Introductory statistics with applications in general insurance, Cambridge University Press. Straub E. (1997), Non-Life Insurance Mathematics, Springer, Berlin-Heidelberg. Otto W. (2004), Ubezpieczenia majątkowe; t. I - Teoria ryzyka, WN-T, Warszawa. Zarządzanie ryzykiem w ubezpieczeniach, red. Ronka- Chmielowiec W., Wyd. AE we Wrocławiu, Wrocław 2000. Kaas, R., Goovaerts, M., Dhaene, J., Denuit, M. (2001), Modern Actuarial Risk Theory, Kluwer Academic Publishers, Boston. Kowalczyk P., Poprawska E., Ronka-Chmielowiec W. (2006), Metody aktuarialne, zastosowania matematyki w ubezpieczeniach, PWN, Warszawa. Klugman S., Panjer H., Willmot G. (1998) Loss Models, From Data to Decisions, Wiley
Agata Boratyńska Statystyka aktuarialna... 2 Ubezpieczenie - urządzenie gospodarcze zapewniające pokrycie przyszłych potrzeb majątkowych, wywołanych u poszczególnych jednostek przez zdarzenia losowe, w drodze rozłożenia ciężaru tego pokrycia na wiele jednostek, którym te same zdarzenia zagrażają. Umowa ubezpieczeniowa (polisa) - umowa między ubezpieczanym (ubezpieczającym) a ubezpieczycielem (zakładem ubezpieczeń) w której ubezpieczany zobowiazuje się uiścić opłatę - składkę ubezpieczeniową (jednorazowo lub ratalnie) na rzecz zakładu ubezpieczeń, zakład ubezpieczeń zobowiązuje się do wypłacenia w razie zajścia wypadku ubezpieczeniowego określonego w polisie lub w ściśle określonym terminie sumy ubezpieczenia, wartości ubezpieczenia, odszkodowania na rzecz określonych w ubezpieczeniu osób. Reasekuracja - ubezpieczenie jednego zakładu ubezpieczeń w innym na wypadek zbyt dużych roszczeń
Agata Boratyńska Statystyka aktuarialna... 3 Wskaźniki: ekonomiczno - ubezpieczeniowe: B Y gdzie B - suma składek, Y - dochód narodowy B m O m gdzie B m - suma składek na ubezpieczenia majątkowe, O m - suma o jaką zwiększyły się oszczędności, wskaźnik mówi o skłonności do zawierania ubezpieczeń; wskaźnik powszechności = liczba ubezpieczonych pole ubezpieczeń wskaźnik pełności = odszkodowania wypłacone suma rzeczywistych szkód
Agata Boratyńska Statystyka aktuarialna... 4 wskaźniki techniczno-ubezpieczeniowe: wskaźnik szkodowości losowej = S U gdzie S - suma odszkodowań wypłaconych, U - suma ubezpieczenia szkodowość (szkodowość finansowa) = S B stopa zmiany szkodowości = szkodowość oczekiwana szkodowość 1 wskaźnik kosztów = Koszty B wskaźnik częstości = c = N n gdzie N - liczba wypadków, n - liczba ubezpieczonych wskaźnik rozszerzalności = liczba szkód N
Agata Boratyńska Statystyka aktuarialna... 5 Rozkład gęstość f(x) F (x) EX V arx ( ) bin(n, θ) n x θ x (1 θ) n x nθ nθ(1 θ) θ (0, 1) x = 0, 1,..., n λ λx P oiss(λ) e x! λ λ λ > 0 x = 0, 1, 2,... bin Γ(r+x) (r, p) x!γ(r) pr (1 p) x r(1 p) r(1 p) p p 2 r > 0, p (0, 1) x = 0, 1, 2,... Γ(α+β)x Beta(α, β) α 1 (1 x) β 1 α Γ(α)Γ(β) B(α, β, x) α+β α, β > 0 x (0, 1) x (0, 1) N(µ, σ 2 ) 1 2πσ exp ( ) (x µ) 2 2σ 2 αβ (α+β) 2 (α+β+1) Φ( x µ σ ) µ σ2 σ > 0 wykładniczy θe θx 1 e θx 1 θ Ex(θ) θ > 0 x > 0 β Gamma(α, β) α Γ(α) xα 1 e βx α Γ(α, βx) β α, β > 0 x > 0 β IGamma α Γ(α) x α 1 e β x Γ(α, β x ) β α 1 α, β > 0 x > 0 β α τ T Gamma Γ(α) xατ 1 e βxτ Γ(α, βx τ ) α, β, τ > 0 x > 0 β α (ln x) α 1 Γ(α+ 1 τ ) Γ(α)β 1 τ 1 θ 2 α β 2 β 2 (α 1) 2 (α 2) EX 2 = Γ(α+ 2 τ ) Γ(α)β 2 τ ( ) α ( ) α ( ) 2α β β β 1 β 2 β β 1 LG(α, β) x β+1 Γ(α) Γ(α, β ln x) α, β > 0 x > 0 β > 1 β > 2 λ P areto(θ, λ) θ θ (λ+x) 1 λθ λ θ+1 (λ+x) θ θ 1 λ, θ > 0 x > 0 θ > 1 θ > 2 exp[ 1 2 ( ln x µ σ ) 2 ] LN(µ, σ) xσ 2π µ R, σ > 0 x > 0 Burr(θ, λ, τ) τθλ θ xτ 1 (λ+x τ ) θ+1 1 ( λ λ 2 θ (θ 1) 2 (θ 2) ln x µ Φ( σ ) e µ+ 1 2 σ2 e 2µ+σ2 (e σ2 1) ) θ Γ(θ 1 λ+x τ τ )Γ(1+ 1 τ ) λ 1 τ Γ(θ) τ, λ, θ > 0 x > 0 τθ > 1 EX 2 = λ 2 τ Γ(θ 2 τ )Γ(1+ 2 τ ) Γ(θ) τθ > 2 W eibull(c, τ) cτx τ 1 e cxτ 1 e cxτ Γ(1+ 1 τ ) c 2/τ c, τ > 0 x > 0 Γ(θ+τ)λ GP areto θ x τ 1 λτ Γ(θ)Γ(τ)(λ+x) B(τ, θ, u) θ+τ θ 1 (θ, λ, τ) u = x x+λ θ > 1 θ > 2 c 1/τ Γ(1+ 2 τ ) Γ(1+ 1 τ ) λ 2 τ(θ+τ 1) (θ 1) 2 (θ 2)
Agata Boratyńska Statystyka aktuarialna... 6 ILE JESTEŚMY SKŁONNI ZAPŁACIĆ ZA UBEZ- PIECZENIE u - funkcja użyteczności, awersja do ryzyka - u > 0, u < 0 PRZYKŁAD: u(w) = ln w, u(w) = exp( βw), u(w) = w βw 2 Rozważmy ubezpieczenie pełne majątku w narażonego na stratę losową X, wtedy maksymalna opłata H za ubezpieczenie spełnia E (u(w X)) = u(w H) Przy u odpowiadającej awersji do ryzyka H spełnia H > EX.
Agata Boratyńska Statystyka aktuarialna... 7 ZADANIE 1. Dwa zakłady ubezpieczeniowe A i B posługują się funkcją użyteczności u(w). Zakład A dysponuje kapitałem 10 8 ECU, zakład B kapitałem 6 10 7 ECU. Zakłady A i B otrzymały ofertę ubezpieczenia statku o wartości 2 10 7 ECU od całkowitego zniszczenia (zatonięcia). Prawdopodobieństwo tego zdarzenia jest równe q. 1. Wyznacz składkę minimalną jaką powinny ustalić zakłady pracując a) oddzielnie (każdy sam ubezpiecza cały statek) b) wspólnie ( dwa przypadki: koasekuracja po równo, koasekuracja proporcjonalna do majątku). Przyjmij q = 0.1, 0.01, 0.009, 0.001 u(w) = 1 2 w 2. Wyznacz maksymalne akceptowane składki dla ubezpieczającego się, gdy wartość jego całkowitego majątku jest równa 21 10 6, 60 10 6, 100 10 6, 200 10 6, 500 10 6, 1000 10 6 Rozważ dwie funkcje użyteczności u(w) = 1 2 w u(w) = ln w
Agata Boratyńska Statystyka aktuarialna... 8 GENEROWANIE ZMIENNYCH LOSOWYCH O USTALONYM ROZKŁADZIE Wieczorkowski R., Zieliński R. (1997), Komputerowe generatory liczb losowych, WNT, Warszawa. Funkcja LOS() - generuje zmienną U U(0, 1) X - zmienna o rozkładzie dyskretnym gdzie p i = 1. Niech X w 1 w 2... w k P (X = w i ) p 1 p 2... p k f 0 = 0, f i = f i 1 + p i, i = 1, 2,..., k ALGORYTM: 1. generuj U U(0, 1); 2. jeśli U (f i 1, f i ], to X := w i. X - zmienna o rozkładzie ciągłym i ściśle rosnącej dystrybuancie F LEMAT. Jeżeli X F i F jest ciągłą i ściśle rosnącą dystrybuantą, to zmienna F (X) ma rozkład jednostajny U(0, 1). DOWÓD. Wyznaczmy dystrybuantę zmiennej F (X) w punkcie z P (F (X) z) = P ( X F 1 (z) ) = F (F 1 (z)) = z dla z (0, 1).
Agata Boratyńska Statystyka aktuarialna... 9 ALGORYTM: 1. generuj U U(0, 1); 2. X := F 1 (U). ZADANIE. Wygeneruj po n = 50 wartości zmiennych losowych o rozkładach: 1. zero-jedynkowym P (X = 1) = 0, 1; 2. równomiernym o wartościach 1, 2, 3, 4, 5; 3. Ex(2); Gamma(2, 4); 4. P areto(3, 2); 5. N(0, 1); N(2, 9). Wyznacz EX, V arx oraz odpowiedniki próbkowe. Zadanie powtórz dla n = 200. Wykorzystywanie własności i zależności między zmiennymi 1. PROCEDURA log and trig - generuje zmienne z rozkładu nomalnego Jeżeli U, V sa niezależnymi zmiennymi losowymi z rozkładu U(0, 1), to X = 2 ln U cos(2πv ) Y = 2 ln U sin(2πv ) są niezależnymi zmiennymi losowymi z rozkładu N(0, 1). ZADANIE. Wygeneruj po 50 wartości zmiennych losowych o rozkładach N(2, 9) i N(4, 5) korzystając z procedury log and trig. 2. Jeżeli X Ex(c), to Y = X τ 1 ma rozkład Weibulla o gęstości f(x) = cτx τ 1 exp( cx τ ).
Agata Boratyńska Statystyka aktuarialna... 10 3. Jeżeli X 1, X 2,..., X k są i.i.d. z rozkładu N(0, 1), to Z = k i=1 X i ma rozkład chi-kwadrat z k stopniami swobody 4. Jeżeli X 0, X 1, X 2,... są i.i.d. z rozkładu Ex(1) to N = min j : j i=0 X i > λ jest zmienną losową o rozkładzie Poissona o wartości oczekiwanej λ. DOWÓD. k i=0 X i Gamma(k + 1, 1) P (N = k) = P (N k) P (N k 1) = P k i=0 X i > λ P + 1 λ k! xk e x dx + λ całkując przez części otrzymujemy P (N + k) = 1 k! xk e x k 1 i=0 X i > λ 1 (k 1)! xk 1 e x dx + λ = e λλk k! ALGORYTM: 1. N := 1; S := 0; 2. dopóki S λ powtarzaj generuj X Ex(1); S := S + X; N := N + 1; 3. zwróć N.
Agata Boratyńska Statystyka aktuarialna... 11 Wykorzystanie rozkładów granicznych do generowania zmiennej o rozkładzie Poissona Z CTG: jeżeli N P oiss(λ) i λ +, to N λ λ N(0, 1) ALGORYTM: 1. generuj Z N(0, 1); 2. N := λz + λ. Aproksymacja Anscombe jeżeli N P oiss(λ) i λ +, to gdzie P (N k) Φ (A λ (k)) A λ (k) = 3 k + 5 2 8 2 3 λ 1 6 3 2 λ + 1 ALGORYTM: 1. generuj Z N(0, 1); 2. N := (Z + b) 3 2a c, gdzie b = 1, 5 λ 1 24 λ, a = 8 27 24 λ λ, c = 5 8 ZADANIE. Wygeneruj po 50 wartości zmiennych losowych z rozkładów P oiss(1), P oiss(2), P oiss(20), P oiss(100).
Agata Boratyńska Statystyka aktuarialna... 12 PODZIAŁ RYZYKA (RODZAJE POLIS) strata, wypadek ubezpieczeniowy (loss), roszczenie (claim) X, S - zmienna losowa odszkodowanie (indemnity) I(X) - zmienna losowa, - ubezpieczenie pełne 0 I(X) X I(X) = X Wtedy EI(X) = EX i V ari(x) = V arx - pokrycie częściowe 0 I(X) < X U = X I(X) - udział ubezpieczonego w szkodzie PRZYKŁAD: Wartość szkody x 0 2 4 9 Odszkodowanie I(x) 0 0,4 2 6 P (X = x) 0,8 0,1 0,06 0,04 Wyznacz EX, V arx, EI(X), V ari(x) EX = 0, 8 V arx = 3, 96 EI(X) = 0, 4 V ari(x) = 1, 536
Agata Boratyńska Statystyka aktuarialna... 13 1. Kontrakt proporcjonalny I(X) = ax a (0, 1) 2. Polisa z franszyzą integralną (warunkową) I(X) = 0 gdy X < d X gdy X d 3. Polisa z udziałem własnym d (z franszyzą redukcyjną - bezwarunkową, stop-loss, deductible) I(X) = 0 gdy X < d X d gdy X d 4. Polisa z udziałem własnym d i górnym limitem odpowiedzialności M I(X) = 0 gdy X < d X d gdy d X M M d gdy X > M 5. Polisa z indywidualną franszyzą redukcyjną (ubezpieczenie częściowe z udziałem własnym) I(X) = 0 gdy X < d a(x d) gdy X d a (0, 1)
Agata Boratyńska Statystyka aktuarialna... 14 6. Ubezpieczenie częściowe warstwy ograniczonej górnym limitem odpowiedzialności M i udziałem własnym d 0 gdy X < d I(X) = a(x d) gdy d X M a (0, 1) a(m d) gdy X > M 7. Ubezpieczenie ze znikającą franszyzą redukcyjną I(X) = 0 gdy X < d X d gdy d X M X gdy X > M 8. Ubezpieczenia na pierwsze ryzyko (first loss) I(X) = X d gdy X < d gdy X d 9. Ubezpieczenia na pierwsze ryzyko z udziałem własnym i pełnym pokryciem strat w granicach ustalonych limitów 0 gdy X < d X d gdy d X m I(X) = X gdy m < X < M M gdy X M
Agata Boratyńska Statystyka aktuarialna... 15 TWIERDZENIE o optymalnym ubezpieczeniu Jeżeli pewien decydent 1. posiada początkowy zasób majątku w 2. przejawia awersję do ryzyka 3. narażony jest na stratę X 4. gotów jest przeznaczyć kwotę P na zakup ubezpieczenia i 0 P (1 + θ)ex oraz rynek ubezpieczeniowy oferuje wszystkie możliwe kontrakty I takie, że 0 I(X) X o ustalonej EI(X) po cenie (1 + θ)ei(x), to decydent osiągnie max oczekiwanej użyteczności zakupując kontrakt I (X) = gdzie P = (1 + θ)ei (X). 0 gdy X d X d gdy X > d
Agata Boratyńska Statystyka aktuarialna... 16 SKŁADKA S - zmienna losowa równa wysokości odszkodowań (świadczeń zakładu w pewnej grupie ryzyka) w przyszłości zdyskontowaną na moment zawierania umowy B - składka brutto, H składka (premium) H > ES B = H + K H = Π + R(S) Π = ES - składka netto (czysta składka), równa oczekiwanej wypłacie, nie odzwierciedla ryzyka związanego z ubezpieczeniem, wyznaczana w drodze analiz aktuarialnych; R(S) - składka na ryzyko związane z losowością szkód oraz z popytem i podażą (narzut związany z ryzykiem), wyznaczana w drodze analiz aktuarialnych i ekonomicznych; K - składka na pokrycie kosztów, wyznaczana w drodze analiz finansowo-księgowych, często wyrażana jako K = βb, wtedy B = H 1 β
Agata Boratyńska Statystyka aktuarialna... 17 PRAKTYCZNE ZASADY USTALANIA SKŁADEK Niech S oznacza wielkość odszkodowań, ryzyko A) zasada równoważności (zasada czystej składki) H = Π = ES B) zasada wartości oczekiwanej H = (1 + a)es C) zasada wariancji H = ES + αv ars D) zasada odchylenia standardowego H = ES + β V ars E) zasada percentyli - H spełnia warunek P (S > H) = ε Liczby a, α, β, ε ustalane przez zakład ubezpieczeniowy. H ES - narzut bezpieczeństwa
Agata Boratyńska Statystyka aktuarialna... 18 TEORETYCZNE METODY USTALANIA SKŁADKI zasada zerowej użyteczności u - funkcja użyteczności ubezpieczyciela X - majątek ubezpieczyciela u(x) = Eu(X + H S) ZADANIE. Wyznacz składkę odpowiadającą funkcji F) składka wykładnicza u(x) = 1 e cx c H = 1 c ln E ( e cs ) POŻĄDANE WŁASNOŚCI SKŁADKI 1) H ES 2) H max odszkodowanie 3) H(S + c) = H(S) + c 4) S 1 i S 2 ryzyka niezależne, to H(S 1 + S 2 ) = H(S 1 ) + H(S 2 )
Agata Boratyńska Statystyka aktuarialna... 19 ZADANIE. Sprawdź, które własności posiadają wymienione składki własność A B C D E F 1 + + + + - + 2 + - - - + + 3 + - + + + + 4 + + + - - + ZADANIE 2. Wygeneruj szkody dla polis z kolejnych lat wg rozkładu P (N = 1) = 0, 1 P (N = 0) = 0, 9, gdzie N jest liczbą szkód z jednej polisy. Wygeneruj wartości X szkód wg rozkładu P (X = 100) = 0, 5, P (X = 200) = 0, 25, P (X = 500) = 0, 25. Szkody o wartości 500 są regulowane w roku następnym szkody o pozostałych wartościach w roku zajścia. Wylicz składki na każdy rok w następujący sposób: składka I: w latach 1980-1981 składka po 33, w latach następnych składka=średnia ze szkód wypłaconych w roku poprzednim razy częstość szkód w roku poprzednim razy 1,1 składka II: w latach 1980-1981 składka po 33, w latach następnych - w roku n - składka=średnia ze szkód zaistniałych w roku n 2 razy częstość szkód w roku n 2 razy 1,1 Którą z metod uważasz za rozsądniejszą i dlaczego. Uwaga: Średnia ze szkód i częstość szkód jest liczona na podstawie symulacji. Wyniki przedstaw w tabelach. Wyznacz też składki nie opierając się na symulacjach ale na parametrach odpowiednich rozkładów. Porównaj wyniki.
Agata Boratyńska Statystyka aktuarialna... 20 Szkody uregulowane (K - liczba, s - wartość) l.polis l.szkód 1980 1981 1982 1983 1984 1985 K s K s K s K s K s K s 1980 1000 1981 4000 1982 8000 1983 6000 1984 4000 1985 4000 suma średnia Wielkość szkód do zapłaty w roku 1986 = Porównanie składek rok składka kwota wartość H1-S składka kwota H2-S I składek H1 szkód S II składek H2 1980 33 33000 33 33000 1981 33 132000 1982 1983 1984 1985 suma suma
Agata Boratyńska Statystyka aktuarialna... 21 MODEL RYZYKA INDYWIDUALNEGO Pojedyncze ryzyko może generować co najwyżej jedną szkodę X wielkość ryzyka (pojedynczego) gdzie I = X = IY 1 z prwdopodobieństwem q 0 z prwdopodobieństwem 1 q Y F - wartość szkody, zmienna o rozkładzie ciągłym, F (0) = 0, EY = µ, V ary = σ 2 Rozkład zmiennej X (rozkład mieszany): F X (x) = 0 gdy x 0 (1 q) + qf (x) gdy x > 0 EX = qey = qµ V arx = qv ary + (EY ) 2 (q q 2 ) = qσ 2 + µ 2 q(1 q)
Agata Boratyńska Statystyka aktuarialna... 22 Portfel ryzyk - założenia: ryzyka niezależne n - liczba ryzyk ustalona liczba zgłoszeń z ryzyka - co najwyżej jedno S = X 1 +X 2 +...+X n - łączna wartość szkód z portfela Rozkład zmiennej S = X 1 + X 2 X 1 F 1, X 2 F 2 F S (s) = P (X 1 + X 2 s) = P (X 1 s X 2 ) = R F 1(s x)df 2 (x) Zad 1. Wyznacz rozkład S jeśli X 1, X 2 Ex(λ) Zad 2. Wyznacz rozkład S jeśli dystrybuanty zmiennych X i są równe F 1 (x) = F 2 (x) = 0 gdy x < 0 0, 8 + 0, 1x gdy x [0, 1) 1 gdy x 1 0 gdy x < 0 0, 7 + 0, 2x gdy x [0, 1) 1 gdy x 1
Agata Boratyńska Statystyka aktuarialna... 23 METODY APROKSYMACJI S 1. Aproksymacja rozkładem normalnym CTG: Jeżeli X 1, X 2,..., X n i.i.d. EX i = m i V arx i = σ 2 i S n = X 1 + X 2 +... + X n, to z lim P S n nm n + σ n z = Φ(z) Model indywidualny, X 1, X 2,..., X n i.i.d. Podstawowe estymatory: ˆq = częstość = ˆµ = ES = nqµ V ars = n ( qσ 2 + µ 2 q(1 q) ) liczba szkód w okresie liczba jednostek ryzyka = N n suma wartości szkód w okresie liczba szkód w okresie ˆΠ = nˆq ˆµ = 1 N N j=1 Y j ˆσ 2 = 1 N N j=1 (Y j ˆµ) 2
Agata Boratyńska Statystyka aktuarialna... 24 Zad. 1. Portfel składa się z n niezależnych ryzyk. Pojedyncze ryzyko może generować co najwyżej jedną szkodę z prawdopodobieństwem q, a prawdopodobieństwem 1 q nie generuje szkody. Rozkład wysokości szkody jest zmienną losową o wartości oczekiwanej µ i wariancji σ 2. Składka przypadająca na jedno ryzyko jest skalkulowana tak H = 1 + θ n ES gdzie S oznacza sumaryczną wysokość szkód i θ oznacza narzut bezpieczeństwa dobrany tak by P (S > nh) = 0, 01. W portfelu mamy n = 1000 q = 0, 05 µ = 10 σ = 10. Wyznacz θ. Zad 2. Rozważamy portfel ubezpieczeń na życie. Dane podaje tabela. k n k - liczba q k - p-stwo b k polis w k-tej grupie zgonu - the benefit 1 4000 0.01 10 2 2000 0.02 10 3 1000 0.01 20 Wyznacz θ taką, aby P (S > (1 + θ)es) = 0, 05.
Agata Boratyńska Statystyka aktuarialna... 25 Zad. 3. Tysiąc mężczyzn wykupiło polisę na życie na rok. Prawdopodobieństwo śmierci w ciągu roku dla każdego z mężczyzn wynosi 0,001, a świadczenie 1 jednostkę. Jakie jest prawdopodobieństwo, że całkowite świadczenia w tej grupie wyniosą co najmniej 4 jednostki. Zastosuj aproksymację rozkładem normalnym i rozkładem Poissona, porównaj wyniki.
Agata Boratyńska Statystyka aktuarialna... 26 Funkcja tworząca momenty zmiennej X > 0 Przykład. X Ex(λ) M X (t) = Ee tx M X (t) = 0 e tx λe λx dx = 1 λ t dla t < λ i M(t) = dla t λ. WŁASNOŚCI: 1. M X (0) = 1; 2. M (k) X (t) = dk M dt k X (t) = dk Ee tx = E(X k e tx ) dla dt k k = 1, 2,...; 3. [ d k M dt k X (t) ] = t=0 EXk ; 4. V arx = M X(0) (M X(0)) 2 ; 5. jeżeli Y = ax to M.G.F. Y jest równa M Y (t) = M X (at). 6. Niech S = X + Y, gdzie X i Y niezależne, wtedy M S (t) = M X (t)m Y (t). 7. jeżeli Y = a + X to M.G.F. Y jest równa M Y (t) = Ee ta+tx = e ta M X (t). 8. Jeżeli M X (t) = M Y (t) dla t (a, b), to X = Y wg rozkładu
Agata Boratyńska Statystyka aktuarialna... 27 9.Niech X n 0 i X n X wg rozkładu, to M Xn (t) M X (t) dla t < 0. rozkład X M X (t) Bin(p, n) [1 p(e t 1)] n P oiss(λ) exp(λ(e t 1)) Bin (r, p) ( p 1 (1 p)e t ) r e tb e ta t(b a) U(a, b) N(m, σ) exp(tm + 1 2 σ2 t 2 ) Gamma(α, β) ( β β t )α
Agata Boratyńska Statystyka aktuarialna... 28 Funkcja tworząca kumulanty zmiennej X > 0 WŁASNOŚCI: 1. 2. C X (t) = ln M X (t) C X(t) = M X(t) M X (t) = C X(0) = M X(0) = EX C X(t) = M X(t)M X (t) (M X(t)) 2 (M X (t)) 2 = C X(0) = V arx 3. 4. X (0) = E(X EX) 3 = γ X = C(3) X (0) (C X(0)) 3 2 C (3) C (4) X (0) = E(X EX) 4 3V ar 2 X = κ X = E(X EX)4 V ar 2 X 3 = C(4) X (0) (C X(0)) 2 Niech S = n i=1 X i, X i niezależne 5. C S (t) = n ln M X i (t) = n C X i (t) i=1 i=1 6. C (3) S (t) = n i=1 C(3) X i (t)
Agata Boratyńska Statystyka aktuarialna... 29 stąd γ S = E(S ES) 3 = n n i=1 C (3) X i (0) ( n i=1 V arx i ) 3 2 i=1 E(X i EX i ) 3 = n i=1 γ X i (V arx i ) 3 2 ( n i=1 V arx i ) 3 2 W szczególności jeżeli X i i.i.d. γ Xi = γ i V arx i = σ 2, to γ S = nγ σ3 = γ (nσ 2 ) 3 2 n
Agata Boratyńska Statystyka aktuarialna... 30 2. Aproksymacja rozkładem gamma Z Gamma(α, β, x 0 ), to Z x 0 Gamma(α, β) gęstość p α,β,x0 (x) = βα Γ(α) (x x 0) α 1 exp( β(x x 0 )) x > x 0 M Z (t) = e tx β 0 β t C Z (t) = tx 0 + α ln β α ln(β t) α EZ = x 0 + α β γ Z = 2 α V arz = α β 2 κ Z = 6 α = 3 2 γ2 Z Jeżeli S ma rozkład Gamma(α, β, x 0 ), to parametry α, β, x 0 wyznaczamy z układu równań x 0 + α β = µ S α β 2 = σs 2 2 α = γ S gdzie ES = µ S, V ars = σs, 2 γ S = E(S ES)3 σs 3.
Agata Boratyńska Statystyka aktuarialna... 31 Model indywidualny, X 1, X 2,..., X n i.i.d. ES = nqµ V ars = n ( qσ 2 + µ 2 q(1 q) ) γ S = γ X n γ X = qe(y )3 3q 2 µ(µ 2 + σ 2 ) + 2q 3 µ 3 ( qσ 2 + µ 2 q(1 q)) 3 Jeżeli S = S 1 + S 2 +... + S k, gdzie S i niezależne (ale niekoniecznie o tym samym rozkładzie) to γ S = k i=1 γ S i ES = k V ars = k (V ars i ) 3 2 ( k i=1 V ars i ) 3 2 i=1 S i i=1 V ars i Jeżeli składka H ma spełniać warunek = P (S > H) = ε i S Gamma(α, β, x 0 ), to H = F 1 Gamma(α,β)(1 ε) + x 0 k i=1 E(S i ES i ) 3 (V ars) 3 2
Agata Boratyńska Statystyka aktuarialna... 32 Zadanie 1. Rozważmy trzy grupy ryzyka k n k - liczba q k - p-stwo polis w k-tej grupie szkody 1 100 0.1 2 150 0.2 3 200 0.08 Wartość szkody jest równa 1. Wyznacz składkę łączną H w każdej grupie osobno i łącząc grupy po dwie według zasady P (S > H) = 0, 002 stosując aproksymację rozkładem normalnym i rozkładem gamma. Zadanie 2. Wygeneruj 1000 polis wg modelu indywidualnego z prawdopodobieństwem szkody q = 0, 2 i wartością szkody a) Y Ex(0, 01) b) Y P areto(5, 400). Na podstawie otrzymanych danych oszacuj H tak, by P (S > H) = 0, 05, gdzie S suma szkód. Zastosuj aproksymację rozkładem normalnym i gamma. Wylicz H bez symulacji.
Agata Boratyńska Statystyka aktuarialna... 33 MODEL RYZYKA ŁĄCZNEGO ZAŁOŻENIA: N(i) - liczba szkód na jedno ryzyko (jeden ubezpieczony), zmienna losowa o wartościach naturalnych Y - wielkość szkody, o dystrybuancie F Y X i = Y i,1 +Y i,2 +...+Y i,n(i) - wartość szkód na jedno ryzyko S - suma roszczeń z portfela S = X 1 + X 2 +... + X n = Y 1 + Y 2 +... + Y N gdzie N - łączna ilość szkód, n - liczba ryzyk Y i - niezależne zmienne losowe o dystrybuancie F = F Y Wartość szkody jest niezależna od ilości szkód S ma złożony rozkład prawdopodobieństwa (jest suma zmiennych o losowej liczbie składników) określa się go przez podanie rozkładu zmiennej Y i zmiennej N Model indywidualny (szczególny przypadek modelu łącznego) S - ma złożony rozkład dwumianowy Cbin(n, p, F )
Agata Boratyńska Statystyka aktuarialna... 34 Pewne własności rozkładów złożonych F S (x) = P (S x) = P (S x N = 0) + P (S x N = 1) +... = + k=1 P (S x N = k)p (N = k) Rozkład warunkowy S pod warunkiem N = k jest rozkładem sumy k zmiennych losowych niezależnych MGF (S) M S (t) = Ee ts = EE(e ts N) = E ( Ee ty ) N M S (t) = E ( (M Y (t)) N ) = M N (ln M Y (t)) ES = µen V ars = σ 2 EN + µ 2 V arn gdzie µ = EY, σ 2 = V ary
Agata Boratyńska Statystyka aktuarialna... 35 ZŁOŻONY ROZKŁAD POISSONA CP oiss(λ, F ) N P oiss(λ) F S (x) = + e λλk k=1 k! F k (x) ES = λµ V ars = λ(µ 2 + σ 2 ) = λe(y 2 ) M S (t) = M N (ln M Y (t)) = exp (λ(m Y (t) 1)) C S (t) = λ(m Y (t) 1) C S(t) = λm Y (t) C S(t) = λm Y (t) C (3) S (t) = λm (3) Y (t) stąd ES = λey V ars = λe(y 2 ) E(S ES) 3 = λe(y 3 ) WNIOSEK. S ma rozkład asymetryczny o skośności prawostronnej oraz γ S = λe(y 3 ) (λe(y 2 )) 3 2 = lim γ S = 0 λ E(Y 3 ) λ(e(y 2 )) 3 2
Agata Boratyńska Statystyka aktuarialna... 36 TWIERDZENIE 1. Niech S 1, S 2,..., S n będą niezależnymi zmiennymi losowymi o rozkładach CP oiss(λ i, F i ), i = 1, 2,..., n. Niech Wtedy A = S 1 + S 2 +... + S n. A CP oiss Λ, 1 Λ λ if i i=1 gdzie Λ = n i=1 λ i. PRZYKŁAD. S 1 CP oiss(100, F 1 ), S 2 CP oiss(200, F 2 ), S 1, S 2 niezależne F 1 - dystrybuanta rozkładu wykładniczego Ex(α), F 2 - dystrybuanta rozkładu wykładniczego Ex(β). Wyznacz rozkład zmiennej S 1 + S 2. ODP. S 1 + S 2 CP oiss(λ, F ) gdzie Λ = 300 i F (x) = 1 1 3 exp( xα) 2 3 exp( xβ) Interpretacja: łączna liczba roszczeń ma rozkład Poissona z parametrem 300, z prawdopodobieństwem 1 3 wielkość szkody pochodzi z rozkładu Ex(α) i z prawdopodobieństwem 2 3 z rozkładu Ex(β). n
Agata Boratyńska Statystyka aktuarialna... 37 ZAD 1. Dla pewnego portfela ryzyk liczba szkód ma rozkład Poissona z wartością oczekiwaną 10, wysokość pojedynczej szkody jest zmienną o rozkładzie Ex(200). Ubezpieczyciel pokrywa nadwyżkę szkody ponad 100. Podaj wartość oczekiwaną i wariancję sumy wypłaconych odszkodowań. ZAD 2. Portfel ryzyk składa się z dwóch niezależnych podportfeli. Liczba szkód N i w i-tym podportfelu jest zmienną losową o rozkładzie P oiss(λ i ), zaś wysokość szkody jest ustalona równa b i. Niech λ 1 = 120 λ 2 = 30 b 1 = 1 b 2 = 3 Jaki rozkład ma łączna wartość szkód z portfela. Oblicz wartość oczekiwaną i wariancję łącznej wartości szkód jeśli wiadomo, że N 1 + N 2 = 200. ZAD 3. Dla pewnego portfela ryzyk liczba szkód ma rozkład Poissona z wartością oczekiwaną 5, wysokość pojedynczej szkody jest zmienną o rozkładzie Gamma(2, 10). Aproksymujemy łączną wartość szkód przesuniętym rozkładem gamma Gamma(α, β, x 0 ), zachowując przy tym wartości pierwszych trzech momentów. Wyznacz parametry α, β, x 0.
Agata Boratyńska Statystyka aktuarialna... 38 TWIERDZENIE 2. Niech S n = n i=1 I ni Y ni, gdzie I ni = 1 z prawdopodobieństwem q ni 0 z prawdopodobieństwem 1 q ni Y ni są zmiennymi losowymi ciągłymi o dystrybuancie F ni i wszystkie zmienne I ni, Y ni są niezależne. Jeżeli lim n n q n n i = λ lim i=1 n i=1 q ni λ F n i (x) = F (x) to lim n S n = S (wg rozkładu), gdzie S ma złożony rozkład Poissona CP oiss(λ, F ).
Agata Boratyńska Statystyka aktuarialna... 39 ZADANIE. Rozważamy portfel ryzyk k n k - liczba q k - p-stwo b k polis w k-tej grupie roszczenia - wartość 1 1000 0.004 10000 2 1500 0.0035 20000 3 2500 0.003 100000 TU chce zawrzeć kontrakt reasekuracyjny o współczynniku retencji M w przedziale (20000, 100000) za składkę równą 130% oczekiwanego kosztu pokrytych szkód przez reasekuratora. Niech S(M) oznacza odszkodowania pokryte przez ubezpieczyciela przy limicie reasekuracji M. Podaj parametry złożonego rozkładu Poissona jako aproksymacji dla zmiennej S(M). Stosując aproksymację złożonym rozkładem Poissona wyznacz ES(M) i V ars(m). Wyznacz M, przy którym prawdopodobieństwo zdarzenia, że S(M) plus opłata za reasekurację przekroczą poziom 1135000 jest najmniejsze (zastosuj aproksymację rozkładem normalnym).
Agata Boratyńska Statystyka aktuarialna... 40 ROZKŁAD UJEMNY DWUMIANOWY Zmienna N ma rozkład ujemny dwumianowy bin (r, p) wtt Γ(r + k) P (N = k) = p r (1 p) k k = 0, 1, 2,... Γ(r)k! r > 0, p (0, 1) - parametry Szczególny przypadek: r naturalne - interpretacja: N liczba porażek do uzyskania r-tego sukcesu M N (t) = gdzie q = 1 p C N (t) = r ln stąd p 1 e t (1 p) r = 1 q 1 e t q p 1 e t (1 p) = r ln p r ln(1 et (1 p)) EN = V arn = r(1 p) = rq p 1 q r(1 p) rq = p 2 (1 q) 2 γ N = 1 + q rq r
Agata Boratyńska Statystyka aktuarialna... 41 Rozkład ujemny dwumianowy otrzymujemy jeśli przyjmiemy, że liczba szkód jest wynikiem dwuetapowego doświadczenia: pierwszy etap polega na wylosowaniu ryzyka, a drugi etap na wygenerowaniu przez to ryzyko liczby szkód, dokładniej ryzyko charakteryzuje się przez wartość parametru λ, odpowiadającego za wartość oczekiwaną liczby szkód z ryzyka przy znanym λ liczba szkód z ryzyka N ma rozkład P oiss(λ). stąd f λ (x) = P (N = k) = P (N = k λ) = λk k! e λ βα Γ(α) xα 1 e βx x > 0 Γ(α + k) Γ(α)k! β 1 + β α 1 1 + β podstawiając r = α i p = 1+β otrzymujemy wzór na prawdopodobieństwo w rozkładzie ujemnym dwumianowym. β k
Agata Boratyńska Statystyka aktuarialna... 42 Rozkład ujemny dwumianowy jako rozkład złożony K - liczba wypadków z jednego ryzyka K P oiss(λ) N = J 1 + J 2 +... + J K - liczba szkód z jednego ryzyka (jeden wypadek może generować więcej niż jedną szkodę) Niech J i ma rozkład logarytmiczny P (m i = k) = gdzie c (0, 1) parametr. 1 c k ln(1 c) k M J (t) = ln(1 cet ) ln(1 c) N ma złożony rozkład Poissona MGF M N (t) = Ee tn = EE(e tn K) M N (t) = M K (ln M J (t)) = exp (λ(m J (t) 1)) 1 ce t λ = exp ln 1 c ln(1 c) wstawiając c = q i r = M N (t) = λ ln(1 c) otrzymujemy Zatem N bin (r, 1 q) p 1 e t (1 p) r
Agata Boratyńska Statystyka aktuarialna... 43 Estymacja parametrów rozkładu bin (r, p) N 1, N 2,..., N n i.i.d. bin (r, p) EMM rozwiązujemy układ równań stąd r(1 p) p 2 r(1 p) p = S 2 = 1 n = N n i=1 (N i N) 2 EMM(p) = N S 2 EMM(r) = N 2 S 2 N
Agata Boratyńska Statystyka aktuarialna... 44 ZADANIE. Tabela podaje liczbę kierowców w pewnej grupie ryzyka, którzy zgłosili 0,1,2,3,itd szkód w ciągu roku. k - liczba szkód n k - liczba ryzyk 0 88585 1 10577 2 779 3 54 4 4 5 1 > 5 0 Dopasuj rozkład Poissona (kierowcy stanowią grupę jednorodną) rozkład ujemny dwumianowy (kierowcy nie stanowią grupy jednorodnej, parametr λ odpowiadający za średnia liczbę wypadków waha się w populacji) wyznacz parametry α i β rozkładu gamma opisującego wahanie parametru λ w populacji i oszacuj odsetek kierowców o średniej liczbie zgłoszeń przekraczającej 0,24.
Agata Boratyńska Statystyka aktuarialna... 45 ENW Niech: m 0 = n m 1 - liczba obserwacji o wartości co najmniej 1; m 2 - liczba obserwacji o wartości co najmniej 2;... m M - liczba obserwacji o wartości co najmniej M; M - maksymalna zaobserwowana wartość m M+1 = 0 Funkcja wiarogodności L(m 1, m 2,..., m M, n, r, p) = q 2 m M p rn (rq) m 1 m 2 r(r + 1) 2 m 3 Γ(r + M) m... 2 M!Γ(r) qm = p rn (rq) m m r + 1 1 2 q 2 m r + 2 3 q 3 r + M 1... M ln L = nr ln(1 q) + M m i ln q + M 1 m r + i i+1 ln i=1 i=0 i + 1 Różniczkując po r i q otrzymujemy równania n ln(1 q) + m 1 r + m 2 r + 1 +... + m M r + M 1 = 0 nr 1 q + n N q = 0. m M q.
Agata Boratyńska Statystyka aktuarialna... 46 Z drugiego równania mamy p = 1 q = r r + N, wstawiając do równania pierwszego otrzymujemy równanie r n ln r + N + m 1 r + m 2 r + 1 +... + które rozwiązujemy numerycznie. m M r + M 1 = 0,
Agata Boratyńska Statystyka aktuarialna... 47 ZŁOŻONY ROZKŁAD UJEMNY DWUMIANOWY Cbin (r, p, F ) S = Y 1 + Y 2 +... + Y N i N bin (r, p), Y i F MGF P (S s) = = i=0 i=0 P (S s N = i) Γ(r + i) p r q i F i (s) Γ(r)i! M S (t) = Ee N ln M Y (t) = p 1 qm Y (t) Parametry: jeśli EY i = µ, V ary i = σ 2 to ES = µen = µr 1 p p V ars = r 1 p p σ2 + r 1 p µ 2 p 2 TWIERDZENIE. Jeżeli S i, i = 1, 2,..., k mają rozkłady Cbin (r i, p, F ) i są niezależne, to S = k i=1 S i ma rozkład Cbin ( k i=1 r i, p, F ). r
Agata Boratyńska Statystyka aktuarialna... 48 ROZKŁADY WARTOŚCI SZKÓD Podstawowe własności: rozkłady skupione na dodatniej półosi X 0; rozkłady ciągłe, przy limicie odpowiedzialności rozkłady mieszane P (X = M) > 0, gdzie M limit odpowiedzialności; rozkłady prawostronnie asymetryczne, często z grubymi ogonami.
Agata Boratyńska Statystyka aktuarialna... 49 Podstawowe rozkłady Rozkład gęstość F (x) EX V arx wykładniczy θe θx 1 e θx 1 1 θ θ 2 Ex(θ) θ > 0 x > 0 β Gamma(α, β) α Γ(α) xα 1 e βx α α Γ(α, βx) β β 2 α, β > 0 x > 0 β IGamma(α, β) α Γ(α) x α 1 e β x Γ(α, β x ) β β 2 α 1 (α 1) 2 (α 2) α, β > 0 x > 0 β α τ Γ(α+ 1 τ ) EX 2 = Γ(α+ 2 Γ(α)β τ 1 τ ) Γ(α)β τ 2 T Gamma(α, β, τ) Γ(α) xατ 1 e βxτ Γ(α, βx τ ) α, β, τ > 0 x > 0 β α (ln x) α 1 ( ) α ( ) α ( ) 2α β β β 1 β 2 β β 1 LG(α, β) x β+1 Γ(α) Γ(α, β ln x) α, β > 0 x > 0 β > 1 β > 2 λ P areto(θ, λ) θ θ (λ+x) 1 λθ λ θ+1 (λ+x) θ θ 1 λ, θ > 0 x > 0 θ > 1 θ > 2 exp[ 1 2 ( ln x µ σ ) 2 ] LN(µ, σ) xσ 2π µ R, σ > 0 x > 0 λ 2 θ (θ 1) 2 (θ 2) ln x µ Φ( σ ) e µ+ 1 2 σ2 e 2µ+σ2 (e σ2 1) Burr(θ, λ, τ) τθλ θ xτ 1 (λ+x τ ) θ+1 1 ( λ λ+x τ ) θ λ 1 τ Γ(θ 1 τ )Γ(1+ 1 τ ) Γ(θ) EX 2 = τ, λ, θ > 0 x > 0 τθ > 1 λ 2 τ Γ(θ 2 τ )Γ(1+ 2 τ ) Γ(θ) τθ > 2 W eibull(c, τ) cτx τ 1 e cxτ 1 e cxτ Γ(1+ 1 τ ) c 2/τ c, τ > 0 x > 0 Γ(θ+τ)λ GP areto θ x τ 1 λτ Γ(θ)Γ(τ)(λ+x) B(τ, θ, u) θ+τ θ 1 (θ, λ, τ) u = x x+λ θ > 1 θ > 2 IP areto(θ, γ) θ > 0, γ > 0 γθx θ 1 (γ+x) θ+1 ( x γ+x ) θ c 1/τ Γ(1+ 2 τ ) Γ(1+ 1 τ ) λ 2 τ(θ+τ 1) (θ 1) 2 (θ 2)
Agata Boratyńska Statystyka aktuarialna... 50 ZALEŻNOŚCI MIĘDZY ROZKŁADAMI Funkcje od zmiennych losowych: mnożenie przez stałą - parametr skali y F Y (y) = P X c PRZYKŁAD Y = cx = FX y c f Y (y) = 1 c f X 1) X Ex(1) = Y = cx EX( 1 c ) 2) X Gamma(α, 1) = Y = X β Gamma(α, β) 3) X W eibull(1, τ) = Y = X a W eibull(aτ, τ) przekształcenie wykładnicze Y = e X F Y (y) = P (X ln y) = F X (ln y) f Y (y) = 1 y f X(ln y) PRZYKŁAD X N(µ, σ 2 ) = Y = e X LN(µ, σ 2 ) przekształcenie potęgowe Y = X 1 τ τ > 0 - rozkład transformowany τ < 0 - rozkład odwrócony transformowany τ = 1 - rozkład odwrócony F Y (y) = F X (y τ ) y c
Agata Boratyńska Statystyka aktuarialna... 51 f Y (y) = f X (y τ ) τy τ 1 PRZYKŁAD 1. X Ex(θ) = Y = X 1 τ W eibull(θ, τ) 2. X gamma(α, β). = Y = X 1 IGamma(α, β) 3. X P areto(θ, λ) = Y = X 1 τ Burr, τ > 0 mieszanki rozkładów mieszanki dyskretne: f 1, f 2,..., f k - gęstości zmiennych X 1, x 2,..., X k p 1, p 2,..., p k > 0, p i = 1 - wagi Y zmienna o rozkładzie z gęstością f = p i f i mieszanki ciągłe - ryzyka heterogeniczne: f θ (x) = f(x θ), θ Π wtedy f(x) = Θ f θ(x)π(dθ) PRZYKŁAD: X Ex(γ) i γ Gamma(θ, λ) rozkład brzegowy X - P areto(θ, λ) X Gamma(τ, β) i β Gamma(θ, λ) rozkład brzegowy X - GP areto(θ, λ, τ)
Agata Boratyńska Statystyka aktuarialna... 52 OGON ROZKłADU Funkcją przeżycia zmiennej X o gęstości f i dystrybuancie F nazywamy funkcję S(x) = 1 F (x) = F (x) Duża wartość S dla dużych x - ciężki ogon Porównywanie ogonów zmiennych X i Y : S X (x) lim x + S Y (x) = + to X cięższy ogon niż Y lim x + to X lżejszy ogon niż Y S X (x) S Y (x) = 0 Średnia długość przyszła życia (średnia nadwyżka szkody ponad wartość x) e(x) = E(X x X > x) = założenie EX < +. + x S(t)dt S(x) Duże e(x) dla dużych x świadczy o grubym ogonie. Estymator próbkowy ê n (x) = xj >x(x j x) {x j > x},
Agata Boratyńska Statystyka aktuarialna... 53 Estymator w oparciu o szereg rozdzielczy: ê n (c i ) = x>ci (x c i ) n(1 F n (c i ) = j>i c j n j j>i n j c i PRZYKŁADY: X Ex(λ), wtedy e(x) = 1 λ X P areto(θ, λ) wtedy e(x) = λ+x θ 1 X LN(µ, σ 2 ) wtedy e(x) = exp µ + 1 1 Φ ( ln x µ σ 2 2 σ2 σ 1 Φ ( ) ln x µ σ )
Agata Boratyńska Statystyka aktuarialna... 54 MODELE Z NIEKOMPLETNYMI DANYMI, DANE OBCIĘTE I OKROJONE (FRANSZYZA WARUNKO- WA I BEZWARUNKOWA, LIMIT ODPOWIEDZIAL- NOŚCI) dane obcięte - brak obserwacji z pewnego zakresu dane okrojone - znana jest liczba obserwacji z pewnego zakresu ale nie znane są konkretne wartości PRZYKŁADY: X - szkoda 1. limit odpowiedzialności Y = X M gdy X < M gdy X M próbka Y 1, Y 2,..., Y n - dane okrojone 2. franszyza warunkowa płatność dla szkody Y = 0 gdy X < d X gdy X d próbka Y 1, Y 2,..., Y n - dane okrojone ale często ubezpieczyciel nie ma informacji o szkodach mniejszych niż d płatność ubezpieczyciela V = X gdy X > d próbka V 1, V 2,..., V m - dane obcięte
Agata Boratyńska Statystyka aktuarialna... 55 3. franszyza bezwarunkowa płatność dla szkody Y = 0 gdy X < d X d gdy X d próbka Y 1, Y 2,..., Y n - dane okrojone ale często ubezpieczyciel nie ma informacji o szkodach mniejszych niż d płatność ubezpieczyciela V = X d gdy X > d próbka V 1, V 2,..., V m - dane obcięte 4. Płatność reasekuratora przy płatności ubezpieczyciela do limitu odpowiedzialności M płatność dla szkody Z = 0 gdy X < M X M gdy X M próbka Z 1, Z 2,..., Z n - dane okrojone ale często reasekurator nie ma informacji o szkodach mniejszych niż M płatność reasekuratora W = X M gdy X > M próbka W 1, W 2,..., W m - dane obcięte
Agata Boratyńska Statystyka aktuarialna... 56 Funkcja wiarogodności i wartość oczekiwana X zmienna o dystrybuancie F i gęstości f 1. X gdy X < M Y = M gdy X M próbka: Y 1, Y 2,..., Y n o wartościach mniejszych niż M, k liczba obserwacji o wartości M funkcja wiarogodności L(y 1, y 2,..., y n, k) = n i=1 f(y i) (1 F (M)) k EY = E(X M) = M 0 xf(x)dx + M(1 F (M)) Współczynnik eliminacji szkody 2. LER X (m) = E(X M) EX 0 gdy X < d Y = X gdy X d próbka Y 1, Y 2,..., Y m większe od 0, k - liczba obserwacji o wartości 0 - dane okrojone funkcja wiarogodności L(y 1, y 2,..., y m, k) = m EY = + d i=1 f(y i)f (d) k xf(x)dx
Agata Boratyńska Statystyka aktuarialna... 57 Jeśli dane obcięte V 1, V 2,..., V m czyli dotyczące zmiennej V = X gdy X > d, to funkcja wiarogodności 3. L(v 1, v 2,..., v m ) = EV = xf(x)dx 1 F (d) + d m i=1 f(v i ) (1 F (d)) m = e X (d) + d 0 gdy X < d Y = X d gdy X d próbka Y 1, Y 2,..., Y m większe od 0, k - liczba obserwacji o wartości 0 - dane okrojone funkcja wiarogodności L(y 1, y 2,..., y m, k) = m i=1 f(y i + d)f (d) k EY = + d (x d)f(x)dx = e X (d)(1 F (d)) Jeśli dane obcięte V 1, V 2,..., V m czyli dotyczące zmiennej V = X d gdy X > d, to funkcja wiarogodności L(v 1, v 2,..., v m ) = EV = + d (x d)f(x)dx 1 F (d) m i=1 f(v i + d) (1 F (d)) m = e X (d)
Agata Boratyńska Statystyka aktuarialna... 58 Przydatne wiadomości ze statystyki ESTYMACJA PARAMETRYCZNA EMM (estymacja metodą momentów) X 1, X 2,..., X n i.i.d z rozkładu P θ, θ- nieznany parametr 1. θ R (jednowymiarowa przestrzeń parametrów), rozwiąż: E θ X = X 2. θ = (θ 1, θ 2,..., θ k ) (k-wymiarowa przestrzeń parametrów), rozwiąż układ: gdzie µ = E θ X. Przykład: E θ X = X V ar θ X = S 2 E θ (X µ) 3 = 1 (Xi n X) 3...... E θ (X µ) k = 1 (Xi n X) k X = (X 1, X 2,..., X n ) X i LN(µ, σ), EMM(µ) =? i EMM(σ 2 ) =?. Otrzymujemy układ: e µ+ 1 2 σ2 = X e 2µ+σ2 (e σ2 1) = S 2 St ad: X 2 ˆµ = ln (S 2 + X ˆσ 2 = ln S2 2 ) 1 2 X + 1 2 Estymatory parametrów możemy również otrzymać wykorzystując własność: X LN(µ, σ) Y = ln X N(µ, σ). Niech Y i = ln X i, wtedy ˆµ = Ȳ i ˆσ2 = S 2 Y. Zad: Wyznaczyć EMM parametrów w rozkładzie P areto(θ, λ).
Agata Boratyńska Statystyka aktuarialna... 59 Rozwiązanie: Otrzymujemy układ: Stąd: ˆθ = 2S2 S 2 X i ˆλ = X(ˆθ 1). 2 λ θ 1 = X λ 2 θ (θ 1) 2 (θ 2) = S2
Agata Boratyńska Statystyka aktuarialna... 60 EMK (estymacja metodą kwantyli) X 1, X 2,..., X n i.i.d z rozkładu P θ, θ- nieznany parametr 1. θ R (jednowymiarowa przestrzeń parametrów), rozwiąż: 2. θ = (θ 1, θ 2 ), rozwiąż układ: q 1 2 (θ) = Q 1 2 F θ(q 1 2 ) = 1 2 lub układ równoważny: q 1 4 (θ) = Q 1 4 i q 3 4 (θ) = Q 3 4 F θ (Q 1 4 ) = 1 4 i F θ (Q 3 4 ) = 3 4 3. θ = (θ 1, θ 2, θ 3 ). Otrzymujemy układ: F θ (Q 1 4 ) = 1 4 i F θ (Q 1 2 ) = 1 2 i F θ (Q 3 4 ) = 3 4 4. θ = (θ 1, θ 2, θ 3, θ 4 ). Rozważamy kwantyle rzędu 1 8, 3 8, 5 8 i 7 8.
Agata Boratyńska Statystyka aktuarialna... 61 Przykład: Niech X 1, X 2,..., X n i.i.d z rozkładu W eibull(c, τ). Otrzymujemy układ: 1 e cqτ 1 4 = 1 4 i 1 e cqτ 3 4 = 3 4. St ad Estymatory mają postać: ln 0.75 = cq τ 1 Q 1 4 Q 3 4 4 τ ˆτ = log Q 14 Q 34 i ln 0.25 = cq τ 3 4 = ln 0.75 ln 0.25 ( ) ln 0.75 ln 0.25 ĉ = ln 0.75 Qˆτ 1 4
Agata Boratyńska Statystyka aktuarialna... 62 EMNW (estymacja metodą największej wiarogodności) Niech X będzie obserwowaną zmienną losową o gęstości f θ (x), gdzie θ jest nieznanym parametrem. Funkcją wiarogodności nazywamy funkcję L(θ, x) = f θ (x) Estymatorem największej wiarogodności parametru θ (EN W (θ)) nazywamy argument maksimum funkcji L jako funkcji θ, ENW (θ) = arg max L(θ, x). θ Zachodzi: arg max θ L(θ, x) = arg max θ ln L(θ, x). Jeżeli θ = (θ 1,..., θ k ) jest parametrem ciągłym i L jest funkcją różniczkowalną, to ENW wyznaczamy rozwiązując układ równań: lub równoważny układ: L(θ, x) θ j = 0, j = 1, 2,..., k ln L(θ, x) θ j = 0, j = 1, 2,..., k. Własności i uwagi: 1. Niech X 1, X 2,..., X n i.i.d z rozkładu o gęstości f θ, gdzie θ jest nieznanym parametrem. Przy pewnych warunkach regularności, jeżeli układ równań Σ n ln L(θ, X i ) i=1 = 0, j = 1, 2,..., k θ j ma dokładnie jedno rozwiązanie, to jest ono ENW (θ) i jest to estymator zgodny. 2. Jeżeli dodatkowo istnieją 2 ln L(θ,x) θ, j = 1, 2,..., k i spełnione s a założenia umożliwiające zamianę kolejności operacji różniczkowania po θ j 2 j lub 2 θ 2 j i całkowania i I(θ) jest dodatnio określona, to EN W (θ) jest asymptotycznie normalny i asymptotyczna macierz kowariancji ma postać I 1 (θ), gdzie I(θ) = E ln f θ(x) θ θ i ln f θ(x) θ j i,j=1...k
Agata Boratyńska Statystyka aktuarialna... 63 jest informacją Fishera. Uwaga: Jeżeli θ R, to I(θ) = E θ ( ln fθ (X) θ ) 2 ( ) = 2 ln f θ (X) Eθ θ. 2 3. Jeżeli g jest różniczkowalna i g (θ) 0 i ˆθ n jest ENW (θ) opartym na próbie n-elementowej asymptotycznie normalnym, to g(ˆθ) = ENW (g(θ)) i (g(ˆθ n ) g(θ)) n N(0, [g (θ)] 2 I 1 (θ)). Zad. Wyznacz asymptotyczną macierz kowariancji dla EN W w modelu lognormalnym. Stąd ln L(µ, σ, X) = ln X 0.5 ln(2π) 0.5 ln σ 2 2 ln L = 1 µ 2 σ 2 2 ln L (σ 2 ) = 1 (ln X µ)2 2 2σ4 σ 6 2 ln L X µ) = (ln µ σ2 σ 4 I(µ, σ 2 ) 1 = σ2 0 0 σ 4 (ln X µ)2 2σ 2
Agata Boratyńska Statystyka aktuarialna... 64 ESTYMACJA W PRZYPADKU GDY DANE SĄ POGRUPOWANE Szereg rozdzielczy przedziały liczebności częstości (c 0, c 1 ] n 1 f 1 = n 1 n (c 1, c 2 ] n 2 f 2 = n 2 n......... (c k 1, c k ] n k f k = n k n Zakładamy, że nie obserwujemy wartości poniżej c 0 i wypłacamy max c k. Funkcja wiarogodności: L(θ) = lub za pomocą dystrybuanty: ( cl c l 1 f θ (x)dx ) n l ( ck c 0 f θ (x)dx ) n L(θ) = [F t(c l ) F θ (c l 1 )] n l [F θ (c k ) F θ (c 0 )] n W szczególności może być F θ (c 0 ) = 0 i F θ (c k ) = 1. Wyznaczamy θ dla którego L(θ) lub ln L(θ) osiąga max. Wykorzystujemy metody numeryczne dla znalezienia punktu zerowania się pochodnej np metodę Newtona.
Agata Boratyńska Statystyka aktuarialna... 65 ESTYMACJA PRZEDZIAŁOWA Niech X 1, X 2,..., X n i.i.d. z rozkładu o gęstości f θ (x), θ - nieznany parametr Niech ˆθ = ENW (θ) i ˆθ ma asymptotyczny rozkład normalny z wariancją asymptotyczną I(θ) 1. Wtedy ˆθ N(θ, (ni(θ)) 1 ) dla dużych n. Dodatkowo I(ˆθ) jest estymatorem zgodnym funkcji I(θ), stąd (ˆθ θ ) ni(ˆθ) N(0, 1). Otrzymujemy więc asymptotyczny przedział ufności dla θ na poziomie ufności 1 α postaci Przykład: ˆθ u 1 α 2 1 ni(ˆθ), ˆθ + u 1 α 2 1 ni(ˆθ) Niech X 1, X 2,..., X n i.i.d. z rozkładu Weibulla o gęstości f θ (x) = θx exp( θx2 2 ), θ > 0 - nieznany parametr. Funkcja. ln L(θ) = n ln θ + Σ ln x i θ 2 Σx2 i a stąd oraz I(θ) = E θ 2 ln f θ (X) θ 2 ENW (θ) = 2n Σx 2 i = E θ 2 (ln θ θx2 θ 2 2 ) = 1 θ 2. Otrzymujemy przedział ufności dla θ 2n Σx 2 i n u1 α 2, 2n n Σx 2 i n + u1 α 2. n
Agata Boratyńska Statystyka aktuarialna... 66 Zauważmy, że w tym modelu niekoniecznie musieliśmy wyznaczać EN W (I(θ)). Z własności asymptotycznych EN W (θ) mamy Stąd przy n P (ENW (θ) θ) n θ ENW (θ) θ 1 N(0, 1) n u1 α 1 α Przekształcając nierówność i wstawiając postać EN W (θ) otrzymujemy przedział 2n n Σx 2, 2n n i n + u1 α Σx 2 2 i n u1 α 2 Korzystając z własności, że ENW (g(θ)) = g(ˆθ), gdzie ˆθ = ENW (θ), i (przy odpowiednich warunkach regularności ) ( ) ( g(ˆθ) g(θ) n N 0, [g (θ)] 2 I 1 (θ) ) w analogiczny sposób otrzymujemy asymptotyczny przedział ufności dla funkcji g(θ) na poziomie ufności 1 α. 2
Agata Boratyńska Statystyka aktuarialna... 67 TESTOWANIE HIPOTEZ O ZGODNOŚCI Niech X 1, X 2,..., X n i.i.d. z rozkładu o nieznanej dystrybuancie F H 0 : F = F 0, F 0 ustalona 1. Test Kołmogorowa-Smirnowa Założenie: F 0 - ciągła, ściśle rosnąca dystrybuanta Statystyka testowa: D n = sup F n (t) F 0 (t), t R gdzie F n (t) = F n (X 1, X 2,..., X n, t) jest dystrybuantą empiryczną. gdzie D + n = max i=1...n ( i n z i) w przypadku szeregu przedziałowego D + n = max i=1...k (F n(c i ) F 0 (c i )) D n = max(d + n, D n ) D n = max i=1...n (z i i 1 n ) z i = F 0 (x i:n ) D n = max i=1...k (F 0(c i ) F n (c i 1 )) TEST: Jeżeli D n > c(α, n), to hipotezę H 0 odrzucamy. Wybór c(α, n): Rozkład statystyki D n przy prawdziwości hipotezy H 0 nie zależy od postaci F 0. Zatem c(α, n) są stablicowane. Dla n dużych korzystamy z wartości przybliżonych, kilka z nich podaje Tabela poniżej. α 0.20 0.10 0.05 0.01 c 1.07/ n 1.22/ n 1.36/ n 1.63/ n
Agata Boratyńska Statystyka aktuarialna... 68 2. Test Chi-kwadrat F 0 - dystrybuanta rozkładu dyskretnego, wtedy rozkład zmiennej X skupiony jest w punktach a 1, a 2,..., a k. Niech p j = P (X = a j ). Niech N j =liczba elementów próby losowej równych a j. Statystyka testowa: χ 2 = Σ k (N j np j ) 2 j=1 np j. Jeżeli n, to zmienna losowa χ 2 dąży według rozkładu do zmiennej losowej o rozkładzie Chi-kwadrat o k 1 stopniach swobody (χ 2 k 1) TEST: H 0 odrzucamy, gdy χ 2 1 α w rozkładzie χ 2 k 1. F 0 - dystrybuanta rozkładu ciągłego. > χ 2 k 1(α), gdzie χ 2 k 1(α) kwantyl rzędu Dzielimy nośnik rozkładu na k przedziałów o końcach c 0, c 1,..., c k. Niech p j = F 0 (c j ) F 0 (c j 1 ), N j =liczba elementów próby należących do przedziału (c j 1, c j ]. Następnie stosujemy test jak przy rozkładzie dyskretnym. Uwaga: Hipotezy złożone. Jeżeli H 0 : F {F θ : θ Θ}, to najpierw estymujemy parametr θ (np. stosując EN W ). Jeżeli estymujemy parametr d wymiarowy, to asymptotyczny rozkład statystyki χ 2 jest rozkładem Chi-kwadrat o k d 1 stopniach swobody.
Agata Boratyńska Statystyka aktuarialna... 69 TESTOWANIE HIPOTEZ PARAMETRYCZNYCH (testy oparte na ilorazie wiarogodności) Niech X 1, X 2,..., X n i.i.d. z rozkładu P θ, θ Θ Statystyka testowa: lub gdzie L(θ) funkcja wiarogodności. Obszar krytyczny: lub H 0 : θ Θ 0 H 1 : θ Θ 1 = Θ Θ 0 Λ 0 = sup θ Θ 1 L(θ) sup θ Θ0 L(θ) Λ = sup θ Θ L(θ) sup θ Θ0 L(θ), K = {(x 1, x 2,..., x n ) : Λ > λ(α)} K = {(x 1, x 2,..., x n ) : Λ 0 > c(α)}, gdzie λ(α), c(α) wartości krytyczne dobrane tak by θ Θ 0 P θ (K) α.