Statystyka aktuarialna i teoria ryzyka, model indywidualny i zespołowy, rozkłady złożone Agata Boratyńska SGH, Warszawa Agata Boratyńska (SGH) SAiTR wykład 3 i 4 1 / 25
MODEL RYZYKA INDYWIDUALNEGO X wielkość ryzyka (dla jednej polisy) gdzie I = X = IY { 1 z prwdopodobieństwem q 0 z prwdopodobieństwem 1 q Y F - wartość szkody, zmienna o rozkładzie ciągłym, F (0) = 0, EY = µ, VarY = σ 2 Rozkład zmiennej X (rozkład mieszany): { 0 gdy x 0 F X (x) = (1 q) + qf (x) gdy x > 0 EX = qey = qµ VarX = qvary + (EY ) 2 (q q 2 ) = qσ 2 + µ 2 q(1 q) Agata Boratyńska (SGH) SAiTR wykład 3 i 4 2 / 25
Portfel ryzyka Założenia: polisy niezależne n - liczba polis ustalona liczba zgłoszeń z polisy - co najwyżej jedno S = X 1 + X 2 + + X n - łączna wartość szkód z portfela Agata Boratyńska (SGH) SAiTR wykład 3 i 4 3 / 25
Parametry rozkładu S ES = nqµ ( ) VarS = n qσ 2 + µ 2 q(1 q) γ S = γ X n γ X = qe(y 3 ) 3q 2 µ(µ 2 + σ 2 ) + 2q 3 µ 3 ( qσ 2 + µ 2 q(1 q)) 3 Agata Boratyńska (SGH) SAiTR wykład 3 i 4 4 / 25
Podstawowe estymatory parametrów ˆq = częstość = ˆµ = liczba szkód w okresie liczba jednostek ryzyka = N n suma wartości szkód w okresie liczba szkód w okresie ˆΠ = nˆqˆµ = 1 N Y j N j=1 ˆσ 2 = 1 N N (Y j ˆµ) 2 j=1 Agata Boratyńska (SGH) SAiTR wykład 3 i 4 5 / 25
Przykład 1 Portfel składa się z n niezależnych polis. Pojedyncza polisa może generować co najwyżej jedną szkodę z prawdopodobieństwem q, a prawdopodobieństwem 1 q nie generuje szkody. Rozkład wysokości szkody jest zmienną losową o wartości oczekiwanej µ i wariancji σ 2. Składka przypadająca na jedno ryzyko (polisę) jest skalkulowana tak H = 1 + θ n ES gdzie S oznacza sumaryczną wysokość szkód i θ oznacza narzut bezpieczeństwa dobrany tak by P(S > nh) = 0, 01. W portfelu mamy n = 1000 q = 0, 05 µ = 10 σ = 10. Wyznacz θ. Agata Boratyńska (SGH) SAiTR wykład 3 i 4 6 / 25
Przykład 2 Rozważamy portfel ubezpieczeń na życie. Dane podaje tabela. Wyznacz θ taką, aby k n k - liczba q k - p-stwo b k polis w k-tej grupie zgonu - the benefit 1 4000 0.01 10 2 2000 0.02 10 3 1000 0.01 20 P(S > (1 + θ)es) = 0, 05. Agata Boratyńska (SGH) SAiTR wykład 3 i 4 7 / 25
MODEL RYZYKA ŁĄCZNEGO ZAŁOŻENIA: N(i) - liczba szkód na jedno ryzyko (jeden ubezpieczony), zmienna losowa o wartościach naturalnych Y - wielkość szkody, o dystrybuancie F Y Wartość szkody jest niezależna od liczby szkód Y i - wielkości szkód, niezależne zmienne losowe o dystrybuancie F = F Y X i = Y i,1 + Y i,2 + + Y i,n(i) - wartość szkód na jedno ryzyko S - suma roszczeń z portfela S = X 1 + X 2 + + X n = Y 1 + Y 2 + + Y N gdzie N - łączna liczba szkód w portfelu, n - liczba polis S ma złożony rozkład prawdopodobieństwa (jest suma zmiennych o losowej liczbie składników) określa się go przez podanie rozkładu zmiennej Y i zmiennej N Zmienne X i mają złożony rozkład prawdopodobieństwa Agata Boratyńska (SGH) SAiTR wykład 3 i 4 8 / 25
Pewne własności rozkładów złożonych Dystrybuanta F S (x) = P(S x) = P(S x N = 0) + P(S x N = 1) + = + k=0 P(S x N = k)p(n = k) Rozkład warunkowy S pod warunkiem N = k jest rozkładem sumy k zmiennych losowych niezależnych ( ( ) MGF M S (t) = Ee ts = EE(e ts N) = E Ee ty N ) Momenty M S (t) = E ES = µen gdzie µ = EY, σ 2 = VarY ( (M Y (t)) N) = M N (ln M Y (t)) VarS = σ 2 EN + µ 2 VarN E(S ES) 3 = E(Y EY ) 3 EN + 3EYVarYVarN + (EY ) 3 E(N EN) 3 Agata Boratyńska (SGH) SAiTR wykład 3 i 4 9 / 25
ZŁOŻONY ROZKŁAD POISSONA CPoiss(λ, F ) N Poiss(λ) i Y i F i S = Y 1 +... Y N Dystrybuanta: F S (x) = + k=0 e λ λk k! F k (x) MGF M S (t) = M N (ln M Y (t)) = exp (λ(m Y (t) 1)) Funkcja tworząca kumulanty i jej pochodne C S (t) = λ(m Y (t) 1) C S(t) = λm Y (t) C S (t) = λm Y (t) C (3) (t) = λm(3) (t) S stąd Momenty ES = λey VarS = λe(y 2 ) E(S ES) 3 = λe(y 3 ) WNIOSEK. S ma rozkład asymetryczny o skośności prawostronnej oraz γ S = λe(y 3 ) (λe(y 2 )) 3 2 = lim γ S = 0 λ E(Y 3 ) λ(e(y 2 )) 3 2 Agata Boratyńska (SGH) SAiTR wykład 3 i 4 10 / 25 Y
TWIERDZENIE. Niech S 1, S 2,..., S n będą niezależnymi zmiennymi losowymi o rozkładach CPoiss(λ i, F i ), i = 1, 2,..., n. Niech A = S 1 + S 2 + + S n. Wtedy ( A CPoiss Λ, 1 Λ ) n λ i F i i=1 n gdzie Λ = λ i i=1 PRZYKŁAD. S 1 CPoiss(100, F 1 ), S 2 CPoiss(200, F 2 ), S 1, S 2 niezależne F 1 - dystrybuanta rozkładu wykładniczego Ex(α), F 2 - dystrybuanta rozkładu wykładniczego Ex(β). Wyznacz rozkład zmiennej S 1 + S 2. ODP. S 1 + S 2 CPoiss(Λ, F ) gdzie Λ = 300 i F (x) = 1 1 3 exp( xα) 2 3 exp( xβ) Interpretacja: łączna liczba roszczeń ma rozkład Poissona z parametrem 300, z prawdopodobieństwem 1 3 wielkość szkody pochodzi z rozkładu Ex(α) i z prawdopodobieństwem 2 3 z rozkładu Ex(β). Agata Boratyńska (SGH) SAiTR wykład 3 i 4 11 / 25
PRZYKŁAD. Portfel ryzyk składa się z dwóch niezależnych podportfeli. Liczba szkód N i w i-tym podportfelu jest zmienną losową o rozkładzie Poiss(λ i ), zaś wysokość szkody jest ustalona równa b i. Niech λ 1 = 120 λ 2 = 30 b 1 = 1 b 2 = 3 Jaki rozkład ma łączna wartość szkód z portfela. Oblicz wartość oczekiwaną i wariancję łącznej wartości szkód jeśli wiadomo, że N 1 + N 2 = 200. PRZYKŁAD. Dla pewnego portfela ryzyka liczba szkód ma rozkład Poissona z wartością oczekiwaną 5, wysokość pojedynczej szkody jest zmienną o rozkładzie Gamma(2, 10). Aproksymujemy łączną wartość szkód przesuniętym rozkładem gamma Gamma(α, β, x 0 ), zachowując przy tym wartości pierwszych trzech momentów. Wyznacz parametry α, β, x 0. Agata Boratyńska (SGH) SAiTR wykład 3 i 4 12 / 25
WNIOSKI Niech x 1, x 2,..., x k będą wartościami wypłat w k portfelach. Liczebności tych wypłat N 1,..., N k są zmiennymi losowymi niezależnymi o rozkładach Poissona z parametrami λ 1,..., λ k odpowiednio. Wtedy S = x 1 N 1 + + x k N k ma rozkład złożony Poissona CPoiss(λ, F ) gdzie λ = k i=1 λ i i F (x) = k i=1 λ i λ 1 [x i,+ )(x) Jeżeli zmienna S = X 1 + + X N ma złożony rozkład Poissona CPoiss(λ, F ), z dyskretnym rozkładem indywidualnych roszczeń o dystrybuancie F i funkcji prawdopodobienstwa p i = P(X = x i ), i = 1,..., k, to zmienne losowe N 1, N 2,..., N k takie, że N i = {l : X l = x i }, są niezależne, S = x 1 N 1 + + x k N k oraz N i mają rozkłady Poissona z parametrami λ i = p i λ. Agata Boratyńska (SGH) SAiTR wykład 3 i 4 13 / 25
TWIERDZENIE Niech S n = n i=1 I ni Y ni, gdzie I ni = { 1 z prawdopodobieństwem qni 0 z prawdopodobieństwem 1 q ni Y ni są zmiennymi losowymi ciągłymi o dystrybuancie F ni i wszystkie zmienne I ni, Y ni są niezależne. Jeżeli n n q ni lim q ni = λ lim n n λ F n i (x) = F (x) to i=1 i=1 lim S n = S n (wg rozkładu), gdzie S ma złożony rozkład Poissona CPoiss(λ, F ). Agata Boratyńska (SGH) SAiTR wykład 3 i 4 14 / 25
ROZKŁAD UJEMNY DWUMIANOWY N bin (r, p) funkcja prawdopodobieństwa P(N = k) = Γ(r + k) Γ(r)k! pr (1 p) k k = 0, 1, 2,... r > 0, p (0, 1) - parametry Szczególny przypadek: r naturalne - interpretacja: N liczba porażek do uzyskania r-tego sukcesu ( ) p r ( ) MGF M N (t) = 1 e t (1 p) = 1 q r 1 e t q, gdzie q = 1 p p CGF C N (t) = r ln 1 e t (1 p) = r ln p r ln(1 et (1 p)) momenty EN = r(1 p) p = rq 1 q VarN = γ N = 1 + q rq r(1 p) p 2 = rq (1 q) 2 Agata Boratyńska (SGH) SAiTR wykład 3 i 4 15 / 25
Interpretacja Rozkład ujemny dwumianowy otrzymujemy jeśli przyjmiemy, że liczba szkód jest wynikiem dwuetapowego doświadczenia: pierwszy etap polega na wylosowaniu ryzyka, drugi etap na wygenerowaniu przez to ryzyko liczby szkód Dokładniej, ryzyko charakteryzuje się przez wartość parametru λ Gamma(α, β) i przy znanym λ liczba szkód z ryzyka N ma rozkład Poiss(λ). stąd f (λ) = P(N = k) = P(N = k λ) = λk k! e λ β βα Γ(α) λα 1 e βλ x > 0 Γ(α + k) Γ(α)k! ( β ) α ( 1 ) k 1 + β 1 + β podstawiając r = α i p = 1+β otrzymujemy wzór na prawdopodobieństwo w rozkładzie ujemnym dwumianowym. Agata Boratyńska (SGH) SAiTR wykład 3 i 4 16 / 25
Rozkład ujemny dwumianowy jako rozkład złożony Założenia K - liczba wypadków z jednego ryzyka K Poiss(λ) N = J 1 + J 2 + + J K - liczba szkód z jednego ryzyka (jeden wypadek może generować więcej niż jedną szkodę) J i ma rozkład logarytmiczny P(J i = k) = 1 c k ln(1 c) k gdzie c (0, 1) parametr. Wtedy N ma złożony rozkład Poissona i MGF gdzie c = q i r = M J (t) = ln(1 cet ) ln(1 c) M N (t) = M K (ln M J (t)) = exp (λ(m J (t) 1)) ( ( 1 ce t ) ) ( λ p = exp ln = 1 c ln(1 c) 1 e t (1 p) λ ln(1 c) Zatem N bin (r, 1 q) Agata Boratyńska (SGH) SAiTR wykład 3 i 4 17 / 25 ) r
Estymacja parametrów rozkładu bin (r, p) N 1, N 2,..., N n i.i.d. bin (r, p) EMM rozwiązujemy układ równań r(1 p) p = N stąd r(1 p) p 2 = S 2 = 1 n n (N i N) 2 i=1 EMM(p) = N S 2 EMM(r) = N 2 S 2 N Agata Boratyńska (SGH) SAiTR wykład 3 i 4 18 / 25
PRZYKŁAD Tabela podaje liczbę kierowców w pewnej grupie ryzyka, którzy zgłosili 0,1,2,3,itd szkód w ciągu roku. Dopasuj rozkład Poissona k - liczba szkód n k - liczba ryzyk 0 88585 1 10577 2 779 3 54 4 4 5 1 > 5 0 Dopasuj rozkład ujemny dwumianowy (kierowcy nie stanowią grupy jednorodnej, parametr λ odpowiadający za średnia liczbę wypadków waha się w populacji) wyznacz parametry α i β rozkładu gamma opisującego wahanie parametru λ w populacji i oszacuj odsetek kierowców o średniej liczbie zgłoszeń przekraczającej 0,24. Agata Boratyńska (SGH) SAiTR wykład 3 i 4 19 / 25
Dobór rozkładu: Poisson lub ujemny dwumianowy l. szkód l.ryzyk Poisson uj.dwum. 0 88585 88410 88598 1 10577 10890 10543 2 779 671 806 3 54 28 50 4 4 1 3 5 1 0 0 Suma 100000 100000 100000 Parametry: R. Poissona lambda= 0,1232S^2= 0,127506 Ujemny dwumianowy r= 3,5069 p= 0,9661 test CHI^2 Poisson Ujemny dwumianowy statystyka test. 71,88 2,794 p-value 1,688E-15 0,247 Agata Boratyńska (SGH) SAiTR wykład 3 i 4 20 / 25
ENW Niech: m 0 = n m 1 - liczba obserwacji o wartości co najmniej 1; m 2 - liczba obserwacji o wartości co najmniej 2;... m M - liczba obserwacji o wartości co najmniej M; M - maksymalna zaobserwowana wartość, m M+1 = 0 Funkcja wiarogodności L(m 1, m 2,..., m M, n, r, p) = ( ) p rn (rq) m 1 m 2 r(r + 1) m2 q 2 m 3... 2 ( ) = p rn (rq) m 1 r + 1 m2 ( r + 2 2 q ( Γ(r + M) M!Γ(r) qm ) m3 ( r + M 1 3 q... M M M ( r + i 1 ln L = nr ln(1 q) + m i ln q + m i ln i i=1 i=1 ) mm ) mm q Agata Boratyńska (SGH) SAiTR wykład 3 i 4 21 / 25 ).
Różniczkując po r i q otrzymujemy równania n ln(1 q) + m 1 r + m 2 r + 1 + + m M r + M 1 = 0 Z drugiego równania mamy nr 1 q + n N q = 0. p = 1 q = r r + N, wstawiając do równania pierwszego otrzymujemy równanie n ln r r + N + m 1 + m 2 r r + 1 + + m M r + M 1 = 0, które rozwiązujemy numerycznie. Agata Boratyńska (SGH) SAiTR wykład 3 i 4 22 / 25
ZŁOŻONY ROZKŁAD UJEMNY DWUMIANOWY Cbin (r, p, F ) S = Y 1 + Y 2 + + Y N i N bin (r, p), Y i F Dystrybuanta P(S s) = P(S s N = i)p(n = i) = MGF i=0 i=0 ( M S (t) = Ee N ln M Y (t) p = 1 qm Y (t) Parametry: jeśli EY i = µ, VarY i = σ 2 to ES = µen = µr 1 p p VarS = r 1 p p σ2 + r 1 p p 2 µ 2 Γ(r + i) Γ(r)i! pr q i F i (s) E(S ES) 3 = npe(y 3 ) 3np 2 EYE(Y 2 ) + 2np 3 (EY ) 3 Agata Boratyńska (SGH) SAiTR wykład 3 i 4 23 / 25 ) r
TWIERDZENIE. Jeżeli S i, i = 1, 2,..., k mają rozkłady Cbin (r i, p, F ) i są niezależne, to S = k i=1 S i ma rozkład Cbin ( k i=1 r i, p, F ). Agata Boratyńska (SGH) SAiTR wykład 3 i 4 24 / 25
Rozkłady liczby szkód z klasy (a, b, 0) Rozkład zmiennej N jest rozkładem z klasy (a, b, 0) p k = P(N = k) = (a + b k )p k 1 dla k = 1, 2,.... Jeżeli powyższa zależność zachodzi dla k = m, m + 1,... to rozkład jest rozkładem z klasy (a, b, m). Jedynymi rozkładami z klasy (a, b, 0) są rozkład dwumianowy bin(n, p) wtedy a = p 1 p, b = p(n+1) rozkład Poissona Poiss(λ) wtedy a = 0, b = λ, rozkład ujemny dwumianowy bin (r, p) wtedy a = 1 p, b = (r 1)(1 p). 1 p, Agata Boratyńska (SGH) SAiTR wykład 3 i 4 25 / 25