Zdarzenia ekstremalne w teorii ubezpieczeń majątkowych

Podobne dokumenty
Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

Prawdopodobieństwo i statystyka

Matematyka ubezpieczeń majątkowych r.

Dystrybucje, wiadomości wstępne (I)

Prawdopodobieństwo i statystyka

N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Detekcja rozkładów o ciężkich ogonach

Prawa wielkich liczb, centralne twierdzenia graniczne

Matematyka ubezpieczeń majątkowych r.

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Prawdopodobieństwo i statystyka

Matematyka ubezpieczeń majątkowych r.

7 Twierdzenie Fubiniego

Dystrybucje. Marcin Orchel. 1 Wstęp Dystrybucje Pochodna dystrybucyjna Przestrzenie... 5

F t+ := s>t. F s = F t.

8 Całka stochastyczna względem semimartyngałów

Matematyka ubezpieczeń majątkowych r.

Statystyka i eksploracja danych

Rachunek prawdopodobieństwa i statystyka

Matematyka ubezpieczeń majątkowych r.

Wykłady... b i a i. i=1. m(d k ) inf

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Korzystając z własności metryki łatwo wykazać, że dla dowolnych x, y, z X zachodzi

Całki niewłaściwe. Całki w granicach nieskończonych

Notatki z Analizy Matematycznej 2. Jacek M. Jędrzejewski

Matematyka ubezpieczeń majątkowych r.

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Zadanie 1. są niezależne i mają rozkład z atomami: ( ),

Matematyka ubezpieczeń majątkowych r.

WYKŁAD Z ANALIZY MATEMATYCZNEJ I. dr. Elżbieta Kotlicka. Centrum Nauczania Matematyki i Fizyki

jest ciągiem elementów z przestrzeni B(R, R)

Równanie przewodnictwa cieplnego (I)

Rachunek prawdopodobieństwa i statystyka

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

1 Nierówność Minkowskiego i Hoeldera

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

O pewnych klasach funkcji prawie okresowych (niekoniecznie ograniczonych)

Biostatystyka, # 3 /Weterynaria I/

Zadania z Rachunku Prawdopodobieństwa III - 1

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

Ważne rozkłady i twierdzenia

Matematyka ubezpieczeń majątkowych r.

Jednowymiarowa zmienna losowa

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu.

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Finanse i Rachunkowość studia niestacjonarne Wprowadzenie do teorii ciągów liczbowych (treść wykładu z 21 grudnia 2014)

5 Równania różniczkowe zwyczajne rzędu drugiego

2. Wykaż, że moment pierwszego skoku w procesie Poissona. S 1 := inf{t : N t > 0} jest zmienną losową o rozkładzie wykładniczym z parametrem λ.

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

Teoria miary. WPPT/Matematyka, rok II. Wykład 5

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

Matematyka ubezpieczeń majątkowych r.

Przykładami ciągów, które Czytelnik dobrze zna (a jeśli nie, to niniejszym poznaje), jest ciąg arytmetyczny:

Zasada indukcji matematycznej

Zadanie 1. Zmienne losowe X 1, X 2 są niezależne i mają taki sam rozkład z atomami:

Statystyka i eksploracja danych

Szkice do zajęć z Przedmiotu Wyrównawczego

Statystyka matematyczna dla leśników

Numeryczne aproksymacje prawdopodobieństwa ruiny

ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ

MUMIO Lab 6 (składki, kontrakt stop-loss)

2. Wykaż, że moment pierwszego skoku w procesie Poissona. S 1 := inf{t : N t > 0} jest zmienną losową o rozkładzie wykładniczym z parametrem λ.

Matematyka ubezpieczeń majątkowych r.

EGZAMIN MAGISTERSKI, Biomatematyka

Wykłady ostatnie. Rodzinę P podzbiorów przestrzeni X nazywamy σ - algebrą, jeżeli dla A, B P (2) A B P, (3) A \ B P,

5 Przegląd najważniejszych rozkładów

1 Relacje i odwzorowania

Agata Boratyńska Statystyka aktuarialna... 1

Zmienne losowe ciągłe i ich rozkłady

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Prawdopodobieństwo i statystyka

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Zmienne losowe ciągłe i ich rozkłady

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

Funkcje rzeczywiste jednej. Matematyka Studium doktoranckie KAE SGH Semestr letni 2008/2009 R. Łochowski

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Rozdział 6. Ciągłość. 6.1 Granica funkcji

Zagadnienia brzegowe dla równań eliptycznych

Wykład 3 Jednowymiarowe zmienne losowe

Funkcja tworząca Funkcja charakterystyczna. Definicja i własności Funkcja tworząca momenty

Układy równań i równania wyższych rzędów

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Prawdopodobieństwo i statystyka

Proces rezerwy w czasie dyskretnym z losową stopą procentową i losową składką

Rachunek prawdopodobieństwa 1B; zadania egzaminacyjne.

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Funkcja wykładnicza kilka dopowiedzeń

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie:

Dyskretne zmienne losowe

Transkrypt:

a Zdarzenia ekstremalne w teorii ubezpieczeń majątkowych Anna Miazek Politechnika Gdańska Wydział Fizyki Technicznej i Matematyki Stosowanej 2 czerwca 216

Streszczenie Niniejsza praca związana jest z teorią ruiny. Na wstępie wprowadzamy podstawowe definicje i twierdzenia. Następnie omówiona jest podwykładnicza rodzina rozkładów, modelująca zdarzenia ekstremalne oraz oszacowanie prawdopodobieństwa ruiny w tym przypadku. W dalszej części pracy zaprezentowane są dwa współczynniki związane ze zdarzeniami ekstremalnymi: indeks ekstremalny oraz indeks dużych roszczeń. Słowa kluczowe: Teoria ruiny, model Craméra-Lundberga, zdarzenia ekstremalne, rozkłady podwykładnicze, indeks ekstremalny, indeks dużych roszczeń. Dziedzina nauki i techniki, zgodnie z wymogami OECD: 1.1 Matematyka. 1

Abstract This paper treats about ruin theory. Firstly, we introduce basic definitions and theorems. Secondly, we describe subexponential distributions which model extremal events. We also present ruin probability approximation in large claim case. At the end, we show two coefficients associated with extremal events: extremal index and large claim index. Keywords: Ruin theory, Cramér-Lundberg model, extremal events, subexponential distribution, extremal index, large claim index. 2

Spis treści Spis oznaczeń 4 Wprowadzenie 5 1 Teoria ruiny 7 1.1 Model Craméra-Lundberga i ruina....................... 7 1.2 Współczynnik dopasowania a wielkość szkody................. 2 1.3 Rozkłady podwykładnicze............................ 22 2 Zdarzenia ekstremalne 31 2.1 Indeks ekstremalny................................ 31 2.1.1 Definicja.................................. 32 2.1.2 Estymacja................................. 37 2.2 Indeks dużych roszczeń.............................. 44 Podsumowanie 48 A Kody 49 A.1 Prawdopodobieństwo ruiny dla rozkładu Weibulla............... 49 A.2 Prawdopodobieństwo ruiny dla dużych roszczeń................ 52 A.3 Indeks ekstremalny................................ 54 A.4 Indeks dużych roszczeń.............................. 56 Bibliografia 58 3

Spis oznaczeń #(A) moc zbioru A 1 A funkcja charakterystyczna zbioru A D F asymptotyczna równoważność funkcji indeks dużych roszczeń d = równość rozkładów d dri EX zbieżność według dystrybuant funkcja bezpośrednio całkowalna w sensie Riemanna wartość oczekiwana zmiennej losowej X F (x) ogon dystrybuanty, 1 F (x) F I (x) 1 x EX F (t)dt h funkcja hazardu ĥ, L(f) transformata Laplace a-stieltjesa (funkcji f) NPC p.n. ψ(u) R Ri S F n T n θ net profit condition prawie na pewno, zbieżność prawie na pewno prawdopodobieństwo ruiny dla kapitału początkowego u współczynnik dopasowania funkcja całkowalna w sensie Riemanna klasa rozkładów podwykładniczych splot n-ty splot dystrybuanty F empiryczny indeks dużych roszczeń narzut bezpieczeństwa (rozdział 1) lub indeks ekstremalny (rozdział 2) koniec dowodu koniec przykładu 4

Wprowadzenie Podstawą teorii ruiny jest model ryzyka Craméra-Lundberga po raz pierwszy użyty przez Filipa Lundberga w 193 roku. Model ten opisuje wysokość skumulowanego kapitału (tzw. nadwyżki) ubezpieczyciela, który startując z kapitałem początkowym u pobiera od klientów składki w wysokości c oraz wypłaca odszkodowania o losowej wysokości w losowym momencie ich wystąpienia. Istotnym zagadnieniem jest tutaj prawdopodobieństwo ruiny czyli zdarzenia, że nadwyżka spadnie poniżej zera. Oczywiście ubezpieczyciel chciałby zminimalizować ryzyko bankructwa. Można tego dokonać ustalając wysoki kapitał początkowy oraz odpowiednio dobierając składkę c. Fundamentalne twierdzenie teorii ruiny umożliwia oszacowanie prawdopodobieństwa ruiny. Kolejnym ważnym elementem w teorii ubezpieczeń majątkowych są zdarzenia ekstremalne (ang. extremal events). Nie istnieje ścisła definicja tego terminu. Możemy jednak podać kilka cech charakterystycznych takich zdarzeń: występują one rzadko; jednocześnie wysokość szkód jest bardzo duża w stosunku do zwykłych ( małych ) roszczeń (zamiennie będziemy mówić o dużych szkodach ); zazwyczaj spowodowane są przez katastrofy naturalne takie jak trzęsienia ziemi, tsunami, pożary. Zdarzenia ekstremalne najczęściej modelowane są przez rozkłady Pareto lub inne rozkłady ciężkoogonowe. Duże znaczenie ma też fakt, że zdarzenia ekstremalne mogą nie być niezależne (a jest to podstawowe założenie modelu Craméra-Lundbrega). Prostym przykładem jest pożar. Rozprzestrzeniający się ogień zwiększa prawdopodobieństwo spłonięcia sąsiednich budynków. W efekcie powstają kolejne szkody, skupiające się na krótkim odcinku czasu. Celem niniejszej pracy jest przedstawienie teorii ruiny w kontekście zdarzeń ekstremalnych. Na początku pierwszego rozdziału zostaną omówione podstawowe wyniki dla małych roszczeń. Następnie przejdziemy do podwykładniczej rodziny rozkładów modelujących duże szkody. Rozdział zakończymy oszacowaniem prawdopodobieństwa ruiny dla takiego rodzaju roszczeń wraz z przykładową symulacją wykonaną w programie R. Rozdział drugi 5

koncentruje się na współczynnikach opisujących rozkłady zdarzeń ekstremalnych. Wprowadzimy definicje indeksu ekstremalnego oraz indeksu dużych roszczeń. Pokażemy także sposoby ich estymacji oraz interpretacji. 6

Rozdział 1 Teoria ruiny W pierwszej części tego rozdziału omówimy podstawowe zagadnienia dotyczące teorii ruiny. Wprowadzimy definicję modelu Craméra-Lundberga oraz prawdopodobieństwa ruiny. Ponieważ prawdopodobieństwo ruiny w ogólności nie jest łatwe do obliczenia, przedstawimy także twierdzenie Craméra-Lundberga podające jego oszacowania. Istotnym elementem będzie współczynnik dopasowania R pojawiający się w tym twierdzeniu. Omówimy go w drugiej części rozdziału. Klasyczne twierdzenie Craméra-Lundberga opiera się na założeniu, że R istnieje (co jest spełnione tylko w przypadku małych roszczeń), dlatego w trzeciej części zajmiemy się rozkładami podwykładniczymi, modelującymi duże szkody, oraz oszacowaniem prawdopodobieństwa ruiny w tym przypadku. 1.1 Model Craméra-Lundberga i ruina Klasyczny model ryzyka ubezpieczeniowego dany jest wzorem N(t) X k, N(t) >, U(t) = u + ct S(t), S(t) = k=1 N(t) =. (1.1) gdzie t, u oznacza kapitał początkowy (zwany też nadwyżką początkową), c to intensywność składki, a proces (S(t)) t definiuje sumaryczną kwotę odszkodowań. Z reguły zakłada się, że zmienne losowe X 1, X 2,... (oznaczające wartość pojedynczej szkody) są niezależne od siebie oraz od procesu (N(t)) t zliczającego ilość szkód na odcinku czasu [, t]. Przyjmiemy też naturalne założenie, że wysokość szkody jest dodatnią zmienną losową, tj. generyczna zmienna losowa X > p.n. Definicja 1.1 [2] Będziemy mówić, że X (dystrybuanta F X ) ma nośnik (, ), jeśli F X (x) < 1 dla x > oraz F X (x) = dla x. 7

Możemy rozważać różne modele dane wzorem 1.1, w zależności od tego jak dobierzemy rozkłady zmiennych X, N(t). Najbardziej popularny jest model Craméra-Lundberga, przedstawiony poniżej. Definicja 1.2 Rozkład kratowy, [2] Mówimy, że X (dystrybuanta F ) ma rozkład kratowy jeśli istnieją a, d takie, że P (X = a + dn) = 1. Największe d o tej własności nazywamy maksymalnym krokiem n= X (dystrybuanty F ). Definicja 1.3 Model Craméra-Lundberga, [2] Modelem Craméra-Lundberga nazywamy model (1.1) zadany przez następujące warunki: (a) Proces wielkości szkód (X k ) k N, gdzie dodatnie zmienne losowe X k są niezależne, a zmienna generyczna o rozkładzie niekratowym ma skończoną wartość oczekiwaną EX = µ i wariancję V arx. (b) Czasy wystąpienia szkód zmienne losowe T 1, T 2,... takie, że < T 1 < T 2 <... prawie na pewno oraz zmienne losowe Y 1 = T 1, Y k = T k T k 1, k 2 są niezależne i mają rozkład wykładniczy o skończonej wartości oczekiwanej EY = 1 λ. Zmienne Y k wyrażają odstępy czasu pomiędzy wystąpieniami kolejnych szkód. (c) Proces liczący szkody (N(t)) t zdefiniowany jest jako N(t) = sup {n 1 : T n t}, t, przy czym ustalamy konwencję, że sup =. (d) Zmienne losowe X 1, X 2,... oraz Y 1, Y 2,... są niezależne. Z powyższej definicji wynika, że proces (N(t)) t jest jednorodnym procesem Poissona z intensywnością λ. Fakt 1.4 a Dla ustalonego t zmienna losowa N(t) ma rozkład Poissona z parametrem λt. Dowód { n } {N(t) n} = {T n t} = Y k t. Suma n k=1 Y k niezależnych zmiennych losowych o rozkładzie wykładniczym ma rozkład k=1 Erlanga z parametrami n i λ, a jego dystrybuanta ma postać ( n ) P Y k t k=1 n 1 = 1 k= λt (λt)k e. k! 8

Zatem ( n ) P (N(t) = n) = P (N(t) n) P (N(t) n + 1) = P Y k t P n 1 λt (λt)k = 1 e k! k= 1 + n k= λt (λt)k e k! k=1 λt (λt)n = e, n! ( n+1 k=1 Y k t ) z czego wynika, że N(t) ma rozkład Poissona z parametrem λt. Rozkłady zmiennych losowych X 1, X 2,..., Y 1, Y 2,... możemy oszacować na podstawie danych zebranych przez ubezpieczyciela, wartość u zazwyczaj narzucona jest z góry. Powstaje pytanie: w jaki sposób dobrać wysokość składki c? W pierwszej kolejności naturalnym rozwiązaniem jest obliczenie wartości oczekiwanej procesu U(t), w prosty sposób korzystając z twierdzenia Walda (przy założeniu niezależności procesów (N(t)) t i (X k ) k N ): EU(t) = u + ct ES(t) = u + ct λµt = u + (c λµ) t. Teraz zauważmy, że EU(t) t c λµ gdy t. Sensownie jest wymagać, by spełniony był warunek c λµ >. Jest to tzw. net profit condition (NPC). Warunek ten możemy również zapisać w postaci θ = c λµ 1 >. Stałą θ nazywa się narzutem bezpieczeństwa (bądź narzutem na ryzyko). Powyższy warunek musi być spełniony jeśli chcemy by nadwyżka ubezpieczyciela średnio była większa od zera. Oczywiście im wyższe θ tym bezpieczniejsza dla ubezpieczyciela jest wysokość składki c = (1 + θ)λµ. Z drugiej jednak strony wyższa składka jest mniej konkurencyjna dla klientów (zakładając, że ubezpieczyciel nie jest monopolistą na rynku). Kolejna definicja wprowadza pojęcie prawdopodobieństwa ruiny, czyli stanu, w którym proces nadwyżki U(t) spadnie poniżej zera. Definicja 1.5 Ruina, [2] Prawdopodobieństwo ruiny na skończonym odcinku czasu [, T ] definiujemy jako ψ(u, T ) = P (U(t) < dla pewnego t T ), < T <, u. Prawdopodobieństwo ruiny w nieskończonym horyzoncie czasu definiujemy jako ψ(u) = ψ(u, ), u. Definiujemy także czas ruiny τ(t ) = inf {t : t T, U(t) < }, < T, gdzie przyjmujemy konwencję inf =. Będziemy pisać τ = τ( ) dla ruiny w nieskończonym horyzoncie czasu. 9

Jasne jest, że ubezpieczyciel chce zminimalizować prawdopodobieństwo ruiny, w szczególności by zachodził warunek ψ(u) < 1 dla dowolnego u. Z definicji modelu Craméra- Lundberga wynika, że ruina może nastąpić tylko w chwili pojawienia się roszczenia, tj. w chwilach T 1, T 2,.... Zatem mamy ψ (u) = P (u + ct S(t) < dla pewnego t ) = P (u + ct n S(T n ) < dla pewnego n 1) ( ) n = P u + (cy k X k ) < dla pewnego n 1 = P k=1 ( n sup n 1 k=1 (X k cy k ) > u ). (1.2) Równoważnie 1 ψ (u) = P ( sup n 1 ) n (X k cy k ) u. k=1 Jak widać znalezienie prawdopodobieństwa ruiny sprowadza się do znalezienia rozkładu sumy oraz supremum pewnych zmiennych losowych. Na ogół jednak nie jest to takie proste zadanie. Chcemy teraz podać twierdzenie, które pozwala oszacować prawdopodobieństwo ruiny. Zanim do niego przejdziemy omówimy definicję funkcji bezpośrednio całkowalnych w sensie Riemanna, która pojawia się w twierdzeniu pomocniczym. W celu porównania przedstawimy także definicję zwykłej całkowalności w sensie Riemanna. Definicja 1.6 Całkowalność w sensie Riemanna, [1] (a) Niech [, a] będzie danym przedziałem. Przez podział P przedziału [, a] rozumieć będziemy skończony zbiór punktów = x x 1... x n = a. Będziemy pisać x i = x i x i 1, i = 1, 2,..., n. Niech f będzie ograniczoną funkcją rzeczywistą określoną na [, a]. Każdemu podziałowi P odpowiadają liczby Niech M i = sup f(x), m i = inf f(x), x i 1 x x i, n U(P, f) = M i x i, n L(P, f) = m i x i. i=1 i=1 a f dx = inf U(P, f), a f dx = sup L(P, f), (1.3) gdzie kresy górny i dolny są brane ze względu na wszystkie możliwe podziały przedziału [, a]. Lewe strony równości (1.3) nazywają się odpowiednio górną i dolną całką Riemanna funkcji f na przedziale [, a]. Jeżeli całka górna jest równa całce dolnej, to powiemy, że funkcja f jest całkowalna w sensie Riemanna (ang. Riemann integra- 1

ble, Ri) na przedziale [, a]. Wówczas całką Riemanna funkcji f nazywamy a f(x) dx = a f dx = a f dx. (b) Mówimy, że funkcja f : [, ) R jest całkowalna w sensie Riemanna jeśli istnieje granica Wówczas Uwaga 1.7 [1] a lim f(t) dt. a a f(x) dx = lim f(t) dt. a Okazuje się, że w powyższej definicji wystarczy brać regularne podziały przedziału [, a]. Zatem dla h = a n a f(x) dx = lim a/h h sup h m=1 (m 1)h t mh f(t) = lim a/h h inf f(t). h (m 1)h t mh m=1 Definicja 1.8 Bezpośrednia całkowalność w sensie Riemanna, [7] Mówimy, że funkcja f : [, ) R jest bezpośrednio całkowalna w sensie Riemanna (ang. directly Riemann integrable, dri), jeśli dla dowolnego h > szeregi h sup n=1 (n 1)h t nh f(t), h inf f(t) (n 1)h t nh n=1 są zbieżne bezwzględnie oraz Wówczas lim h h f(t) dt = lim sup n=1 (n 1)h t nh f(t) = lim h sup h n=1 (n 1)h t nh h inf f(t). h (n 1)h t nh n=1 f(t) = lim h inf f(t). h (n 1)h t nh n=1 Zauważmy, że dla funkcji znikających poza skończonym przedziałem [, a] bezpośrednia całkowalność jest po prostu zwykłą całkowalnością. Zasadniczą różnicą w dwóch powyższych definicjach jest kolejność granic przy funkcjach całkowalnych na przedziale [, ): (Ri) (dri) a/h lim lim h a h sup n=1 (n 1)h t nh lim h sup h n=1 (n 1)h t nh f(t) f(t) = lim h lim a/h h a sup n=1 (n 1)h t nh f(t). 11

Oznacza to, że klasa funkcji bezpośrednio całkowalnych jest węższa, gdyż dla funkcji całkowalnych w sensie Riemanna nie zawsze szereg sup f(t) jest zbieżny. Stąd mamy n=1 (n 1)h t nh też, że jeśli f jest dri, to jest Riemannowsko całkowalna. Implikacja w drugą stronę nie zachodzi. Poniższe dwie własności będą przydatne w dowodzie twierdzenia 1.13. Lemat 1.9 Własności dri, [2] (a) Jeśli f jest Riemannowsko całkowalna (tj. f(x) dx < ), nierosnąca oraz f, to f jest dri. (b) Jeśli f, g są dri, to f g również jest dri. Przykład 1.1 Funkcja, która jest Ri i nie jest dri, [3] Niech α będzie liczbą niewymierną z przedziału (, 1). Niech k, n N oraz k+nα będą środkami podstaw trójkątów o wysokości 1. Załóżmy, że te podstawy leżą na osi x i α jest na tyle małe, by nie pokrywały się. Jeśli dobierzemy długości podstaw tak, by suma pól trójkątów była skończona, to funkcja skonstruowana z boków trójkątów nie leżących na osi x oraz odcinków je łączących jest całkowalna w sensie Riemanna. Zauważmy jednak, że istnieje nieskończenie wiele odcinków (n 1)h t nh, które zawierają podstawy trójkątów. Zatem funkcja nie jest bezpośrednio całkowalna w sensie Riemanna, gdyż dla nieskończenie wielu n i szereg sup n=1 (n 1)h t nh f(t) nie może być zbieżny. sup f(t) = 1 (n 1)h t nh Kolejną ważną definicją jest definicja transformaty Laplace a-stieltjesa, która także pojawia się w twierdzeniu 1.13. Definicja 1.11 Transformata Laplace a-stieltjesa, [2] Niech F będzie dystrybuantą zmiennej losowej X skoncentrowaną na (, ). Transformatą Laplace a-stieltjesa dystrybuanty F nazywamy funkcję Uwaga 1.12 ĥ(s) = Ee sx = e sx df (x), s R. (1) Wykładnicza nierówność Czebyszewa ([4]) mówi, że jeśli ĥ( s) = EesX < dla s >, to dla dowolnego x > P (X x) EerX, r [, s]. erx To oszacowanie okaże się istotne w rozdziale 1.2. (2) Jeśli dystrybuancie F odpowiada gęstość f (rozkład jest ciągły), to ĥ(s) = e sx f(x) dx, co czasami oznacza się jako L(f)(s) (mówimy wtedy o transformacie funkcji f). Trans- 12

formatę Laplace a-stieltjesa (oraz transformatę odwrotną) stosuje się przy rozwiązywaniu równań całkowych, z czego będziemy korzystać w dowodzie kolejnego twierdzenia. Transformatę odwrotną definiuje się jako L 1 (F )(t) = f(t), gdzie F (s) = L(f)(s). Przydatnymi własnościami będą: (a) L(F G)(s) = L(F )(s) L(G)(s), gdzie F i G są dystrybuantami i splot definiujemy następująco: (F G)(x) = x F (x y) dg(y), x ; (b) L (G H) (s) = L(G)(s) s, gdzie G jest dystrybuantą oraz H(t) = 1 [, ) (t) funkcją Heaviside a. Powyższe własności oraz definicja splotu pochodzą z [3]. Przechodzimy teraz do podstawowego twierdzenia teorii ruiny. Twierdzenie 1.13 Craméra-Lundberga, [2] Rozważmy model Craméra-Lundberga oraz warunek NPC θ >. Oznaczmy przez F dystrybuantę zmiennych losowych X 1, X 2,... o wartości oczekiwanej EX = µ < oraz Załóżmy, że istnieje R > takie, że Wówczas ogon rozkładu F (x) = 1 F (x), x, f I ( R) = F I (x) = 1 µ x e Rx df I (x) = F (y) dy, x. c = 1 + θ. (1.4) λµ (a) Dla każdego u ψ(u) e Ru. (b) Jeśli ponadto zachodzi to ( ) (c) Jeśli F (x) = 1 exp x µ, to xe Rx F (x) dx <, lim u eru ψ(u) = C <, [ R 1 C = xe Rx F (x) dx]. θµ ψ(u) = 1 { } 1 + θ exp θ µ(1 + θ) u, u. 13

Uwaga 1.14 (1) Funkcja F I jest dystrybuantą 1. Ponieważ F (x) dla każdego x i µ >, zatem F I jest nieujemna, niemalejąca oraz lim x lim x 1 µ 1 µ x x F (u) du = 1 µ F (u) du = 1 µ F (u) du =, F (u) du = EX µ = 1, przy czym przedostatnia równość wynika z faktu mówiącego, że jeśli X p.n., to EX = P (X > x) dx [4]. Ponadto F I jest ciągła (w szczególności prawostronnie ciągła). (2) Funkcja f I jest transformatą Laplace a-stieltjesa dystrybuanty F I. (3) Warunek (1.4) nazywany jest warunkiem Craméra-Lundberga lub warunkiem małego roszczenia (ang. small claim condition), ze względu na (1.14). Możemy go zapisać równoważnie gdyż e Rx df I (x) = e Rx F (x) dx = c λ, (1.5) ( 1 x ) e Rx d F (y) dy = 1 e Rx F (x) dx = µ µ W dowodzie twierdzenia 1.13 skorzystamy z twierdzenia 1.15. Twierdzenie 1.15 Smith, [2] Niech Y będzie generyczną zmienną losową o niekratowej dystrybuancie F Y oraz EY = λ 1 <. Niech V (t) = EN(t) = E# {n 1 : Y 1 +... + Y n t}, t. (a) Jeśli h jest bezpośrednio całkowalna w sensie Riemanna, to t lim t h(t x) dv (x) = λ h(x) dx. c λµ. (b) Rozważmy równanie postaci g(t) = h(t) + t g(t x) df Y (x), t, gdzie h jest funkcją lokalnie ograniczoną. Wówczas jedyne rozwiązanie tego równania jest dane wzorem g(t) = t h(t x) dv (x), t. Ponadto jeśli h jest bezpośrednio całkowalna w sensie Riemanna, to lim g(t) = λ h(x) dx. (1.6) t 1 Jeśli funkcja F : [, ) R jest niemalejąca, prawostronnie ciągła oraz lim x to F jest dystrybuantą pewnego rozkładu. [4] F (x) = i lim F (x) = 1, x 14

Dowód twierdzenia 1.13 (a) Z (1.2) mamy ψ(u) = P ( u + ) i (cy k X k ) < dla pewnego i 1 k=1 ( i ) = P (X k cy k ) > u dla pewnego i 1 = P k=1 ( = lim n P {H(T i ) > u} i=1 ( n ) {H(T i ) > u} i=1 gdzie H(T i ) = i (X k cy k ). Teraz zauważmy, że k=1 n { } {H(T i ) > u} = max H(T i) > u 1 i n i=1 { } = max er H(T i) > e Ru 1 i n i = max e R(X j cy j ) > e Ru 1 i n j=1 { } = max Z i > e Ru, 1 i n gdzie Z i = i j=1 e R(X j cy j ). Zatem ψ(u) = lim n P ( = lim P n ( n ), {H(T i ) > u} i=1 ) max Z i > e Ru 1 i n ) lim n e Ru EZ n, (1.7) Ostatnia nierówność wynika z nierówności Dooba 2. Obliczmy teraz EZ n n EZ n = E e R(X j cy j ) 1 n = Ee R(X j cy j ) 1 n = Ee R X j Ee cr Y j j=1 j=1 j=1 2 = n Ee R X j j=1 λ λ + cr. Skorzystaliśmy z: (1) niezależność zmiennych losowych X 1, X 2,..., Y 1, Y 2,..., (2) funkcja generująca momenty dla rozkładu wykładniczego. Aby policzyć Ee R X j, j = 1,..., n, skorzystamy z założenia (1.4). Całkując przez części równość (1.5) 2 Nierówność Dooba: Niech {Z k } k N będzie nieujemnym submartyngałem. Wówczas dla n N, x > ( ) zachodzi P max Z k > x 1 k n EZ nx 1. [9] 15

u = F (x) u = f(x) w = e Rx w = 1 R erx mamy c λ = e Rx F (x) dx = 1 R erx F (x) + 1 R e Rx f(x) dx = 1 R + EeR X j R. Stąd Ee R X j = cr λ + 1 = cr + λ, λ n cr + λ λ EZ n = λ λ + cr = 1 j=1 i podstawiając ten wynik do (1.7) otrzymujemy tezę ψ(u) e Ru. (b) Oznaczmy δ(u) = 1 ψ(u). Mamy δ(u) = P (S(t) ct u dla każdego t > ) ( n ) = P (X k cy k ) u dla każdego n 1 = P = P k=1 ( n (X k cy k ) u + cy 1 X 1 dla każdego n 2, X 1 cy 1 u k=2 ( S(t) ct u + cy 1 X 1 dla każdego t >, X 1 cy 1 u), ) gdzie S(t) jest niezależną kopią S(t). Dalej mamy ( δ(u) = E P = = u+cs ( S(t) ct u + cy 1 X 1 dla każdego t >, X 1 cy 1 u Y 1, X 1 )) Podstawienie: ( P S(t) ct u + cs x dla każdego t > ) df (x)λe λs ds u+cs λe λs δ(u + cs x) df (x)ds δ(u) = λ [ z c euλ/c e λz/c u z = u + cs s dz = c ds z u ] δ(z x) df (x) Różniczkując obustronnie względem zmiennej u otrzymujemy δ (u) = λ c δ(u) λ c u dz. δ(u x) df (x). 16

Całkując od do t powyższą równość mamy δ(t) = δ() + λ c = δ() + λ c t t δ(u) du λ c t u δ(t u) du λ c t δ(u x) df (x)du δ(t x)f (x) dx = δ() + λ c = δ() + λ c t t δ(t x) δ(t x)f (x) dx δ(t x)f (x) dx. Przechodząc w ostatniej równości z t do nieskończoności i korzystając z NPC oraz z δ( ) = 1 ψ( ) = 1 otrzymujemy 1 = δ() + λµ c, skąd δ() = θ δ(t) = Podstawmy ψ(u) = 1 δ(u) oraz α = 1 1+θ. Mamy 1+θ. Ostatecznie θ 1 + θ + 1 t δ(t x) df I (x). (1.8) 1 + θ ψ(u) = 1 θ 1 + θ 1 1 + θ ( = α α F I (u) u u = 1 1 + θ (1 F I(u)) + 1 ψ(u x) df I (x) ) ψ(u x) df I (x) u ψ(u x) d (αf I (x)) u ψ(u) = αf I (u) + ψ(u x) d (αf I (x)). (1.9) Chcemy teraz skorzystać z twierdzenia 1.15. Oznaczmy df I,R (x) = e Rx d (αf I (x)), gdzie R jest takie jak w warunku (1.4). Przemnażając równość (1.9) przez czynnik e Rx otrzymujemy u e Ru ψ(u) = αe Ru F I (u) + e R(u x) ψ(u x) df I,R (x). Dzięki powyższej równości możemy zastosować twierdzenie 1.15, gdzie g(u) = e Ru ψ(u) oraz h(u) = αe Ru F I (u). Założenia twierdzenia 1.15 są spełnione, gdyż h jako iloczyn funkcji wykładniczej oraz antydystrybuanty jest lokalnie ograniczona i nieujemna. Dzięki całkowaniu przez części (należy je zastosować do drugiego członu po prawej stronie poniższej równości) mamy αe Ru F I (u) = u e Rx d (αf I (x)) R αf I (x)e Rx dx. u Czyli αe Ru F I (u) jest różnicą dwóch nierosnących funkcji całkowalnych w sensie Rie- 17

manna. Policzmy wartość oczekiwaną Y oraz całkę z funkcji h EY = h(x) dx = x df I,R (x) = αe Rx F I (x) dx = xαe Rx df I (x) = α µ u = F I (x) w = e Rx Całkowanie przez części: u = f I (x) w = 1 R erx xe Rx F (x) dx, [ 1 = α R erx F I (x) + 1 ] [ e Rx f I (x) dx = α 1 R R + 1 + θ ] R = αθ R. W przedostatniej równości skorzystaliśmy z założenia (1.4). Ostatecznie z (1.6) [ lim u eru ψ(u) = (EY ) 1 R h(x) dx = θµ xe Rx F (x) dx] 1. (c) Z równania (1.8) δ(u) = θ 1 + θ + 1 u δ(u x) df I (x) 1 + θ = θ 1 + θ + 1 (1 + θ) (δ F I) (u) poprzez użycie transformaty Laplace a-stieltjesa otrzymujemy L(δ)(s) 1 = 1 s L(δ)(s) = 1 s θ 1 + θ + 1 θ 1 + θ 2 = 1 θ s 1 + θ (1 + θ) L(δ)(s)L(F I)(s), ( 1 n= ) 1 1 (1 + θ) L(F I)(s) ( ) 1 n (1 + θ) L(F I)(s). (1.1) n= Skorzystaliśmy z: (1) a R L(a)(s) = a s i własność (a) uwagi 1.12; (2) (1 x) 1 = x n. Należy teraz zastosować odwrotną transformatę Laplace a-stieltjesa. Wykorzystamy własność (b) z uwagi 1.12. Niech G będzie takie, że L(G)(s) = θ 1 + θ ( ) 1 n (1 + θ) L(F I)(s). n= Stosując do powyższej równości odwrotną transformatę Laplace a-stieltjesa mamy G(u) = θ 1 + θ n= 1 (1 + θ) n L 1 [(L(F I )(s)) n ]. Równość (1.1) ma zatem postać L(δ)(s) = 1 sl(g)(s), więc z własności (b) δ(u) = (G H) (u), czyli 18

δ(u) = θ 1 + θ = θ 1 + θ n= n= 1 ( (1 + θ) n L 1 [L (F n )] H 1 n [F (1 + θ) n I H] (u), I ) (u) gdzie F n I oznacza n-ty splot dystrybuant F I, a FI (u) = 1 [, )(u). Zauważmy, że u [FI n H] (u) = H(u y) dfi n (y) = df n I (y) = F n (u). Ostatecznie δ(u) = 1 ψ(u) = θ (1 + θ) n FI n (u), 1 + θ n= ψ(u) = 1 θ (1 + θ) n FI n (u) (1.11) 1 + θ n= = 1 θ (1 + θ) n FI n (u) θ 1 + θ 1 + θ 1 [, )(u), n=1 1 1+θ ψ(u) = θ n=1 1+θ (1 + θ) n FI n (u), u 1, u <. (1.12) Dla rozkładu wykładniczego mamy F I (x) = 1 µ x e y µ dy = 1 e x µ, czyli F I jest dystrybuantą rozkładu Exp( 1 µ ), zatem n-ty splot ma rozkład Γ(n, 1 µ ). Stąd θ 1 + θ θ 1 + θ (1 + θ) n FI n (u) = 1 θ u 1 (1 + θ) n µ n 1 + θ n=1 n=1 (n 1)! xn 1 e x µ dx 2 = θ u 1 e x µ (1 + θ) n µ n 1 + θ (n 1)! xn 1 dx n=1 θ u ( = µ(1 + θ) 2 e x x µ µ(1 + θ) n=1 3 θ u = µ(1 + θ) 2 e x x µ e µ(1+θ) dx ( θ 1 = µ(1 + θ) 2 µ 1 µ(1 + θ) ( ) θ 1 + θ 1 1 ( ) 1+θ 1 u = µ(1 + θ) 2 e µ(1+θ) 1 µ(1 + θ) ( ) θ µ(1 + θ) = µ(1 + θ) 2 e u θ µ(1+θ) 1 θ (1 + θ) n FI n (u) = 1 ( ) 1 e u θ µ(1+θ) 1 + θ n=1 I ) n 1 1 (n 1)! dx ) 1 ( e u( ) ) 1 µ 1 µ(1+θ) 1 (1.13) Korzystamy przy tym z: (1) definicja rozkładu Γ(n, 1 µ ), (2) całkę i sumę możemy 19

zamienić na mocy twierdzenia o całkowalności sumy szeregu funkcyjnego (funkcje 1 f n (x) = µ n (1+θ) n (n 1)! xn 1 są całkowalne i szereg potęgowy f n (x) jest jednostajnie zbieżny na dowolnym podzbiorze [, u] R), (3) definicja funkcji f(x) = e x. Podstawiając (1.13) do (1.12) otrzymujemy ψ(u) = n=1 ( ) 1 1+θ exp u θ µ(1+θ), u 1, u <, czego należało dowieść. W twierdzeniu 1.13 uzyskaliśmy oszacowanie prawdopodobieństwa ruiny dla rozkładów spełniających small claim condition (1.4). Dla rozkładów wartości ekstremalnych to założenie nie jest spełnione, dlatego nie możemy korzystać z tego twierdzenia. Okazuje się, że ograniczenia prawdopodobieństwa ruiny w przypadku dużych szkód są inne niż dla niskich roszczeń. Kluczowy w ich wyprowadzaniu jest wzór (1.11) (do jego wyprowadzenia nie używaliśmy założenia o małych szkodach (1.4)). 1.2 Współczynnik dopasowania a wielkość szkody Parametr R występujący w twierdzeniu 1.13 jest bardzo ważny. Jego istnienie implikuje istnienie transformaty f I (t) w pewnym niepustym otoczeniu zera. Wówczas F I (a także F ) jest ograniczona w sposób wykładniczy, tzn. F (x) e Rx Ee RX, x >. (1.14) Wynika to z wykładniczej nierówności Czebyszewa (zobacz uwagę 1.12(1)). Ee RX jest skończone na mocy (1.4), dlatego możemy skorzystać z tej nierówności. (1.14) oznacza, że duże wartości szkód są bardzo mało prawdopodobne (funkcja wykładnicza e a szybko maleje dla dużych a). Uzasadnia to nazwanie warunku (1.4) jako small claim condition. Ze względu na istotne własności współczynnika R definiujemy Definicja 1.16 Współczynnik dopasowania, [2] Niech dany będzie proces nadwyżki U(t) zdefiniowany jak w definicji 1.3, gdzie X jest zmienną losową oznaczającą wartość szkody o dystrybuancie F. Liczbę R > spełniającą warunek e Rx F (x) dx = c λ nazywamy współczynnikiem dopasowania (lub wykładnikiem Lundberga). Nie zawsze jednak współczynnik dopasowania istnieje. W tabeli 1.1 umieszczone są rozkłady modelujące małe szkody w tych przypadkach możemy znaleźć parametr R. Okazuje się jednak, że dane dotyczące ubezpieczeń modelowane są dość często rozkładami z tabeli 2

Rozkład Ogon F lub gęstość f Parametry Nośnik Wykładniczy F (x) = e λx λ > x (, ) Gamma f(x) = βα Γ(α) xα 1 e βx α, β > x (, ) Weibulla F (x) = e axτ a >, τ 1 x (, ) Ucięty normalny f(x) = 2 π e x2 /2 x (, ) Jakikolwiek rozkład z ograniczonym nośnikiem Tabela 1.1: Rozkłady modelujące małe szkody, [2] 1.2 (uwzględniające duże szkody). Jednym z nich jest rozkład Pareto, dla którego w przypadku κ = 1 mamy F (x) = (1 + x) α oraz e Rx (1 + x) α dx =, ponieważ funkcja wykładnicza szybciej rośnie niż jakikolwiek wielomian. W związku z tym dla tego rozkładu (oraz innych rozkładów z tabeli 1.2) nie istnieje współczynnik dopasowania i nie możemy skorzystać z twierdzenia 1.13. Istotne jest więc znalezienie odpowiednika twierdzenia 1.13 dla zdarzeń ekstremalnych, czym zajmiemy się w rozdziale 1.3. Rozkład Ogon F lub gęstość f Parametry Nośnik Lognormalny f(x) = 1 2πσx e (ln x µ)2 /(2σ 2 ) µ R, σ > x (, ) ( κ α Pareto F (x) = κ+x) α, κ > x (, ) ( ) α Burra F (x) = κ κ+x τ α, κ, τ > x (, ) Weibulla F (x) = e axτ a >, τ (, 1) x (, ) Loggamma f(x) = αβ Γ(β) (ln x)β 1 x α 1 α, β > x (1, ) Tabela 1.2: Rozkłady uwzględniające duże szkody, [2] Poniższy przykład przedstawia rozkład, dla którego współczynnik R może istnieć lub nie w zależności od wyboru parametrów rozkładu. Przykład 1.17 Rozkład Weibulla Rozkład Weibulla znajduje się w obydwu tabelach 1.1 i 1.2, ponieważ ze względu na wartość parametru τ możemy modelować nim małe albo duże szkody. 21

Gdy τ (, 1): ustalmy τ = 1 2 i a = 1. Small claim condition nie jest spełniony, gdyż e Rx e x dx =, ponieważ e Rx szybciej rośnie do nieskończoności (R > ) niż e x maleje do zera. Gdy τ 1: ustalmy τ = 1 i a = 1. Small claim condition jest spełniony dla R < 1: e Rx e x dx = e x(1 R) dx = 1 1 R, R < 1. W tabeli 1.3 przedstawione jest prawdopodobieństwo ruiny obliczone na podstawie tysiąca symulacji procesu U(t) z ustalonym kapitałem początkowym, narzutem bezpieczeństwa i parametrem λ dla wykładniczego rozkładu odstępów między kolejnymi roszczeniami. Wartość τ zmienia się od,5 do 2. Oczywiście wraz ze wzrostem τ spada wartość składki c. Dla τ = 2 prawdopodobieństwo ruiny jest bardzo małe, co zgadza się z faktem, że rozkład ten modeluje małe szkody. Z kolei dla τ =, 5 duże roszczenia występują częściej, co skutkuje gwałtownym wzrostem prawdopodobieństwa ruiny do,6. Podobnie na rysunku 1.1 przedstawione są symulacje dla dwóch różnych wartości τ. Dla τ < 1 (u góry) pojawiają się duże szkody (nagłe skoki w dół) o wiele bardziej wyraźne niż dla τ > 1 (na dole). Kody do symulacji znajdują się w dodatku A.1. τ,5,8 1 1,2 2 µ = EX 1,414,651,5,49,222 c = (1 + θ)λµ,778,358,275,225,122 ψ(u),5992,3314,1897,944,15 Tabela 1.3: Prawdopodobieństwo ruiny i wysokość składki w zależności od wartości parametru τ rozkładu Weibulla, przy stałych parametrach a = 2, u = 5, λ =, 5, θ =, 1 dla 1 symulacji i < t 1 1.3 Rozkłady podwykładnicze Przejdziemy do omówienia rodziny rozkładów, która modeluje zdarzenia ekstremalne. Jest to klasa rozkładów podwykładniczych, które swoją nazwę biorą z faktu, że ich ogony maleją wolniej niż funkcja wykładnicza e x przy x (lemat 1.2(b)). W dalszym ciągu zakładamy, że F ma nośnik (, ), tj. F (x) < 1 dla x > oraz F (x) = dla x. Oznacza to, że roszczenie może być dowolnie duże. Powstaje pytanie: czy można modelować szkody rozkładem o ograniczonym nośniku? Oczywiście wartość szkody nie może przekroczyć pewnego poziomu (z pewnością jakimś ograniczeniem jest wartość wszystkich pieniędzy wyprodukowanych na świecie, oszacowanie to wydaje się 22

Rysunek 1.1: 5 symulacji U(t) dla szkody o rozkładzie Weibulla z parametrami τ {, 8; 1, 2} i a = 2, przy stałych parametrach u = 5, λ =, 5, θ =, 1 jednak zbyt przesadzone). Z drugiej strony wygodnie jest modelować roszczenie rozkładami o nośniku nieograniczonym z prawej strony, gdyż nigdy nie wiadomo jak wysoka będzie ta kwota. Ponadto, jak już wspomnieliśmy w tabeli 1.1, rozkłady z ograniczonym nośnikiem modelują małe szkody. Zaczniemy od wprowadzenia technicznej definicji, która potrzebna będzie w dalszej części rozdziału. Definicja 1.18 Asymptotyczna równoważność funkcji, [5] Mówimy, że dwie funkcje f, g : [, ) R są asymptotycznie równoważne, gdy x (oznaczamy f g przy x ), jeśli dla g(x) w sąsiedztwie punktu. f(x) lim x g(x) Definicja 1.19 Klasa rozkładów podwykładniczych, [2] = 1 (1.15) Mówimy, że dystrybuanta F o nośniku (, ) (przypominamy: oznacza to, że F (x) < 1 dla x > oraz F (x) = dla x ) należy do klasy rozkładów podwykładniczych S, jeśli dla każdego n 2 zachodzi F lim n (x) = n. (1.16) x F (x) Z uwagi na (1.15) mamy, że funkcje F n (x) i nf (x) z definicji 1.19 są asymptotycznie równoważne przy x. Z drugiej strony 23

P (S n > x) = F n (x), n 1 P (M n > x) = F n (x) = 1 P n (X x) = (1 P (X x)) P k (X x) nf (x), x. k= Zatem P (S n > x) nf (x) P (M n > x), x, P (S n > x) P (M n > x), x, gdyż relacja jest relacją równoważności. Oznacza to, że jeśli wartości szkód należą do rodziny rozkładów podwykładniczych, to ogon sumy zmiennych losowych jest wyznaczony przez ogon maksimum tych zmiennych. Zauważmy, że intuicyjnie tak właśnie zachowują się duże roszczenia. Jeśli spośród kilku szkód jedna ma bardzo dużą wartość, to te mniejsze nie mają wielkiego wpływu na całą sumę. Uzasadnione jest więc korzystanie z klasy rozkładów podwykładniczych w celu dopasowania modelu ze zdarzeniami ekstremalnymi. Jednocześnie zaznaczmy, że nie jest to jedyna rodzina rozkładów modelująca zdarzenia ekstremalne. Poniższe twierdzenie przedstawia trzy własności rodziny S. Własność (1.18) usprawiedliwia nazwę podwykładniczy. (1.18) oznacza, że ogon rozkładu nie maleje wystarczająco szybko by wygasić funkcję wykładniczą gaśnie zatem podwykładniczo (wolniej). Dla każdego R > mamy y e Rx df (x) e Ry y df (x) = e Ry F (y), y, co oznacza, że transformata Laplace a-stieltjesa nie istnieje dla żadnego R >. Lemat 1.2 Własności rozkładów podwykładniczych, [2] (a) Jeśli F S, to F (x y) lim = 1 (1.17) x F (x) jednostajnie dla y należących do zwartego podzbioru (, ). (b) Jeśli (1.17) zachodzi, to ε> e εx F (x), x. (1.18) (c) Jeśli F S, to dla ustalonego ε > istnieje stała K < taka, że dla każdego n 2 F n (x) F (x) K(1 + ε) n, x. (1.19) Dowód (a) i (c) 24

(a) Dla x i dowolnego n 1 zachodzi x F n (x t) df (t) = F (n+1) (x) F (x) x Korzystając z ostatniej równości mamy dla x y > 1 F n (x t) df (t) = F (x) F (n+1) (x), = 1 + F (x) F (n+1) (x) F (x) x F = 1 + n (x t) df (t). (1.2) F (x) F 2 (x) F (x) y = 1 + 1 + y F (x t) F (x) F (x) F (x) = 1 + F (y) + x df (t) + df (t) + F (x y) F (x) x y y F (x t) F (x) F (x y) F (x) (F (x) F (y)). df (t) df (t) Możemy wybrać x wystarczająco duże, żeby F (x) F (y) i wtedy 1 F (x y) F (x) Prawa strona dąży do 1 przy x, ponieważ ( ) F 2 (x) F (x) 1 F (y) (F (x) F (y)) 1. F 2 (x) F (x) 1 F (y) F (x) F (y) x 2 1 F (y) = 1. (1.21) 1 F (y) Jednostajna zbieżność na zwartym podzbiorze (, ) wynika z tego, że granica (1.21) nie zależy od y. Istotnie, jeśli F 2 (x) 2 oraz F (x) 1 przy x to dla każdego F (x) ε > istnieje N takie, że dla x > N zachodzi F 2 (x) 2 + ε i F (x) > 1 ε. Zatem F (x) ponieważ ε może być dowolnie małe i 1 F (y) < 1 na zwartym podzbiorze (, ), to F 2 (x) F (x) 1 F (y) F (x) F (y) 2 + ε 1 F (y) 1 ε F (y) = 1 + 2ε 1, x. 1 F (y) ε (c) Stosując (1.2) mamy F 2 (x) F (x) F 2 (x) F (x) = F (x) F 2 (x) = x = 1 + x x F (x t) F (x) F (x t) df (t) df (t) F (x t) df (t). (1.22) 25

Niech α n = sup F n (x)/f (x). Z (1.2), dla każdego T < zachodzi x α n+1 1 + z (1.22) gdzie A T = 1 + sup x x T x sup x T F n (x t) F (x) 1 F (x) 1 + A T + α n sup x T ( F (T )) 1 <. Mamy df (t) + sup df (t) + sup x T F (x) F 2 (x), F (x) x T x x F n (x t) F (x t) df (t) F (x t) F (x) { } F n (y) F (x t) df (t) F (y) F (x) sup y F (x) F 2 (x) F (x) 1 + 1 F 2 (x) F sup = sup = sup 2 (x) x T F (x) x T F (x) x T F (x) 1. F S, więc dla każdego ε > możemy wybrać T tak, by α n+1 1 + A T + α n (1 + ε). Ponieważ α 1 = 1 oraz przez indukcję α 2 1 + A T + 1 + ε = x + y, α 3 x + (x + y)y = x + xy + y 2 α 4 x + (x + xy + y 2 )y = x + xy + xy 2 + y 3. n 2 α n x y k + y n 1 = x yn 1 1 y 1 k= = x yn 1 1 + y n y n 1 y 1 gdzie x ozn. = 1 + A T, y ozn. = 1 + ε = x yn 1 y 1 + y n 1 x yn 1 1 y 1 + xy n 1 x yn y 1 = (1 + A T )ε 1 (1 + ε) n. Zatem α n (1 + A T ) ε 1 (1 + ε) n, co implikuje (1.19) dla K = 2 (1 + A T ) ε 1. Przejdziemy teraz do fundamentalnego twierdzenia z punktu widzenia zdarzeń ekstremalnych. Przy założeniu podwykładniczego rozkładu wartości szkód pokażemy w jaki sposób oszacować prawdopodobieństwo ruiny. W dowodzie skorzystamy z własności (1.19). Twierdzenie 1.21 Craméra-Lundberga dla dużych roszczeń, [2] Rozważmy model Craméra-Lundberga z warunkiem NPC θ >. Jeśli F I S, to ψ(u) θ 1 F I (u), u. 26

Dowód Skorzystamy z równania (1.11) 1 ψ(u) = θ 1 + θ Równoważnie dla u mamy ψ(u) = ψ(u) F I (u) = θ 1 + θ θ 1 + θ (1 + θ) n FI n (u), u. n= (1 + θ) n FI n (u), n= n F n I (u) (1 + θ) n= F I (u). Z definicji rozkładu podwykładniczego otrzymujemy ψ(u) F I (u) θ 1 + θ (1 + θ) n n = θ 1, u. n= Sumę z granicą możemy zamienić na mocy twierdzenia Lebesgue a o zbieżności ograniczonej 3. Istotnie, (1 + θ) 1 < 1, więc istnieje ε > takie, że (1 + θ) 1 (1 + ε) < 1. Stąd i z (1.19) (1 + θ) n FI n (u) F I (u) (1 + θ) n K(1 + ε) n, zatem możemy skorzystać z twierdzenia Lebesgue a o zbieżności ograniczonej. Na mocy powyższego twierdzenia, o ile F I S, mamy ψ(u) 1 θ ( 1 1 u ) F (y) dy, u. (1.23) µ Prawą stronę (1.23) możemy więc traktować jako oszacowanie prawdopodobieństwa ruiny w przypadku dużych roszczeń. Uwaga 1.22 W twierdzeniu 1.21 zakładamy, że F I S. Nie zawsze F S implikuje F I S. Oznacza to, że nie możemy skorzystać z oszacowania (1.23) dla wszystkich rozkładów modelujących zdarzenia ekstremalne. Na potrzeby tej pracy pokażemy, że dla rozkładów Pareto i Weibulla warunek F S F I S jest spełniony, co przedstawia przykład 1.25 (można również pokazać, że własność ta zachodzi dla wszystkich rozkładów z tabeli 1.2, [2]). Definicja 1.19 jest dość trudna do sprawdzenia, ze względu na to, że warunek (1.16) 3 Twierdzenie Lebesgue a o zbieżności ograniczonej: Niech f 1, f 2,..., f, g będą określone na przestrzeni probabilistycznej (Ω, F, P ). Jeżeli dla funkcji całkowalnej g zachodzą nierówności f n g, n N, to wszystkie funkcje f n są całkowalne, a jeśli ponadto f n f p.n., to f jest całkowalna i lim n fn(x) dp (x) = f(x) dp (x). [4] Ω Ω 27

musi być spełniony dla każdego n 2. Lemat 1.24 przedstawia warunki dostateczne na to by F, F I S. Dzięki nim w prostszy sposób możemy sprawdzić czy dany rozkład jest podwykładniczy bądź wykluczyć taką możliwość. 28

Definicja 1.23 Funkcja hazardu, [2] Niech F będzie dystrybuantą i załóżmy, że istnieje jej pochodna f (gęstość rozkładu). Funkcję x h(x) = f(x) F (x) nazywamy funkcją hazardu rozkładu o dystrybuancie F. Lemat 1.24 Warunki dostateczne na rozkład podwykładniczy, [9] Niech h(x) będzie funkcją hazardu rozkładu o dystrybuancie F i gęstości f. (a) Jeśli funkcja hazardu istnieje, µ < oraz lim sup x xh(x) <, to F, F I S. (b) Jeśli rozkład o dystrybuancie F jest absolutnie ciągły, jego funkcja hazardu h(x) od pewnego x maleje do zera oraz funkcja g(x) = e xh(x) F (x) jest całkowalna na przedziale [, ), to F S. (c) Jeśli zachodzą warunki lim h(x) =, lim x xh(x) =, x to F I S. [2] h(tx) lim x h(x) = tδ, dla pewnego δ [ 1, ), t >, Przykład 1.25 Rozkłady podwykładnicze (1) Rozkład Pareto. Skorzystamy z 1.24(a). Mamy F (x) = ( ) κ α, f(x) = κ + x ακ α α, h(x) = przy x. (κ + x) α+1 κ + x więc F, F I S. xh(x) = αx α <, x, κ + x (2) Rozkład Weibulla z parametrami a >, τ (, 1). Skorzystamy z 1.24(b). Mamy F (x) = e axτ, h(x) = aτx τ 1 przy x. g(x) dx = e xh(x) F (x) dx = ponieważ τ 1 <. Otrzymujemy F S. e a(τ 1)xτ dx <, 29

Aby zbadać, czy F I S zastosujemy 1.24(c). Mamy lim h(x) = lim x x aτxτ 1 = lim xh(x) = lim x x aτxτ = lim x h(tx) h(x) = lim x aτ(tx) τ 1 aτx τ 1 = t τ 1 = t δ, dla δ = τ 1 [ 1, ), t >, dzięki czemu również F I S. Przykład 1.26 Zobaczmy jak sprawdza się oszacowanie (1.23) w praktyce. Wygenerujemy 1 symulacji dla 11 wartości kapitału początkowego u {1, 11,..., 2}. Szkody mają rozkład Weibulla z parametrami τ =, 5 i a = 1, odstęp czasu między kolejnymi roszczeniami modelujemy rozkładem wykładniczym z λ =, 5 (czyli na jednostkę czasu przypadają 2 szkody). Do obliczenia składki c wykorzystamy narzut bezpieczeństwa θ =, 1. Ze względu na to, że nie możemy zaprogramować nieskończonego horyzontu czasowego zakładamy, że maksymalny czas to 1 jednostek. Symulacje wykonamy w R funkcją ruina(seq(1, 2, by = 1),.5,.1, 1, 1) (kod przedstawiony jest w dodatku A.2). Wyniki przedstawia rysunek 1.2. Dla wybranego rozkładu Weibulla możemy obliczyć µ = 2 oraz ψ(u) 1 ( 1 1 u ) F (y) dy θ µ = 1 ( 1 1 u ) e y dy = 1 θ µ θ 1 ( 2 2e u ( u + 1 )). θµ Wzór ten wykorzystamy w programie do wyznaczenia teoretycznych wartości ψ(u), na wykresie zaznaczonych na czarno. Na czerwono przedstawione są wartości prawdopodobieństwa ruiny uzyskane z symulacji. Widać, że wraz ze wzrostem u oszacowanie staje się dokładniejsze. Potwierdza to poprawność wzoru (1.23). Rysunek 1.2: Wykres zależności prawdopodobieństwa ruiny (czerwony symulacja, czarny teoretyczne) w zależności od wartości kapitału początkowego u 3

Rozdział 2 Zdarzenia ekstremalne W tym rozdziale przedstawimy dwa narzędzia związane ze zdarzeniami ekstremalnymi. Indeks ekstremalny jest współczynnikiem, który mówi o tendencji dużych szkód do występowania jedna po drugiej, co może świadczyć o pewnej zależności danych. Indeks dużych roszczeń pozwala sprawdzić jaką część całkowitej straty stanowią duże szkody. Dzięki niemu możemy badać czy rozkład danych jest ciężkoogonowy, a także porównywać różne zestawy danych między sobą względem tej cechy. 2.1 Indeks ekstremalny Duże szkody najczęściej spowodowane są przez huragany, trzęsienia ziemi, powodzie. W takich przypadkach zazwyczaj roszczenia kumulują się i nie możemy traktować ich jako niezależnych. Na rysunku 2.1 widać jak duże roszczenia tworzą skupiska np. w okolicach 15 szkody. Będziemy rozważać równolegle stacjonarne ciągi oraz niezależne zmienne losowe. Przedstawimy szereg twierdzeń, które doprowadzą do definicji indeksu ekstremalnego. Mierzy on jak bardzo oddalamy się od niezależności. Niech X 1,..., X n będzie ściśle stacjonarnym ciągiem zmiennych losowych o wspólnej dystrybuancie F. Przez X 1,..., X n oznaczać będziemy niezależne zmienne losowe o dystrybuancie F. Jak wcześniej definiujemy maksimum jako M n = max (X 1,..., X n ) (analogicznie M ( n = max X 1,..., X ) n ). Definicja 2.1 Stacjonarność w węższym sensie, [2] Mówimy, że ciąg (X n ) n N jest stacjonarny w węższym sensie (ściśle stacjonarny), jeśli t1 <...<t m h N (X t1, X t2,..., X tm ) d = (X t1 +h, X t2 +h,..., X tm+h). 31

Rysunek 2.1: Wartości 3 roszczeń ze zbioru AutoBi (przykład 2.18); czerwona linia na poziomie 2 2.1.1 Definicja Zaczniemy od lematu, który opiera się na twierdzeniu Poissona 1. Zmienna losowa n B n = 1 { } Xi >u n i=1 ( ) ma rozkład dwumianowy z parametrami n, F (u n ), gdyż jest to suma n niezależnych ( ) zmiennych losowych o rozkładzie dwumianowym z parametrami 1, F (u n ). Na mocy twierdzenia Poissona B n d Poi(τ), o ile nf (un ) τ przy n. Ponadto P ( M n u n ) = P (B n = ) e τ, n. Uzasadnia to nazwę poniższego lematu. Lemat 2.2 Aproksymacja Poissona, [2] Niech X 1,..., X n będą niezależnymi zmiennymi losowymi o dystrybuancie F. Dla ustalonego τ [, ] oraz ciągu liczb rzeczywistych (u n ) n N równoważne są warunki nf (u n ) n τ (2.1) P ( M n u n ) n e τ. (2.2) a 1 Twierdzenie Poissona: Jeśli n, p n, np n λ, to ( ) n k p k n (1 p n) n k λk k! eλ. [4] 32

Dowód (a) τ < Jeśli (2.1) zachodzi, to P ( M n u n ) = F n (u n ) = ( ) ( n 1 F (u n ) 1 n) τ n e τ, n. Załóżmy, że zachodzi (2.2) oraz (nie wprost) F (u n ), n. Wówczas F (u nk ) jest ograniczony z dołu przez jakieś a > dla pewnego podciągu (n k ). Wtedy P ( M nk u nk ) = F n k (u nk ) = ( 1 F (u nk )) nk, k, co jest sprzeczne z założeniem (2.2). Zatem F (u n ), n. Logarytmując (2.2) otrzymujemy ( ) n ln 1 F (u n ) τ, n. Korzystając z własności ln (1 x) x dla x mamy ( ) nf (u n ) n ln 1 F (u n ) τ, n, (b) τ = co daje (2.1). Załóżmy, że zachodzi (2.1) i nie zachodzi (2.2), tj. P ( M n u n ), n. Wówczas istnieje podciąg (n k ) taki, że P ( M nk u nk ) e τ przy k dla pewnego τ <. To z kolei implikuje (na mocy przypadku (a)), że n k F (u nk ) τ <, k co prowadzi do sprzeczności z założeniem. Załóżmy, że zachodzi (2.2) i nie zachodzi (2.1). Wtedy P ( M n u n ) n oraz n k F (u nk ) τ <, k. Jednak wówczas P ( M n u n ) = F n (u n ) = ( ) ( n 1 F (u n ) 1 n) τ n e τ, n, co prowadzi do sprzeczności. Powyższy lemat można także sformułować dla stacjonarnych ciągów. Wówczas potrzebujemy dodatkowych założeń. Pierwsze z nich, warunek D(u n ), mówi o tym, że grupa zmiennych losowych z dalszej przeszłości jest asymptotycznie niezależna od tej z przyszłości (jednak niezależność niekoniecznie musi zachodzić między sąsiadującymi zmiennymi). Definicja 2.3 Warunek D(u n ), [6] Niech F i1,i 2,...,i n (x 1, x 2,..., x n ) = P (X i1 x 1, X i2 x 2,..., X in x n ) 33

będzie dystrybuantą rozkładu łącznego zmiennych X i1, X i2,..., X in i oznaczmy F i1,i 2,...,i n (u, u,..., u) = F i1,i 2,...,i n (u), gdzie i 1, i 2,..., i n, n N, x 1, x 2,..., x n, u R. Niech (u n ) n N będzie ciągiem liczb rzeczywistych. Mówimy, że ciąg zmiennych losowych (X i ) i N spełnia warunek D(u n ) jeśli dla każdego n, l N oraz każdego wyboru liczb całkowitych i 1, i 2,..., i p, j 1, j 2,..., j p że zachodzi 1 i 1 < i 2 <... < i p < j 1 < j 2 <... < j p n, j 1 i p l F i1,i 2,...,i p,j 1,j 2,...,j p (u n ) F i1,i 2,...,i p (u n )F j1,j 2,...,j p (u n ) < α n,l i α n,ln przy n dla pewnego ciągu (l n ) takiego, że l n = o(n). Definicja 2.4 Warunek D (u n ), [6] takich, Niech (u n ) n N będzie ciągiem liczb rzeczywistych. Mówimy, że ciąg zmiennych losowych (X i ) i N spełnia warunek D (u n ) jeśli Lemat 2.5 [6] [n/k] lim sup n P (X 1 > u n, X j > u n ), k. n j=2 Niech X 1, X 2,..., X n będzie stacjonarnym ciągiem zmiennych losowych o wspólnej dystrybuancie F i (u n ) n N takim ciągiem liczb, że warunki D(u n ) i D (u n ) zachodzą. Niech τ <. Wtedy równoważne są warunki nf (u n ) n τ (2.3) P (M n u n ) n e τ. (2.4) W lemacie 2.5 otrzymaliśmy ten sam wynik dla stacjonarnych zmiennych losowych jak dla niezależnych. Należy jedynie wzmocnić założenia o D(u n ) i D (u n ). Okazuje się, że jeśli opuścimy warunek D (u n ), to P (M n u n ) będzie w dalszym ciągu zbieżny. Pokazuje to następujący lemat, który jednocześnie wprowadza definicję indeksu ekstremalnego. Lemat 2.6 [6] Jeśli dla każdego τ > istnieje ciąg u n D(u n (τ)) zachodzi dla pewnego θ 1. = u n (τ) spełniający (2.3), to przy założeniu lim P (M n u n (τ)) = e θτ, n 34

Definicja 2.7 Indeks ekstremalny, [6] Niech (X n ) n N będzie ściśle stacjonarnym ciągiem. Jeśli lim P (M n u n (τ)) = e θτ dla n każdego τ >, gdzie u n (τ) jest ciągiem spełniającym lim nf (u n(τ)) = τ, to θ nazywamy n indeksem ekstremalnym (ang. extremal index) ciągu (X n ) n N. Uwaga 2.8 (1) Jak wynika z lematu 2.6, indeks ekstremalny może przyjmować tylko wartości z przedziału [, 1]. θ < implikuje, że P (M n u n ) zbiega do granicy e θτ > 1, co jest sprzeczne z definicją prawdopodobieństwa. Zatem θ. Aby pokazać, że θ 1 obliczmy ( n ) P (M n u n ) = 1 P {X i > u n } 1 nf (u n ). i=1 Lewa strona jest zbieżna do e θτ, a prawa do 1 τ przy n. Zatem dla każdego τ > mamy e θτ 1 τ, co jest możliwe wtedy i tylko wtedy, gdy θ 1. (2) Jeśli θ = 1, to dla stacjonarnych zmiennych X 1, X 2,..., X n asymptotyczny rozkład ich maksimum jest taki jak dla zmiennych niezależnych. Jeśli zaś θ 1, to im bardziej θ oddala się od 1, tym bardziej stacjonarny ciąg odbiega od niezależnych zmiennych losowych. W tym sensie indeks ekstremalny jest miarą zależności zmiennych. (3) Podkreślmy, że ciąg (u n ) n N wyznaczony jest przez ustalone τ tak, by spełniony był warunek (2.3). Zauważmy, że jeśli dla pewnego τ istnieje taki ciąg, to istnieje on również dla dowolnego τ. Przykładowo jeśli u n (1) spełnia nf (u n (1)) n 1, to dowolnemu τ odpowiada ciąg u n (τ) = u [n/τ] (1): [ n τ ] [ ] n F (u [n/τ] (1)) = F (u n (τ)) n 1 τ nf (u [n/τ] (1)) = nf (u n (τ)) n τ. Dlatego definicja 2.7 jest niezależna od wyboru ciągu (u n ). Przykład 2.9 [2] Niech (Y n ) n N będzie ciągiem niezależnych zmiennych losowych o dystrybuancie F oraz X n = max (Y n, Y n+1 ), n 1. Wówczas (X n ) n N jest ściśle stacjonarnym ciągiem zmiennych losowych o dystrybuancie F. Załóżmy, że dla pewnego τ (, ) ciąg u n spełnia u n x F przy n (gdzie x F = sup {x R : F (x) < 1} jest prawym punktem końcowym) oraz nf (u n ) τ przy n. Wtedy F (u n ) 1 oraz np (Y 1 > u n ) = n ( 1 ) F (u n ) = nf (u n) 1 + F (u n ) τ 2, n. 35

Korzystając z lematu 2.2 P (M n u n ) = P (max (Y 1, Y 2,..., Y n, Y n+1 ) u n ) = P (max (Y 1, Y 2,..., Y n ) u n ) F (u n ) e τ/2, n. Oznacza to, że dla ciągu (X n ) n N θ = 1 2. Kolejne twierdzenie związane z indeksem ekstremalnym jest uogólnieniem lematu 2.6. Wystarczy by spełnione były założenia (2.3) oraz D(u n (τ )) dla pewnego τ, aby zagwarantować istnienie granicy górnej i dolnej ciągu P (M n u n (τ)) dla dowolnego < τ τ. Twierdzenie 2.1 [6] Niech (X n ) n N będzie stacjonarnym ciągiem zmiennych losowych i (u n (τ)) n N ciągiem spełniającym (2.3) i takim, że warunek D(u n (τ )) zachodzi dla pewnego τ >. Wówczas istnieją stałe θ, θ, θ θ 1 spełniające lim sup P (M n u n (τ)) = e θτ n lim inf n P (M n u n (τ)) = e θ τ dla < τ τ. Ponadto, jeśli P (M n u n (τ)) jest zbieżne dla pewnego < τ τ, to θ = θ = θ i P (M n u n (τ)) e θ τ dla < τ τ. Natychmiastową konsekwencją powyższego twierdzenia jest wniosek, który podaje konkretny wzór na θ. Wniosek 2.11 [6] Niech (X n ) n N będzie stacjonarnym ciągiem zmiennych losowych spełniającym warunek D(u n (τ)) dla każdego τ >, gdzie (u n (τ)) n N spełnia (2.3). Jeśli dla pewnego τ > P (M n u n (τ )) jest zbieżne do granicy α, to ciąg (X n ) n N ma indeks ekstremalny θ = τ 1 ln α i wówczas P (M n u n (τ)) e θτ dla każdego τ >. Dowód Jeśli D(u n (τ)) dla każdego τ >, gdzie (u n (τ)) n N spełnia (2.3), to z twierdzenia 2.6 mamy lim P (M n u n (τ)) = e θτ n dla pewnego θ 1. Teraz z twierdzenia 2.1 wiemy, że jeśli P (M n u n (τ )) jest zbieżne, to P (M n u n (τ )) e θ τ, zatem α = e θ τ, a stąd już łatwo otrzymać θ = τ 1 ln α. 36

2.1.2 Estymacja Przejdziemy teraz do omówienia trzech sposobów interpretacji indeksu ekstremalnego, z którymi wiążą się także trzy metody estymacji tego parametru. Na koniec porównamy estymatory. 2.1.2.1 Metoda blokowa (ang. block method) Ustalmy τ oraz odpowiadający mu ciąg (u n (τ)) n N spełniający (2.3). Na mocy lematów 2.2 oraz 2.6 (przy założeniu D(u n )) mamy P (M n u n ) e θτ, n, P ( M n u n ) e τ, n, P (M n u n ) P θ ( M n u n ), n. Stąd ln P (M n u n ) lim = θ. (2.5) n n ln F (u n ) Na tej podstawie możemy skonstruować estymator θ, korzystając z estymatorów funkcji F (u n ) oraz P (M n u n ). Na mocy twierdzenia Glivienki-Cantelliego F (u n ) = 1 n n 1 {Xi >u n} i=1 ozn. = N n F (u n ) = 1 F (u n ) = 1 N n. Nieco trudniej będzie znaleźć estymator drugiej funkcji. Skorzystamy z lematu 2.12. Lemat 2.12 [6] Niech (X n ) n N będzie ściśle stacjonarnym ciągiem, (u n ) n N ciągiem liczb rzeczywistych, takim, że zachodzi warunek D(u n ). Niech (k n ) n N będzie ciągiem takim, że k n = o(n) oraz k n l n = o(n), k n α n,ln przy n (gdzie l n i α n,ln takie jak w definicji D(u n )). Wówczas P (M n u n ) P kn (M [n/kn] u n ), n, (2.6) gdzie r n = [n/k n ]. Szkic dowodu Załóżmy dla uproszczenia, że nf (u n ) jest ograniczone i niech (l n ) będzie takie jak w definicji warunku D(u n ). Oznaczmy przez M(I) = max X i, I N. Podzielimy liczby 1, 2,..., n na zbiory I 1, I 1, I 2, I 2,..., I k n, I k n, gdzie i I 37

I 1 = {1, 2,..., r n l n } I1 = {r n l n + 1,..., r n } I 2 = {r n + 1,..., 2r n l n } I2 = {2r n l n + 1,..., 2r n }.. I kn = {(k n 1)r n + 1,..., k n r n l n } Ik n = {k n r n l n + 1,..., n} #(I j ) = r n l n, 1 j k n #(Ij ) = l n, 1 j k n 1 #(Ik n ) = n k n r n + l n k n + l n. Mamy k n P {M(I j ) u n } P (M n u n ) j=1 (k n 1)P (M(I1) > u n ) + P ( M(Ik ) n ) > u n [(k n 1)l n + (k n + l n )] P (X 1 > u n ) K k n(l n + 1) n, n, (2.7) gdzie K np (X 1 > u n ) jest pewną stałą (z założenia, że nf (u n ) jest ograniczone). Z warunku D(u n ) (poprzez indukcję) wynika k n P {M(I j ) u n } P kn (M(I 1 ) u n ) k nα n,ln, n. (2.8) j=1 Ponadto P kn (M(I 1 ) u n ) P kn (M rn u n ) k n [P (M(I 1 ) u n ) P (M rn u n )] = k n P (M(I 1 ) < u n M(I 1)) k n l n P (X 1 > u n ) K k nl n n, n. (2.9) Teraz łącząc (2.9), (2.7) i (2.8) otrzymujemy tezę P (M n u n ) P kn (M rn u n ) P (M k n n u n ) P {M(I j ) u n } j=1 k n aa + P {M(I j ) u n } P kn (M(I 1 ) u n ) j=1 aa + P kn (M(I 1 ) u n ) P kn (M rn u n ) aa, n. 38