Detekcja rozkładów o ciężkich ogonach

Podobne dokumenty
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Prawdopodobieństwo i statystyka

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Rachunek prawdopodobieństwa i statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych.

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Zmienne losowe. dr Mariusz Grzadziel. rok akademicki 2016/2017 semestr letni. Katedra Matematyki, Uniwersytet Przyrodniczy we Wrocławiu

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu.

Estymacja parametrów w modelu normalnym

W4 Eksperyment niezawodnościowy

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

Prawa wielkich liczb, centralne twierdzenia graniczne

Centralne twierdzenie graniczne

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 3 Jednowymiarowe zmienne losowe

Komputerowa Analiza Danych Doświadczalnych

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wykład 2 Zmienne losowe i ich rozkłady

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

Statystyka i eksploracja danych

Weryfikacja hipotez statystycznych

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka w przykładach

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

6.4 Podstawowe metody statystyczne

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Pochodna funkcji a styczna do wykresu funkcji. Autorzy: Tomasz Zabawa

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Pochodna funkcji: zastosowania przyrodnicze wykłady 7 i 8

Zmienne losowe ciągłe i ich rozkłady

Ośrodkowość procesów, proces Wienera. Ośrodkowość procesów, proces Wienera Procesy Stochastyczne, wykład, T. Byczkowski,

4. ZNACZENIE ROZKŁADU WYKŁADNICZEGO

Zmienne losowe ciągłe i ich rozkłady

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Spis treści 3 SPIS TREŚCI

Dyskretne zmienne losowe

Prawdopodobieństwo i statystyka

Testowanie hipotez statystycznych.

Matematyka ubezpieczeń majątkowych r.

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Prawdopodobieństwo i statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

Granica funkcji wykład 4

1 Gaussowskie zmienne losowe

Zadania z Rachunku Prawdopodobieństwa III - 1

Tablice trwania życia

Wykład 3. Rozkład normalny

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Statystyka, Ekonometria

Matematyka ubezpieczeń majątkowych r.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Biostatystyka, # 3 /Weterynaria I/

Testowanie hipotez statystycznych.

Zawansowane modele wyborów dyskretnych

Statystyka Matematyczna Anna Janicka

Prawdopodobieństwo i statystyka r.

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

MODELE MATEMATYCZNE W UBEZPIECZENIACH

Metody probabilistyczne

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

O ŚREDNIEJ STATYSTYCZNEJ

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

Estymacja gęstości prawdopodobieństwa metodą selekcji modelu

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Metody probabilistyczne

Wykład 11: Martyngały: Twierdzenie o zbieżności i Hoeffdinga

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Ciągłość funkcji f : R R

1 Wykład 3 Generatory liczb losowych o dowolnych rozkładach.

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Pochodna funkcji c.d.-wykład 5 ( ) Funkcja logistyczna

Prawdopodobieństwo i statystyka r.

Proces rezerwy w czasie dyskretnym z losową stopą procentową i losową składką

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Estymatory kwantylowe i estymacja kwantyli

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Transkrypt:

Detekcja rozkładów o ciężkich ogonach J. Śmiarowska, P. Jamer Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska 24 kwietnia 2012 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 1 / 40

Spis treści 1 Rozkłady o ciężkich ogonach Informacje wstępne Rodzina podwykładnicza Rozkłady typu Pareto 2 Detekcja rozkładów o grubych ogonach Analiza problemu Wykresy kwantylowe Empiryczna średnia nadwyżka J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 2 / 40

Spis treści 1 Rozkłady o ciężkich ogonach Informacje wstępne Rodzina podwykładnicza Rozkłady typu Pareto 2 Detekcja rozkładów o grubych ogonach Analiza problemu Wykresy kwantylowe Empiryczna średnia nadwyżka J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 3 / 40

Definicja Rozkład o lekkim ogonie Niech X będzie nieujemna zmienna losowa o dystrybuancie F. Zmienna losowa X ma rozkład o lekkim ogonie przy x, jeśli ( A, b > 0) ( x 0 > 0) ( x x 0 ) F (x) Ae bx. Rozkład o ciężkim ogonie Nieujemna zmienna losowa X ma rozkład o ciężkim ogonie przy x, jeśli nie ma rozkładu o lekkim ogonie. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 3 / 40

Warunek równoważny Twierdzenie Zmienna losowa nieujemna X ma ciężki ogon wtedy i tylko wtedy, gdy ( t > 0) M X (t) =. Dowód: Pokażemy, że zmienna losowa ma lekki ogon wtedy i tylko wtedy, gdy ( t < t 0 ) M X (t) <. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 4 / 40

Warunek równoważny ( ) Z założenia mamy, że istnieja A, b, x 0 > 0 takie, że Zatem mamy ( ) M X (t) = E e tx = ( x x 0 ) F (x) Ae bx. 0 e tx df (x) = = [ e tx F (x) ] 0 + t F (x) e tx dx <, bo dla odpowiednio małych t : 0 0 e tx df (x) = [ lim x e tx F (x) ] [ lim x e tx Ae bx] [ = lim x Ae (t b)x ] = 0, 0 F (x) etx dx 0 Ae bx e tx dx = 0 Ae(t b)x dx <. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 5 / 40

Warunek równoważny ( ) Załóżmy nie wprost, że zachodzi ( t t 0 ) M X (t) <, ale zmienna losowa nie ma lekkiego ogona. Zatem ( A, b > 0) ( x 0 > 0) ( x x 0 ) F (x) > Ae bx. Wówczas M X (t) = [ e tx F (x) ] 0 + t F (x) e tx dx <, 0 ale dla t > b [ lim e tx F (x) ] [ lim e tx Ae bx] [ = lim Ae (t b)x] =. x x x Zatem M X (t) =, co prowadzi do sprzeczności. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 6 / 40

Twierdzenie Definicja Niech α F := lim sup x gdzie F (0 ) = 0, F - dystrybuanta. Twierdzenie ln F (x), x Załóżmy, że α F = 0, wówczas F ma ciężki ogon. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 7 / 40

Twierdzenie Dowód: Niech α F = 0. Wówczas Zatem po przeskalowaniu a stad ( ε > 0) ( x > 0 ) ( x x ) ln F (x) εx. ( x 0) F (x) ce εx, ( s ε) 0 e sx F (x) dx =. Z dowolności ε dostajemy, że F ma ciężki ogon. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 8 / 40

Przykłady Rozkład Lognormalny Rozkład Lognormalny Y e tx, X N (µ, σ 2) Policzmy k-ty moment Y : ( m k,y = E Y k) ( ) = E e ktx = M X (kt) = e µkt+ 1 2 σ2 k 2 t 2. Zatem k=0 m k,y k! t k =. Co jest równoważne temu, że nie istnieje M Y (t), t > 0. Zastosowanie: ubezpieczenia komunikacyjne. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 9 / 40

Przykłady Rozkład Weibulla Rozkład Weibulla X W (r, c), F (x) = e cx r, x > 0, c > 0. Bezpośrednio z definicji widać, że gdy r 1, to rozkład Weibulla ma lekki ogon, gdy r < 1, to rozkład Weibulla ma ciężki ogon. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 10 / 40

Przykłady Rozkład Pareto Rozkład Pareto X Par (α, c), ( c ) α F (x) =, x > c x Bezpośrednio z definicji widać, że rozkład ma ciężki ogon. Zastosowanie: ubezpieczenia przeciwpożarowe. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 11 / 40

Spis treści 1 Rozkłady o ciężkich ogonach Informacje wstępne Rodzina podwykładnicza Rozkłady typu Pareto 2 Detekcja rozkładów o grubych ogonach Analiza problemu Wykresy kwantylowe Empiryczna średnia nadwyżka J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 12 / 40

Rodzina podwykładnicza Definicja Dystrybuanta F, F (0 ) = 0, jest podwykładnicza, jeśli Oznaczenie: F S. F 2 (x) lim = 2. x F (x) J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 12 / 40

Twierdzenie Twierdzenie Jeśli F S, to F ma ciężki ogon. Lemat Niech F S. Wówczas dla każdego x > 0 : 1 lim x F (x x ) F (x) 2 lim x x 0 = 1, F (x y) df (y) = 1. F (x) J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 13 / 40

Twierdzenie Dowód: Niech F S. Przyjmijmy m (x) := ln F (x). Wówczas z wcześniejszego twierdzenia wynika, iż wystarczy pokazać, że m (x) α F = lim sup = 0. x x Z lematu mamy, że dla każdego x > 0 : F (x x ) lim = 1. x F (x) Co dla każdego x > 0 daje nam ( ( lim ln F x x ) ln F (x) ) ( ( = lim m (x) m x x )) = 0. x x J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 14 / 40

Twierdzenie Zatem Wynika stad, że ( ε > 0) ( x 0 > 0) ( x x 0 ) m (x) m (x 1) < ε. m (x) m (x 1) + ε m (x 2) + 2ε... m (x n) + nε, gdzie x 0 x n < x 0 + 1. Możemy więc ogólniej napisać m (x) Ostatecznie z dowolności ε dostajemy sup m ( x ) + (x x 0 ) ε, x x 0. x 0 x x 0 +1 m (x) lim = 0. x x J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 15 / 40

Spis treści 1 Rozkłady o ciężkich ogonach Informacje wstępne Rodzina podwykładnicza Rozkłady typu Pareto 2 Detekcja rozkładów o grubych ogonach Analiza problemu Wykresy kwantylowe Empiryczna średnia nadwyżka J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 16 / 40

Rozkłady typu Pareto Definicja Powiemy, że funkcja L : [0, ) (0, ) jest wolno zmieniajac a się funkcja przy x wtedy i tylko wtedy, gdy Oznaczenie: L R 0. Definicja ( t > 0) lim x L (tx) L (x) = 1 Dystrybuanta F jest typu Pareto z wykładnikeim α > 0, jeśli F (x) x α L (x) przy x, gdzie L jest funkcja wolno zmieniajac a się. Oznaczenie: F R α F L (x) x α, x, gdzie L R 0. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 16 / 40

Twierdzenie Twierdzenie Jeśli F R α, to F S. Dowód: Niech X, X 1, X 2 iid F R α. Niech x > 0. Wówczas dla dowolnego ε (0, 1) zdarzenie implikuje zdarzenie {X 1 + X 2 > x} {X 1 > (1 ε) x} {X 2 > (1 ε) x} {X 1 > εx X 2 > εx}. Wynika stad, że P (X 1 + X 2 > x) 2P (X > (1 ε) x) + (P (X > εx)) 2 P (X 1 + X 2 > x) 2F ((1 ε) x) + ( F (εx) ) 2 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 17 / 40

Twierdzenie Zatem F 2 (x) P (X 1 + X 2 > x) lim sup = lim sup 2 x F (x) x F (x) Z drugiej strony dla dowolnej dystrybuanty F mamy F 2 (x) F (x) x = 1 + 0 F (x y) df (y) 1 + F (x), F (x) co po przejściu do granicy daje nam F 2 (x) lim inf 2 x F (x) J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 18 / 40

Spis treści 1 Rozkłady o ciężkich ogonach Informacje wstępne Rodzina podwykładnicza Rozkłady typu Pareto 2 Detekcja rozkładów o grubych ogonach Analiza problemu Wykresy kwantylowe Empiryczna średnia nadwyżka J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 19 / 40

Oznaczenia {U i : 1 i n} portfel roszczeń. X n = U 1 + U 2 +... + U n całkowita suma roszczeń. U (1), U (2),..., U (n) roszczenia uporzadkowane tak, że min U i = U (1) U (2)... U (n) = max U i. 1 i n 1 i n J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 19 / 40

Intuicje Wysokie roszczenie Roszczenie będziemy nazywać dużym, gdy łaczna suma roszczeń jest w znacznej mierze przez nie determinowana. Powyższe stwierdzenie znajduje wiele interpretacji. Przykładowo roszczenie możemy nazywać dużym, gdy jego wartość jest nietypowa, pojawia się rzadko. stosunek U (n) do X n jest duży. Czyli powiemy, że U (n) jest duże, gdy d = Z U (n)/x n ma większość masy prawdopodobieństwa w okolicy 1. stanowi ono duża część całkowitej sumy roszczeń X n. Czyli powiemy, że U (m) jest duże, gdy m min { k : U (k) > px n }, gdzie p to odpowiednio duża część całkowitej sumy roszczeń. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 20 / 40

Formalizm Podejście I Podejście I Całkowita suma roszczeń jest duża, ponieważ największe roszczenie jest duże. Czyli matematycznie P (X n > x) P ( U (n) > x ), x. Takie podejście prowadzi w naturalny sposób do podwykładniczej rodziny rozkładów S. Statystyczna weryfikacja hipotezy F = F U S jest jednak daleka od prostoty. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 21 / 40

Formalizm Podejście II Podejście II Opierajac się na jednym z wcześniejszych twierdzeń. Rozkłady o ciężkich ogonach możemy wykrywać w oparciu o warunek log (1 F (x)) α F = lim sup = 0. x x Statystycznie interesowałoby nas analizowanie warunku log (1 F n (U n k )) log n k lim sup = lim sup = 0, x U n k x U n k gdzie k /n 0. Jest on niestety nieweryfikowalny z uwagi na granicę we wzorze. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 22 / 40

Formalizm Podejście III Podejście III Możemy oprzeć nasze wnioskowanie na funkcji µ F (x) = E (U x U > x) = wiedzac, że zachodzi relacja lim µ F (x) = α F = 0. x x 1 F (y) 1 F (x) dy, Na potrzeby obliczeń powyższy wzór przekształcić można do postaci ( ) 1 n ( ) µ n U(n k) = U(j) U k (n k), k/n 0. j=n k+1 Nie jest jednak statystycznie oczywistym jak badać, czy powyższe wyrażenie zbiega do. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 23 / 40

Konkluzje Ściśle formalne, statystyczne postawienie problemu wykrywania rozkładów o ciężkich ogonach okazało się być zadaniem trudnym. Koniecznym jest poświęcenie formalizmu na rzecz prostoty. Skupimy się na porównywaniu ogonów rozkładów empirycznych z ogonami rozkładów wzorcowych. Dobrym rozkładem wzorcowym jest tutaj rozkład wykładniczy f (x) = λe λx I (0, ) (x), λ > 0. Powiemy, że rozkład F ma cięższy ogon niż rozkład wykładniczy, jeżeli 1 F (x) > ce ax, x 0, a, c > 0. Zachodzenie powyższej nierówności dla wszystkich a > 0 gwarantuje nam, że α F = 0. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 24 / 40

Spis treści 1 Rozkłady o ciężkich ogonach Informacje wstępne Rodzina podwykładnicza Rozkłady typu Pareto 2 Detekcja rozkładów o grubych ogonach Analiza problemu Wykresy kwantylowe Empiryczna średnia nadwyżka J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 25 / 40

Idea Rozkład wykładniczy Rozważamy jako rozkład wzorcowy standardowy rozkład wykładniczy o dystrybuancie G Exp (1). Jesteśmy zainteresowani sprawdzeniem, czy dystrybuanta empiryczna wielkości roszczenia F ma ten sam rozkład co G z dokładnościa do parametru λ : F Exp (λ). Sprawdzenia powyższego dokonamy tworzac wykres kwantylowy funkcji kwantylwej Q G G oraz Q n F. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 25 / 40

Funkcja kwantylowa Definicja Niech F będzie dystrybuanta pewnego rozkładu prawdopodobieństwa. Wówczas mianem funkcji kwantylowej tego rozkładu określimy funkcję zdefiniowana następujaco Definicja Q F (y) = F 1 (y) = inf {x : F (x) y}. Niech F n będzie dystrybuanta empiryczna zbudowana na bazie próbki n elementowej. Niech U (1) U (2)... U (n) będzie wspomniana próbka po uporzadkowaniu. Empiryczna funkcja kwantylowa zbudowana na bazie powyższej próbki nazwiemy funkcję spełniajac a poniższy warunek Q n (y) = U (k) k 1 n < y k n. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 26 / 40

Wykres kwantylowy Rozkład wykładniczy Nanosimy na układ współrzędnych punkty ( ( ) ( )) k k Q G, Q n = n n ( 1λ log ( 1 k n ), U (k) ). Jeżeli nasze dane pochodza z rozkładu o ogonie zbliżonym do tego, jaki posiada rozkład wykładniczy, to na wykresie uzyskamy w przybliżeniu linię prosta. Parametr λ 1 wyraża nachylenie tej prostej. Jeżeli nasze dane pochodza z rozkładu o ogonie cięższym do tego, jaki posiada rozkład wykładniczy, wówczas funkcja rośnie szybciej niż linia prosta. Jeżeli nasze dane pochodza z rozkładu o ogonie lżejszym do tego, jaki posiada rozkład wykładniczy, wówczas funkcja rośnie wolniej niż linia prosta. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 27 / 40

Wykres kwantylowy Poprawka na ciagłość Zauważmy, że dla k = n zachodzi ( ) k Q G =. n Z tego względu, rysujac wykres kwantylowy, często zamiast punktów { } k n : 1 k n, nanosi się na niego punkty { } k n + 1 : 1 k n. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 28 / 40

Estymacja parametru rozkładu Jeżeli F ma w przybliżeniu rozkład wykładniczy o parametrze λ. Wówczas parametr ten możemy wyestymować z pomoca MNK: ( ) n ˆλ 1 k=1 U k (k)q G n+1 = ( )) 2. n k=1 (Q k G n+1 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 29 / 40

Siła zależności liniowej Możemy zbadać siłę zależności liniowej między Q G oraz Q n wykorzystujac empiryczny współczynnik korelacji: n ( k=1 u(k) u ) ( ( ) ) Q k G n+1 Q G r (u 1, u 2,..., u n ) = n ( ( ) ) 2 k=1 Q k G n+1 Q n ( G k=1 u(k) u ), 2 gdzie: u = 1 n n k=1 u k = 1 n n k=1 u (k), Q G = 1 ( ) n n k=1 Q k G n+1 = 1 n ) n k=1 (1 log k n+1. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 30 / 40

Dane ucięte Niech U Exp (λ). Wówczas ogonem dystrybuanty uciętego rozkładu wykładniczego nazwiemy funkcję F [0,a] (x) = P (U > x U > a) = Odpowiadajaca jej funkcja kwantylowa, to P (U > x) P (U > a) = e λ(x a), x > a. Q [0,a] (y) = a 1 log (1 y), 0 < y < 1. λ Estymatorem parametru a tak zdefiniowanego rozkładu jest punkt przecięcia wykresu kwantylowego z prosta y = 0. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 31 / 40

Inne rozkłady Przy tworzeniu wykresu kwantylowego, jako rozkład wzorcowy można rozważać oczywiście nie tylko rozkład wykładniczy. Rozkład normalny N ( µ, σ 2) ( ( ) ) : Φ 1 k n+1, U (k). Wyraz wolny prostej estymuje parametr µ. Współczynnik kierunkowy prostej estymuje parametr σ. ( ( ) ) Rozkład lognormalny: Φ 1 k n+1, log U (k). ( ( ) ) Rozkład Pareto Par (α, c) : log 1 k n+1, log U (k). Wyraz wolny prostej estymuje parametr log c. Współczynnik kierunkowy prostej estymuje parametr α 1. ( ( ( )) ) Rozkład Weibulla W (r, c) : log log 1 k n+1, log U (k). Wyraz wolny prostej estymuje parametr r 1 log c. Współczynnik kierunkowy prostej estymuje parametr r 1. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 32 / 40

Przykład 1 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 33 / 40

Przykład 2 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 34 / 40

Przykład 3 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 35 / 40

Spis treści 1 Rozkłady o ciężkich ogonach Informacje wstępne Rodzina podwykładnicza Rozkłady typu Pareto 2 Detekcja rozkładów o grubych ogonach Analiza problemu Wykresy kwantylowe Empiryczna średnia nadwyżka J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 36 / 40

Wzór empiryczny Rozważać będziemy funkcję średniej nadwyżki µ F (x) = x 1 F (y) 1 F (x) dy. Wyprowadzimy dla niej wzór empiryczny przy k takim, że k /n 0. = n k n 1 i=n k = 1 k µ n ( U(n k) ) = U(i+1) U (i) n j=n k+1 U (n k) (1 F n (y)) = 1 k 1 F n (y) 1 F n ( U(n k) )dy = n 1 i=n k U (j) ku (n k) = 1 k (n i) ( U (i+1) U (i) ) = n j=n k+1 ( U(j) U (n k) ). J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 36 / 40

Idea Zauważmy, że dla rozkładu wykładniczego z parametrem λ µ F (x) = λ 1 = const. Podobnie, jeśli µ F (x) = const, to F jest dystrybuanta rozkładu wykładniczego. ( ) Możemy więc stosujac empiryczna funkcję µ n U(n k) porównywać rozkłady wartości roszczeń z rozkładem wykładniczym. J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 37 / 40

Interpretacja Jeśli dystrybuanta F ma cięższy ogon niż dystrybuanta rozkładu wykładniczego. Wówczas jej empiryczna średnia nadwyżka { µn ( U(n k) ) : 1 < k n } będzie znajdowała się powyżej analogicznej funkcji dla rozkładu wykładniczego (będzie rosła). Jeśli dystrybuanta F ma lżejszy ogon niż dystrybuanta rozkładu wykładniczego. Wówczas jej empiryczna średnia nadwyżka { µn ( U(n k) ) : 1 < k n } będzie znajdowała się poniżej analogicznej funkcji dla rozkładu wykładniczego (będzie malała). J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 38 / 40

Wykresy J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 39 / 40

Dziękujemy za uwagę! J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja rozkładów o ciężkich ogonach 24 kwietnia 2012 40 / 40