PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Podobne dokumenty
Kolokwium ze statystyki matematycznej

Wykład 10 Testy jednorodności rozkładów

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka w przykładach

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Wykład 9 Testy rangowe w problemie dwóch prób

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Spis treści 3 SPIS TREŚCI

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Własności statystyczne regresji liniowej. Wykład 4

Monte Carlo, bootstrap, jacknife

O ŚREDNIEJ STATYSTYCZNEJ

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych.

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Estymacja parametrów w modelu normalnym

ROZKŁADY WYBRANYCH BOOTSTRAPOWYCH ESTYMATORÓW MEDIANY ORAZ ZASTOSOWANIE DOKŁADNEJ METODY PERCENTYLI DO JEJ PRZEDZIAŁOWEGO SZACOWANIA

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Test t-studenta dla jednej średniej

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wykład 7 Testowanie zgodności z rozkładem normalnym

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

O ŚREDNIEJ STATYSTYCZNEJ

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

STATYSTYKA

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Prawa wielkich liczb, centralne twierdzenia graniczne

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

UOGÓLNIONA MIARA DOPASOWANIA W MODELU LINIOWYM

Wykład 8 Dane kategoryczne

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

STOCHASTYCZNY MODEL BEZPIECZEŃSTWA OBIEKTU W PROCESIE EKSPLOATACJI

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna i ekonometria

STATYSTYKA MATEMATYCZNA

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu

PRZEDZIAŁ UFNOŚCI DLA FRAKCJI. Ryszard Zieliński. XXXVIII Konferencja Zastosowań Matematyki Zakopane Kościelisko 8-15 września 2009

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Metoda najmniejszych kwadratów

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

PROBLEMY ROLNICTWA ŚWIATOWEGO

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

STATYSTYKA MATEMATYCZNA

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Rozdział 8. Regresja. Definiowanie modelu

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Zadanie 1. Analiza Analiza rozkładu

Wykład 12 Testowanie hipotez dla współczynnika korelacji

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Matematyka ubezpieczeń majątkowych r.

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Statystyka matematyczna dla leśników

Wykład 3 Momenty zmiennych losowych.

STATYSTYKA MATEMATYCZNA

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Wykład 3 Momenty zmiennych losowych.

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka

166 Wstęp do statystyki matematycznej

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Prawdopodobieństwo i statystyka r.

O średniej arytmetycznej i medianie

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Na podstawie dokonanych obserwacji:

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Transkrypt:

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info STRESZCZENIE Value at Risk (VaR) jest miarą ryzyka rekomendowaną przez Bank of International Settlement. VaR określa największą możliwą stratę w określonym przedziale czasowym osiąganą ze z góry określonym prawdopodobieństwem. Z matematycznego punktu widzenia, VaR jest kwantylem odpowiedniego rzędu rozkładu prawdopodobieństwa pewnej zmiennej losowej. Główny problem w estymacji VaR kryje się w rozkładzie prawdopodobieństwa analizowanego zjawiska. Jeżeli rozkład ten jest znany (np. normalny, gamma, beta itp.), to można zastosować standardowe techniki estymacji takiego kwantyla. W przypadku nieznanego rozkładu prawdopodobieństwa stosowane są metody nieparametryczne. Kilka takich metod opisanych jest w pracy Chang i in. (2003). W niniejszej pracy przedstawione będzie zastosowanie nieparametrycznego przedziału ufności skonstruowanego w Zieliński i Zieliński (2005). Słowa kluczowe: VaR, estymacja nieparametryczna, przedziały ufności 1

Nieparametryczny przedział ufności Niech X 1:n, X 2:n,..., X n:n będą statystykami pozycyjnymi z pewnego ciągłego rozkładu prawdopodobieństwa o dystrybuancie F. Niech q (0, 1) będzie daną liczbą. Interesuje nas konstrukcja nieparametrycznego przedziału ufności dla kwantyla F 1 (q) (zakładamy, że kwantyl ten jest określony jednoznacznie). Wiadomo, że prawdopodobieństwo P F {X i:n F 1 (q) X j:n } = p(i, j; n, q), 1 i < j n, gdzie j 1 ( ) n p(i, j; n, q) = q s (1 q) n s s s=i nie jest zależne od dystrybuanty F. Zatem przedział (X i:n, X j:n ) dla i oraz j takich, że p(i, j; n, q) = γ jest nieparametrycznym przedziałem ufności dla kwantyla F 1 (q) na poziomie ufności co najmniej γ (por. np. David (1981)). Jeżeli F jest rozkładem jednostajnym U(0, 1) to zamiast P F będziemy pisać P. Ponieważ P F {X i:n F 1 (q) X j:n } = P {U i:n q U j:n } więc nasze rozważania możemy ograniczyć do konstrukcji przedziałów ufności (U i:n, U j:n ), gdzie U i:n, U j:n są statystykami pozycyjnymi z rozkładu U(0, 1). Przede wszystkim zauważmy, że dla danego poziomu ufności γ dwustronny przedział ufności dla kwantyla rzędu q istnieje tylko wtedy, gdy P {U 1:n q U n:n } γ, to znaczy, gdy (C) q n + (1 q) n 1 γ. 2

W tabeli 1 podane są minimalne liczności próby dla przykłądowych wartości γ oraz q. Tabela 1. Minimalne liczności próby q γ 0.900 0.925 0.950 0.975 0.990 0.900 22 30 45 91 230 0.925 25 34 51 103 258 0.950 29 39 59 119 299 0.975 36 48 72 146 368 0.990 44 60 90 182 459 Poziom ufności tak skonstruowanego przedziału ufności wynosi co najmniej γ. Jeżeli chcemy skonstruować przedział ufności dokładnie na poziomie ufności γ, to możemy posłużyć się randomizacją. To znaczy, konstruujemy dwie całkowitoliczbowe zmienne losowe I oraz J, niezależne od zmiennej losowej X, i jako poszukiwany przedział ufności przyjmujemy (X I:n, X J:n ). Niech P {I = i, J = j} = λ ij. Przy tym oznaczeniu P F {X I:n F 1 (q) X J:n } = P {U I:n q U J:n } = n 1 λ ij p(i, j; n, q). Rozkład prawdopodobieństwa wektora losowego (I, J) może być dobrany tak, by prawdopodobieństwo pokrycia wynosiło dokładnie γ. Oczywiście istnieje nieskończenie wiele takich rozkładów, co daje nieskończenie wiele nieparametrycznych przedziałów ufności. Spośród nich wybierzemy najkrótszy w sensie następującego kryterium E(J I) = n 1 (j i)λ ij. Najlepszy rozkład λ ij otrzymuje się jako rozwiązanie następującego zagadnienia programowania liniowego n 1 n 1 (j i)λ ij = minimum, λ ij p(i, j; n, q) = γ, n 1 λ ij = 1, λ ij 0, 1 i < j n. 3

Rozwiązaniem jest wierzchołek odpowiedniego sympleksu, tzn. punkt taki, że wszystkie lambdy z wyjątkiem dwóch są zerowe. Tak więc poszukiwany przedział ufności ma postać { (Ui:n, U j:n ), z prawdopodobieństwem λ, (U i :n, U j :n), z prawdopodobieństwem 1 λ, Matematyczne szczegóły konstrukcji można znaleźć w Zieliński i Zieliński (2005). W tabeli 2 podane są wartości i, j oraz prawdopodobieństwa λ dające dokładny przedział ufności ( oznacza, że żądany przedział nie istnieje). Tabela 2. Końce przedziału ufności (γ = 0.95) n q i j λ n q i j λ 250 0.90 216 234 0.56690 750 0.90 659 691 0.19375 216 235 0.43310 659 692 0.80625 0.95 231 244 0.46615 0.95 701 724 0.37103 231 245 0.53385 701 725 0.62897 0.99 0.99 738 748 0.55963 737 748 0.44037 500 0.90 437 463 0.28223 1000 0.90 882 919 0.15529 437 464 0.71777 881 919 0.84471 0.95 466 485 0.01118 0.95 937 963 0.95617 465 485 0.98882 937 964 0.04383 0.99 491 499 0.62852 0.99 984 996 0.27278 491 500 0.37148 984 997 0.72722 Zastosowanie W bieżącym rozdziale pokażemy zastosowanie opisanej wcześniej konstrukcji do estymacji VaR dla akcji BRE banku. Analizujemy notowania Y t akcji BRE banku o okresie od 29 grudnia 1999 do 3 grudnia (1049 danych). Dane te można traktować jako realizację pewnego procesu stochastycznego. Przebieg tej realizacji pokazany jest na rysunku 1. Oczywiście dane te nie są stochastycznie niezależne. W celu uzyskania próby niezależnych zmiennych losowych przekształcamy obserwacje: ( ) Yt X t = ln, t = 1, 2, 3,..., 1048, Y t 1 http://www.money.pl/gielda/archiwum/spolki/ 4

Przebieg procesu X t pokazany jest na rysunku 2. W celu sprawdzenia stochastycznej niezależności zmiennych losowych X 1, X 2,..., X 1048 zastosowano test serii. Z ciągu obserwacji X 1, X 2,..., X 1048 wyznaczono medianę (Me) i przekształcono zmienne X i w taki sposób, że jeżeli X i > Me to pisano A, jeżeli zaś X i < Me to pisano B. Otrzymano w ten sposób ciąg liter A oraz B i zliczono ilość serii, czyli ilość jednoliterowych podciągów. Otrzymano w tym ciągu 505 serii. Ponieważ otrzymanie litery A jest tak samo prawdopodobne jak litery B, więc zmienna losowa opisująca liczbę serii w ciągu n obserwacji (zakładając, że każdy ciąg znaków jest jednakowo prawdopodobny) ma asymptotycznie rozkład normalny o wartości oczekiwanej 2n An B n + 1 i wariancji 2n An B (2n A n B n) (n 1)n. Tutaj n 2 A oznacza liczbę liter A, natomiast n B liczbę liter B. W analizowanym problemie n = 1048, n A = 473 oraz n B = 575. Wyznaczony w znany sposób poziom krytyczny testu serii wynosi 0.348, co sugeruje, że ciąg obserwacji X 1, X 2,..., X 1048 może być uznany za realizację ciągu niezależnych zmiennych losowych. Niech q = 0.99 oraz γ = 0.95. To znaczy, szacujemy wartość VaR przekraczaną z prawdopodobieństwem 0.01. Rozważmy rozkład dwumianowy B(1048, 0.99). W tabeli 3 podany jest fragment tego rozkładu uporządkowany malejąco według prawdopodobieństw. Tabela 3. Rozkład B(1048, 0.99) k p k suma p k 1038 0.12430 0.12430 1037 0.11848 0.24278 1039 0.11843 0.36122 1036 0.10342 0.46464 1040 0.10147 0.56611 1035 0.08325 0.64936 1041 0.07719 0.72656 1034 0.06216 0.78873 1042 0.05134 0.84007 1033 0.04328 0.88336 1043 0.02924 0.91260 1032 0.02822 0.94083 1031 0.01731 0.95814 Analizując tabelę 3 otrzymujemy następujące przedziały ufności dla VaR { (X1032:1048, X 1043:1048 ), na poziomie ufności 0.94083 (X 1031:1048, X 1043:1048 ), na poziomie ufności 0.95814 5

By uzyskać przedział ufności dokładnie na poziomie 0.95 zastosujemy randomizację. Prawdopodobieństwo λ jest rozwiązaniem równania λ0.94083 + (1 λ)0.95814 = 0.95. Otrzymujemy λ = 0.47041. Teraz generujemy generujemy liczbę losową λ 0 z rozkładu jednostajnego U(0, 1). Otrzymaliśmy λ 0 = 0.45159. Ponieważ λ 0 < λ więc jako przedział ufności wybieramy (X 1032:1048, X 1043:1048 ). Dla notowań BRE banku przedział ten przyjmuje postać (5.5021, 7.0618). W celu powtarzalności analiz statystycznych na tych danych wygenerowaną liczbę λ 0 do naszych danych. Literatura (1) Chang Yi Ping, Hung Ming Chin, Wu Yi Fang, Nonparametric Estimation for Risk in Value at Risk Estimator. Communications in Statistics, Simulation and Computation, 2003, 32, 1041 1064. (2) David H. A. Order Statistics. 1981, New York, Wiley. (3) Zieliński R., Zieliński W. Best exact nonparametric confidence intervals for quantiles. Statistics, 2005, 39, 67-71. Summary Value at Risk (VaR) is a measure of market risk recommended by Bank of International Settlement. Var summarizes the worst loss over a holding period with a certain level of confidence. From the statistical point o view, the problem of estimating VaR is equivalent to the problem of estimation of a quantile of a random variable. The main problem in applications is that the distribution of observed random variable remains unknown. If this distribution is known, then standard statistical techniques of point estimation or constructing confidence intervals may be applied. In case of unknown distribution some propositions of nonparametric estimation of q th quantile may be found in literature. Many of them may be found in Chang et. al (2003). In the paper there is shown an application of the exact nonparametric confidence interval for VaR described in Zieliński and Zieliński (2005). Key Words: VaR, nonparametric estimation, confidence intervals. 6