PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info STRESZCZENIE Value at Risk (VaR) jest miarą ryzyka rekomendowaną przez Bank of International Settlement. VaR określa największą możliwą stratę w określonym przedziale czasowym osiąganą ze z góry określonym prawdopodobieństwem. Z matematycznego punktu widzenia, VaR jest kwantylem odpowiedniego rzędu rozkładu prawdopodobieństwa pewnej zmiennej losowej. Główny problem w estymacji VaR kryje się w rozkładzie prawdopodobieństwa analizowanego zjawiska. Jeżeli rozkład ten jest znany (np. normalny, gamma, beta itp.), to można zastosować standardowe techniki estymacji takiego kwantyla. W przypadku nieznanego rozkładu prawdopodobieństwa stosowane są metody nieparametryczne. Kilka takich metod opisanych jest w pracy Chang i in. (2003). W niniejszej pracy przedstawione będzie zastosowanie nieparametrycznego przedziału ufności skonstruowanego w Zieliński i Zieliński (2005). Słowa kluczowe: VaR, estymacja nieparametryczna, przedziały ufności 1
Nieparametryczny przedział ufności Niech X 1:n, X 2:n,..., X n:n będą statystykami pozycyjnymi z pewnego ciągłego rozkładu prawdopodobieństwa o dystrybuancie F. Niech q (0, 1) będzie daną liczbą. Interesuje nas konstrukcja nieparametrycznego przedziału ufności dla kwantyla F 1 (q) (zakładamy, że kwantyl ten jest określony jednoznacznie). Wiadomo, że prawdopodobieństwo P F {X i:n F 1 (q) X j:n } = p(i, j; n, q), 1 i < j n, gdzie j 1 ( ) n p(i, j; n, q) = q s (1 q) n s s s=i nie jest zależne od dystrybuanty F. Zatem przedział (X i:n, X j:n ) dla i oraz j takich, że p(i, j; n, q) = γ jest nieparametrycznym przedziałem ufności dla kwantyla F 1 (q) na poziomie ufności co najmniej γ (por. np. David (1981)). Jeżeli F jest rozkładem jednostajnym U(0, 1) to zamiast P F będziemy pisać P. Ponieważ P F {X i:n F 1 (q) X j:n } = P {U i:n q U j:n } więc nasze rozważania możemy ograniczyć do konstrukcji przedziałów ufności (U i:n, U j:n ), gdzie U i:n, U j:n są statystykami pozycyjnymi z rozkładu U(0, 1). Przede wszystkim zauważmy, że dla danego poziomu ufności γ dwustronny przedział ufności dla kwantyla rzędu q istnieje tylko wtedy, gdy P {U 1:n q U n:n } γ, to znaczy, gdy (C) q n + (1 q) n 1 γ. 2
W tabeli 1 podane są minimalne liczności próby dla przykłądowych wartości γ oraz q. Tabela 1. Minimalne liczności próby q γ 0.900 0.925 0.950 0.975 0.990 0.900 22 30 45 91 230 0.925 25 34 51 103 258 0.950 29 39 59 119 299 0.975 36 48 72 146 368 0.990 44 60 90 182 459 Poziom ufności tak skonstruowanego przedziału ufności wynosi co najmniej γ. Jeżeli chcemy skonstruować przedział ufności dokładnie na poziomie ufności γ, to możemy posłużyć się randomizacją. To znaczy, konstruujemy dwie całkowitoliczbowe zmienne losowe I oraz J, niezależne od zmiennej losowej X, i jako poszukiwany przedział ufności przyjmujemy (X I:n, X J:n ). Niech P {I = i, J = j} = λ ij. Przy tym oznaczeniu P F {X I:n F 1 (q) X J:n } = P {U I:n q U J:n } = n 1 λ ij p(i, j; n, q). Rozkład prawdopodobieństwa wektora losowego (I, J) może być dobrany tak, by prawdopodobieństwo pokrycia wynosiło dokładnie γ. Oczywiście istnieje nieskończenie wiele takich rozkładów, co daje nieskończenie wiele nieparametrycznych przedziałów ufności. Spośród nich wybierzemy najkrótszy w sensie następującego kryterium E(J I) = n 1 (j i)λ ij. Najlepszy rozkład λ ij otrzymuje się jako rozwiązanie następującego zagadnienia programowania liniowego n 1 n 1 (j i)λ ij = minimum, λ ij p(i, j; n, q) = γ, n 1 λ ij = 1, λ ij 0, 1 i < j n. 3
Rozwiązaniem jest wierzchołek odpowiedniego sympleksu, tzn. punkt taki, że wszystkie lambdy z wyjątkiem dwóch są zerowe. Tak więc poszukiwany przedział ufności ma postać { (Ui:n, U j:n ), z prawdopodobieństwem λ, (U i :n, U j :n), z prawdopodobieństwem 1 λ, Matematyczne szczegóły konstrukcji można znaleźć w Zieliński i Zieliński (2005). W tabeli 2 podane są wartości i, j oraz prawdopodobieństwa λ dające dokładny przedział ufności ( oznacza, że żądany przedział nie istnieje). Tabela 2. Końce przedziału ufności (γ = 0.95) n q i j λ n q i j λ 250 0.90 216 234 0.56690 750 0.90 659 691 0.19375 216 235 0.43310 659 692 0.80625 0.95 231 244 0.46615 0.95 701 724 0.37103 231 245 0.53385 701 725 0.62897 0.99 0.99 738 748 0.55963 737 748 0.44037 500 0.90 437 463 0.28223 1000 0.90 882 919 0.15529 437 464 0.71777 881 919 0.84471 0.95 466 485 0.01118 0.95 937 963 0.95617 465 485 0.98882 937 964 0.04383 0.99 491 499 0.62852 0.99 984 996 0.27278 491 500 0.37148 984 997 0.72722 Zastosowanie W bieżącym rozdziale pokażemy zastosowanie opisanej wcześniej konstrukcji do estymacji VaR dla akcji BRE banku. Analizujemy notowania Y t akcji BRE banku o okresie od 29 grudnia 1999 do 3 grudnia (1049 danych). Dane te można traktować jako realizację pewnego procesu stochastycznego. Przebieg tej realizacji pokazany jest na rysunku 1. Oczywiście dane te nie są stochastycznie niezależne. W celu uzyskania próby niezależnych zmiennych losowych przekształcamy obserwacje: ( ) Yt X t = ln, t = 1, 2, 3,..., 1048, Y t 1 http://www.money.pl/gielda/archiwum/spolki/ 4
Przebieg procesu X t pokazany jest na rysunku 2. W celu sprawdzenia stochastycznej niezależności zmiennych losowych X 1, X 2,..., X 1048 zastosowano test serii. Z ciągu obserwacji X 1, X 2,..., X 1048 wyznaczono medianę (Me) i przekształcono zmienne X i w taki sposób, że jeżeli X i > Me to pisano A, jeżeli zaś X i < Me to pisano B. Otrzymano w ten sposób ciąg liter A oraz B i zliczono ilość serii, czyli ilość jednoliterowych podciągów. Otrzymano w tym ciągu 505 serii. Ponieważ otrzymanie litery A jest tak samo prawdopodobne jak litery B, więc zmienna losowa opisująca liczbę serii w ciągu n obserwacji (zakładając, że każdy ciąg znaków jest jednakowo prawdopodobny) ma asymptotycznie rozkład normalny o wartości oczekiwanej 2n An B n + 1 i wariancji 2n An B (2n A n B n) (n 1)n. Tutaj n 2 A oznacza liczbę liter A, natomiast n B liczbę liter B. W analizowanym problemie n = 1048, n A = 473 oraz n B = 575. Wyznaczony w znany sposób poziom krytyczny testu serii wynosi 0.348, co sugeruje, że ciąg obserwacji X 1, X 2,..., X 1048 może być uznany za realizację ciągu niezależnych zmiennych losowych. Niech q = 0.99 oraz γ = 0.95. To znaczy, szacujemy wartość VaR przekraczaną z prawdopodobieństwem 0.01. Rozważmy rozkład dwumianowy B(1048, 0.99). W tabeli 3 podany jest fragment tego rozkładu uporządkowany malejąco według prawdopodobieństw. Tabela 3. Rozkład B(1048, 0.99) k p k suma p k 1038 0.12430 0.12430 1037 0.11848 0.24278 1039 0.11843 0.36122 1036 0.10342 0.46464 1040 0.10147 0.56611 1035 0.08325 0.64936 1041 0.07719 0.72656 1034 0.06216 0.78873 1042 0.05134 0.84007 1033 0.04328 0.88336 1043 0.02924 0.91260 1032 0.02822 0.94083 1031 0.01731 0.95814 Analizując tabelę 3 otrzymujemy następujące przedziały ufności dla VaR { (X1032:1048, X 1043:1048 ), na poziomie ufności 0.94083 (X 1031:1048, X 1043:1048 ), na poziomie ufności 0.95814 5
By uzyskać przedział ufności dokładnie na poziomie 0.95 zastosujemy randomizację. Prawdopodobieństwo λ jest rozwiązaniem równania λ0.94083 + (1 λ)0.95814 = 0.95. Otrzymujemy λ = 0.47041. Teraz generujemy generujemy liczbę losową λ 0 z rozkładu jednostajnego U(0, 1). Otrzymaliśmy λ 0 = 0.45159. Ponieważ λ 0 < λ więc jako przedział ufności wybieramy (X 1032:1048, X 1043:1048 ). Dla notowań BRE banku przedział ten przyjmuje postać (5.5021, 7.0618). W celu powtarzalności analiz statystycznych na tych danych wygenerowaną liczbę λ 0 do naszych danych. Literatura (1) Chang Yi Ping, Hung Ming Chin, Wu Yi Fang, Nonparametric Estimation for Risk in Value at Risk Estimator. Communications in Statistics, Simulation and Computation, 2003, 32, 1041 1064. (2) David H. A. Order Statistics. 1981, New York, Wiley. (3) Zieliński R., Zieliński W. Best exact nonparametric confidence intervals for quantiles. Statistics, 2005, 39, 67-71. Summary Value at Risk (VaR) is a measure of market risk recommended by Bank of International Settlement. Var summarizes the worst loss over a holding period with a certain level of confidence. From the statistical point o view, the problem of estimating VaR is equivalent to the problem of estimation of a quantile of a random variable. The main problem in applications is that the distribution of observed random variable remains unknown. If this distribution is known, then standard statistical techniques of point estimation or constructing confidence intervals may be applied. In case of unknown distribution some propositions of nonparametric estimation of q th quantile may be found in literature. Many of them may be found in Chang et. al (2003). In the paper there is shown an application of the exact nonparametric confidence interval for VaR described in Zieliński and Zieliński (2005). Key Words: VaR, nonparametric estimation, confidence intervals. 6