1 Wstęp (Edyta Koziara, Iwona Lorenz) 4 1.1 Przedstawienie aktywów... 5



Podobne dokumenty
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

PDF created with FinePrint pdffactory Pro trial version

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład 3 Hipotezy statystyczne

Weryfikacja hipotez statystycznych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Estymacja parametrów w modelu normalnym

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Spis treści 3 SPIS TREŚCI

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Ryzyko inwestycji na dwóch wybranych rynkach. Optymalny portfel ze względu na VAR i ES. Paweł Karyś

Statystyka matematyczna dla leśników

Testy nieparametryczne

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Kolokwium ze statystyki matematycznej

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

STATYSTYKA

166 Wstęp do statystyki matematycznej

dr hab. Renata Karkowska 1

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Inteligentna analiza danych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Rozkłady statystyk z próby

Statystyka i eksploracja danych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka opisowa. Robert Pietrzykowski.

Zmienne losowe ciągłe i ich rozkłady

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

1 Podstawy rachunku prawdopodobieństwa

Zmienne losowe ciągłe i ich rozkłady

Wykład 3 Momenty zmiennych losowych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 3 Momenty zmiennych losowych.

Porównanie metod szacowania Value at Risk

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Biostatystyka, # 3 /Weterynaria I/

Zadania ze statystyki, cz.6

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Prawa wielkich liczb, centralne twierdzenia graniczne

Wykład 7 Testowanie zgodności z rozkładem normalnym

Analizy wariancji ANOVA (analysis of variance)

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Wprowadzenie do analizy korelacji i regresji

KORELACJE I REGRESJA LINIOWA

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez statystycznych.

Ekonometria Finansowa II EARF. Michał Rubaszek

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Statystyka w przykładach

Testowanie hipotez statystycznych cd.

WNIOSKOWANIE STATYSTYCZNE

Ważne rozkłady i twierdzenia c.d.

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Komputerowa Analiza Danych Doświadczalnych

Wykład 5: Statystyki opisowe (część 2)

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Matematyka ubezpieczeń majątkowych r.

Rozdział 8. Regresja. Definiowanie modelu

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Transkrypt:

Spis treści 1 Wstęp (Edyta Koziara, Iwona Lorenz) 4 1.1 Przedstawienie aktywów................................. 5 2 Analiza danych (Iwona Lorenz) 9 2.1 Charakterystyki liczbowe................................ 11 2.2 Testy normalności.................................... 13 3 Miary ryzyka 15 3.1 Koherentne miary ryzyka (Edyta Koziara)....................... 15 3.2 Value-at-Risk (Edyta Koziara)............................. 16 3.3 Expected Shortfall (Iwona Lorenz)........................... 17 4 Modelowanie rozkładów dwuwymiarowych 21 4.1 Test Mardia (Edyta Koziara).............................. 21 4.2 Estymacja gęstości (Edyta Koziara).......................... 22 4.3 Kopuły (Iwona Lorenz)................................. 24 4.3.1 Podstawowy podział kopuł........................... 24 4.4 Inwestycja łączna (Edyta Koziara)........................... 28 4.5 Porównanie inwestycji (Iwona Lorenz)......................... 29 5 Podsumowanie (Edyta Koziara, Iwona Lorenz) 31 Załączniki 32 Dodatek A........................................... 32 Dodatek B........................................... 36 Dodatek C........................................... 45 Wykaz literatury 46 3

1 Wstęp Praca przedstawia ocenę ryzyka straty inwestycji w akcje dwóch wybranych aktywów. Przeanalizowane zostały różne portfele inwestycyjne (jednoskładnikowe oraz złożone) w łącznej kwocie 1 mln dolarów na okres jednego miesiąca. Do oszacowania potrzebnych zabezpieczeń finansowych posłużono się wybranymi miarami ryzyka, Value at Risk oraz Expected Shortfall. Praca złożona jest z 5 rozdziałów. Pierwszy rozdział zawiera wstęp oraz podstawowe wiadomości dotyczące aktywów: pszenicy oraz soi. Ponadto w tym rozdziale przedstawione zostały historyczne notowania na otwarcie i zamknięcie miesiąca z ostatnich 5 lat, razem 61 obserwacji. W rozdziale drugim napisanym przez Iwonę Lorenz znajdują się dane, wartości stóp strat wyliczone na podstawie wszystkich obserwacji. Przedstawiona została także statystyczna analiza danych oraz test na normalność rozkładu stóp strat. W trzecim rozdziale, wprowadzona została teoria miar ryzyka. W podrozdziale 3.1 oraz 3.2 napisanym przez Edytę Koziarę wyróżniono koherentność miary oraz opis i interpretację wartości zagrożonej ryzykiem. Kolejny podrozdział zawierający omówienie i interpretację uśrednionej wartości zagrożonej napisała Iwona Lorenz. Rozdział czwarty zawiera badanie dwuwymiarowego rozkładu, niezbędnego przy analizie dwuskładnikowego portfela inwestycyjnego. Pierwsze dwa podrozdziały napisane przez Edytę Koziarę przedstawiają test Mardia oraz estymację gęstości. W kolejnym podrozdziale napisanym przez Iwonę Lorenz umieszczona została koncepcja funkcji kopuły oraz równania i wykresy wybranych kopuł archimedejskich i eliptycznych. Na podstawie wyestymowanych danych otrzymano parametry kopuł, decydujące o najlepiej dopasowanej funkcji do danych. Podrozdział omawiający dywersyfikacje portfela łącznego napisała Edyta Koziara. Podsumowanie rozdziału zawierające porównanie inwestycji jednoskładnikowej z dwuskładnikową, napisała Iwona Lorenz. Do oszacowania ryzyka inwestycji złożonej posłużono się wybraną wcześniej kopułą. Jest to najważniejsza część pracy, w której podsumowano i porównano różne portfele, dla których przeanalizowano wysokości rezerw koniecznych do zabezpieczenia inwestycji. Na końcu pracy umieszczono Załączniki. W Dodatku A przedstawione są dodatkowe definicje, wzory oraz przeprowadzone dowody. W Dodatku B zawarty jest kod do programu SAS 9.3, dzięki któremu wygenerowano wykresy oraz wartości użyte w pracy. W ostatnim Dodatku C załączono tablicę kwantyli rozkładu normalnego. Abstract This thesis evaluated the risk of loss of investment in the shares of the two selected assets. Different investment portfolios (one-and complex) were analyzed for a period of one month. I took the total amount 1 million U.S. dollars. To estimate the necessary financial security was used to selected risk measures, Value at Risk and Expected Shortfall. The BA thesis consists of five chapters. The first chapter contains an introduction and basic information concerning the assets of wheat and soybeans. In addition, this chapter presents the historical stock quotes for for the opening and closing of the month in the last five years. It included 61 observations. The second section contains data, the feet losses calculated on the based on all observations. Also presents the a statistical analysis of the data and test for normality of distribution losses feet. Iwona Lorenz did it. 4

In the third chapter, was introduced the theory of risk measures. In subsection 3.1 and 3.2 written by Edyta Koziara, distinguished coherence in the measurement and description and interpretation of value at risk. The next section contains a discussion and interpretation of averaged value at risk. That wrote Iwona Lorenz. The fourth chapter presents the study of two-dimensional distribution, which is necessary in the analysis of two-component of the investment portfolio. The first two sections written by Edyta Koziara present Mardia test and density estimation. In the next section written by Iwona Lorenz was placed in the dome of the concept of functions and equations and graphs of selected archimedes and elliptical domes.based on assessment data, the parameters of the domes, determining the bestfit function to the data. Subsection discusses the joint portfolio diversification wrote Edyta Koziara. Summary of Chapter containing a comparison of investment mono-component. Iwona Lorenz wrote it. To estimate the risk of the investment complex was used previously selected dome. This is the most important part of the thesis, which summarizes and compares the different portfolios, which were analyzed for the amount of reserves necessary to protect your investment. On the end placed Attachments. Appendix A shows the additional definitions, formulas, and carried out the evidence. In Appendix B is contained code to the SAS 9.3 by which the generated charts and the values used in the work. In the last Appendix C attached array quantile of the normal distribution. 1.1 Przedstawienie aktywów Każda inwestycja powiązana jest ściśle z ryzykiem, bez względu na to czy dotyczy ona działalności gospodarczej, zakupu towaru, czy inwestycji na rynku finansowym. Samo pojęcie ryzyka oznacza zagrożenie osiągnięcia określonych planów, spotykane przy podejmowaniu codziennych decyzji. Szacujemy wówczas prawdopodobieństwo zdarzeń za pomocą rozsądku, doświadczenia czy też rachunku prawdopodobieństwa. W naszej pracy przedstawimy ryzyko inwestycji, będące mierzalną niepewnością. Wyliczone rezerwy określone na podstawie miar ryzyka wykorzystamy do oszacowanie potrzebnych zabezpieczeń przed stratną inwestycją. Analizując wspomniane ryzyko skupimy się na dwóch zbożach pszenicy oraz soi. Są to najpowszechniejsze rośliny odpowiednio wśród zbóż i roślin oleistych. Zboża te są istotnymi składnikami paszy i stanowią wartościową część pożywienia dla człowieka. Soja to roślina jednoroczna należąca do rodziny bobowatych. Pochodzi z południowowschodniej Azji. Jest jedną z najbardziej popularnych roślin oleistych w handlu. Stanowi cenny pokarm dla człowieka i jest ważnym surowcem do produkcji pasz (jej nasiona zawierają 25% tłuszczu i 50% białka). Na bazie jej nasion wytwarza się m.in. olej, mączkę, kaszę oraz mleko sojowe. Preparaty z soi podnoszą wartości odżywcze pokarmów, dodawane są do przetworów, m.in. konserw mięsnych, wędlin. Wyhodowanie dużej liczby odmian soi umożliwiło jej uprawę we wszystkich klimatach. Obecnie największe uprawy znajdują się na obszarach o klimacie umiarkowanym ciepłym. Prawie 1/3 światowej produkcji soi podlega eksportowi. Do największych eksporterów należą: Brazylia, Stany Zjednoczone, kraje Ameryki Południowej, Paragwaj, Kanada i Ukraina, a do największych importerów: Chiny, kraje Europy, Japonia oraz Australia. Na wartości notowań soi na giełdzie znaczący wpływ mają etapy rozwoju rośliny. 5

Pszenica jest jednym z najstarszych zbóż. Uprawia się ją od co najmniej 6 tysięcy lat. Pochodzi z południowo-zachodniej i środkowej Azji. Uprawiana jest przede wszystkim w strefach klimatu umiarkowanego i podzwrotnikowego (wymaga okresu wegetacyjnego powyżej 100 dni). Na świecie zajmuje pierwsze miejsce w strukturze zasiewów z powierzchnią 220 mln hektarów. Tak jak i soja, stanowi cenny pokarm dla człowieka. Z pszenicy produkuje się najlepsze gatunki mąk, które służą do wyrobu chleba, makaronów oraz produktów cukierniczych. Spożycie globalne wynosi około 70 kg na osobę rocznie. Na świecie zbiera się około 690 mln ton ziaren pszenicy rocznie, co daje jej trzecie miejsce po ryżu i kukurydzy. Średnio 20% światowej produkcji jest przedmiotem międzynarodowego handlu. Do czołowych producentów tego zboża zaliczamy: Chiny, Indie, Rosję, Francję, Australię i Kanadę, do czołowych eksporterów: Stany Zjednoczone, Kanadę, Francję, Australię i Argentynę, natomiast do czołowych importerów: Rosję, Chiny, Japonię, Egipt, Brazylię i Włochy. Dlaczego akurat surowce rolne? Bardzo dobrą odpowiedź na to pytanie udzielił Biznes.pl 1 : Obrót surowcami rolnymi skupia uwagę inwestorów na całym świecie. Jedną z przyczyn tego zainteresowania jest stosunkowo niska korelacja rynku z rynkiem obrotu akcjami. Dodatkowo rynek surowców rolnych charakteryzuje bardzo duża zmienność ceny poszczególnych towarów rządzą się własnymi prawami, podlegając jednocześnie wypadkowym specyficznym dla tego sektora. Nie są tu rzadkością na przykład kilkuprocentowe wzrosty cen w skali dnia, które poprzedzone znacznymi spadkami w okresie miesiąca, generują kilkunastoprocentowe zyski w ujęciu kwartalnym czy półrocznym. Niekwestionowanym argumentem przemawiającym na korzyść surowców rolnych są rosnące potrzeby konsumpcyjne przy jednocześnie trudnej do zwiększenia w wielu przypadkach podaży, która mimo rosnącej efektywności produkcji, ograniczana jest wieloma czynnikami o charakterze lokalnym i globalnym. Na wskaźniki popytu wyraźnie oddziaływują obecnie państwa wschodzące, które przeobrażając się generują znaczne zapotrzebowanie w zakresie artykułów żywnościowych czy pasz. Z drugiej strony podaż ograniczana jest w wyniku kurczenia się areału upraw, rekalibrowania produkcji czy wreszcie np. na skutek decyzji politycznych, jak wstrzymanie eksportu. Ogromny wpływ posiada tu także niemożliwa do przewidzenia zmienna, czyli pogoda. Powodzie, susze, stopniowa zmiana klimatu czy gwałtowne zjawiska pogodowe w oczywisty sposób wpływają na lokalne i światowe poziomy cen surowców rolnych. 1 Czy rynek surowców rolnych to efektywna alternatywa?, artykuł internetowy [1] 6

Poniżej zaprezentujemy wykresy notowań opisanych surowców z ostatnich 5 lat. Rysunek 1: Wykres notowań soi z lat 2009-2014 Rysunek 2: Wykres notowań pszenicy z lat 2009-2014 Na pierwszy rzut oka widać, że ceny obydwu surowców rosną i maleją w tych samych okresach. Wynika to ze wspomnianej wcześniej zmienności pogody i decyzji politycznych. Dokładniej będzie można to zauważyć na wykresie łącznym. Kolorem niebieskim oznaczone są notowania dla soi a kolorem różowym dla pszenicy. Rysunek 3: Łączny wykres notowań soi (niebieski) i pszenicy (różowy) z lat 2009-2014 7

Rysunek 3 pokazuje, iż notowania soi jak i pszenicy w tych samych momentach spadają a za chwilę gwałtownie rosną. Mimo to trudno jest przewidzieć ceny tych surowców w najbliższym czasie. Niełatwo zatem na podstawie takich danych stwierdzić, która inwestycja (w soję czy pszenicę) jest mniej ryzykowna. W tym celu wylicza się historyczne stopy strat, które mówią o wielkości poniesionych strat na przestrzeni kolejnych miesięcy. 8

2 Analiza danych Dane jakie analizujemy to ceny poszczególnych zbóż (cent/buszel) z okresu 01.01.2009-31.01.2014 roku pozyskane z oficjalnej strony internetowej stooq.com. Bierzemy pod uwagę wartości notowań na otwarciu i na zamknięciu w poszczególnych miesiącach. Stopy strat wyliczamy na podstawie wzoru: gdzie: W o -wartość notowania początkowego, W z -wartość notowania końcowego. L = W o W z W o (2.1) Wszystkie dane zostały zaprezentowane w Tablicy 1 i 2. Tablica 1: Notowania na giełdzie Data Pszenica Soja Rok Miesiąc Otwarcie Zamknięcie Stopy strat Otwarcie Zamknięcie Stopy strat 2014 styczeń 602.88 555 0.07942 1288.88 1283.88 0.00388 2013 2012 grudzień 669.12 605.12 0.09565 1337.62 1289.38 0.03606 listopad 667.62 668.25-0.00094 1266.12 1337-0.05598 październik 678.12 667.38 0.01583 1277.88 1265.62 0.00959 wrzesień 662.62 679.12-0.02490 1396.62 1281.38 0.08251 sierpień 663.25 654.88 0.01262 1247.75 1356.38-0.08706 lipiec 655.5 663.62-0.01239 1427.12 1247.25 0.12604 czerwiec 707.88 656.88 0.07205 1509.62 1429.38 0.05315 maj 731.38 706.62 0.03385 1396.62 1510.12-0.08127 kwiecień 682.88 730.25-0.06937 1402.5 1396.5 0.00428 marzec 716.38 688.25 0.03927 1452.88 1404.38 0.03338 luty 780.25 716.12 0.08219 1470 1451.62 0.01250 styczeń 786.62 780.5 0.00778 1433 1471.12-0.02660 grudzień 869.38 778.5 0.10453 1444 1409.88 0.02363 listopad 867.38 863.5 0.00447 1552.38 1440.62 0.07199 październik 901 867.25 0.03746 1596.75 1552.25 0.02787 wrzesień 892.12 899.38-0.00814 1773.62 1598.38 0.09881 sierpień 889.75 888.63 0.00126 1657.88 1754.37-0.05820 lipiec 764.75 890.88-0.16493 1495.62 1653.5-0.10556 czerwiec 646.25 758.88-0.17428 1344.25 1480.88-0.10164 maj 654.38 644.13 0.01566 1503.38 1340.75 0.10818 kwiecień 662.12 655.13 0.01056 1406.62 1505-0.06994 marzec 665.75 658.88 0.01032 1319.13 1401.88-0.06273 luty 666.75 667.88-0.00169 1202.38 1319.12-0.09709 styczeń 666.38 666.62-0.00036 1236.5 1200.38 0.02921 9

Tablica 2: Notowania na giełdzie Data Pszenica Soja Rok Miesiąc Otwarcie Zamknięcie Stopy strat Otwarcie Zamknięcie Stopy strat 2011 2010 2009 grudzień 614.88 653.12-0.06219 1134.25 1211.88-0.06844 listopad 629.62 615.75 0.02203 1215.62 1134.12 0.06704 październik 608.62 630.12-0.03533 1176.38 1219.62-0.03676 wrzesień 788.38 606.88 0.23022 1455.12 1176.62 0.19139 sierpień 671.12 789.88-0.17696 1350.12 1456.12-0.07851 lipiec 615.75 672.5-0.09216 1309 1346.38-0.02856 czerwiec 767.75 614.25 0.19994 1371.5 1300.5 0.05177 maj 809.25 780.25 0.03584 1392 1377.25 0.01060 kwiecień 761.75 804-0.05546 1405 1394.75 0.00730 marzec 818 762.5 0.06785 1372.5 1406-0.02441 luty 840 816.25 0.02827 1423.5 1365.75 0.04057 styczeń 816 840-0.02941 1407.25 1411.75-0.00320 grudzień 717.5 791.25-0.10279 1265.25 1402.75-0.10867 listopad 721.5 689.25 0.04470 1234.75 1245.75-0.00891 październik 669 715.5-0.06951 1098.75 1232-0.12127 wrzesień 698.75 674.75 0.03435 1013 1102.25-0.08810 sierpień 688.5 684.25 0.00617 1021 1006.75 0.01396 lipiec 481.25 660.25-0.37195 904 1005-0.11173 czerwiec 454.5 482-0.06051 936.4 902 0.03674 maj 505.75 457.75 0.09491 997 937.75 0.05943 kwiecień 452.5 504.5-0.11492 944 999.5-0.05879 marzec 517 450.5 0.12863 955.25 939.75 0.01623 luty 474.5 519.25-0.09431 915 961.75-0.05109 styczeń 554.5 472.75 0.14743 1065.75 914.75 0.14168 grudzień 590 540.25 0.08432 1068.4 1048.25 0.01886 listopad 497 585.4-0.17787 984 1060.4-0.07764 październik 450 493.4-0.09644 925 976.4-0.05557 wrzesień 491.4 456.4 0.07122 983 927 0.05697 sierpień 542 499 0.07934 1032 979.4 0.05097 lipiec 540 528 0.02222 1000 982 0.01800 czerwiec 656 545 0.16921 1202 981 0.18386 maj 541 636.4-0.17634 1055 1184-0.12227 kwiecień 528 537-0.01704 956 1055-0.10356 marzec 510.4 532-0.04232 851 952-0.11868 luty 559 520 0.06977 970 872 0.10103 styczeń 602 567 0.05814 970 980-0.01031 W związku, ze wzorem (2.1) ujemne stopy strat są zyskami, zaś dodatnie - stratami. W przypadku obu surowców kolorem czerwonym zostały oznaczone 3 największe straty a kolorem niebieskim największe zyski. 10

2.1 Charakterystyki liczbowe Oceniając ryzyko inwestycji warto przeprowadzić analizę zebranych danych. Zaczniemy od wyznaczenia charakterystyk liczbowych wyznaczonych na podstawie danych statystycznych oraz od przeanalizowania rozkładu. Poniżej przedstawiamy podstawowe definicje opracowane na podstawie pozycji [6] umieszczonej w Wykazie literatury. Punktem wyjścia badania statystycznego cechy X jest wylosowanie z całej populacji pewnej skończonej liczby n elementów. Uzyskane w ten sposób wartości x 1, x 2,..., x n są zaobserwowanymi wartościami n-elementowej próby o rozkładzie X. Do najważniejszych form wnioskowania statystycznego należą: estymacja (ocena) nieznanych parametrów bądź ich funkcji. Parametry te charakteryzują rozkład badanej cechy populacji, weryfikacja (badanie prawdziwości) postawionych hipotez statystycznych. Wnioskowanie statystyczne dostarcza jedynie wniosków wiarygodnych - a nie absolutnie prawdziwych. Dowolne dwie n-elementowe próbki z tej samej populacji są na ogół różne. Wygodnie jest traktować ciąg x 1, x 2,..., x n jako realizację ciągu X 1, X 2,..., X n, gdzie X i, i=1,2,...,n jest ciągiem niezależnych zmiennych losowych. Ciąg tych zmiennych losowych X 1, X 2,..., X n będziemy nazywali n-elementową próbą losową. Ciąg liczb x 1, x 2,..., x n będziemy nazywali zaobserwowaną próbą losową, bądź po prostu próbką. [6] Definicja 2.1.1. Estymator wartości oczekiwanej [6] Estymatorem wartości oczekiwanej µ = E(X), inaczej średnią z próby x 1,...x n nazywamy liczbę x określoną wzorem: Definicja 2.1.2. Estymator mediany ˆµ = x = 1 n n x i. Miedianą nazywamy kwantyl rzędu 1 2, co oznaczamy q 0.5(F ). Zachodzi równość: gdzie m e jest medianą próbki. Uzupełnienie znajduje się w Dodatku A.1. i A.2. i=1 ˆq 0.5 (F ) = m e, Definicja 2.1.3. Estymator odchylenia standardowego i wariancji Estymatory miar rozproszenia wyrażają się wzorami: a) wariancja: ˆσ 2 = 1 n 1 n (x i x) 2, i=1 b) odchylenie standardowe: ˆσ = ˆσ 2 = 1 n 1 n (x i x) 2. i=1 Odchylenie standardowe mówi, jak rozlegle rozrzucone są wartości wokół średniej. 11

Definicja 2.1.4. Estymator skośności Estymator skośności wyraża się wzorem: gdzie: Â = M3 σ 3 = M 3 -trzeci moment centralny [Dodatek A.6], σ-odchylenie standardowe. 1 n n (x i x) 3 i=1 σ, 3 Ujemna wartość skośności wskazuje na lewostronną asymetrię (wydłużone lewe ramię rozkładu), dodatnia na prawostronną (wydłużone prawe ramię rozkładu), natomiast skośność równa zeru oznacza rozkład symetryczny. Definicja 2.1.5. Estymator kurtozy Estymator kurtozy wyraża się wzorem: gdzie: M 4 -czwarty moment centralny, σ-odchylenie standardowe. ˆK = M4 σ 4 3 = 1 n n i=1 (x i x) 4 σ 4 3, Im większa kurtoza, tym bardziej dane skupiają się wokół średniej. Jeśli jej wartość jest ujemna to dane są bardziej skoncentrowane niż przy rozkładzie normalnym, a jeśli dodatnia to odwrotnie. Gdy kurtoza wynosi zero, spłaszczenie rozkładu jest podobne do spłaszczenia rozkładu normalnego. Po zdefiniowaniu charakterystyk liczbowych przejdźmy do omówienia poszczególnych wartości dla stóp strat pszenicy i soi uzyskanych w wyniku działania programu SAS 9.3. Tablica 3: Wyestymowane charakterystyki liczbowe dla pszenicy Momenty N 61 Suma wag 61 Średnia -0.0002295 Mediana 0.01 Odchylenie std. 0.10124844 Wariancja 0.01025125 Skośność -0.7755391 Kurtoza 2.25383341 Tablica 3 prezentuje wyestymowane wartości dla pszenicy. Średnia arytmetyczna jest ujemna, co wskazuje, że średnio z inwestycji w to zboże osiągamy nieznaczne zyski. Odchylenie standardowe jest bliskie zeru, zatem dane nie odstają daleko od średniej. Mediana ma również wartość nieznacznie różną od zera, co oznacza, że zysków i strat jest mniej więcej po równo. Ujemna skośność świadczy o lewostronnej asymetrii (czyli dłuższym lewym ogonie). Dodatnia kurtoza mówi o większej smukłości rozkładu danych próbki pszenicy niż w przypadku rozkładu normalnego. 12

Tablica 4: Wyestymowane charakterystyki liczbowe dla soi Momenty N 61 Suma wag 61 Średnia -0.0038689 Mediana 0.004 Odchylenie std. 0.07690589 Wariancja 0.00591452 Skośność 0.40859525 Kurtoza -0.2697633 Tablica 4 prezentuje oszacowane wartości dla soi. Średnia arytmetyczna również jest ujemna, co wskazuje, że średnio z inwestycji osiągamy zyski. Odchylenie standardowe jest bliskie zeru, zatem dane nie odstają daleko od średniej. Mediana ma wartość nieznacznie różną od zera, co oznacza, że zysków i strat jest mniej więcej po równo, tak jak i w przypadku pszenicy. Dodatnia skośność świadczy o dłuższym prawym ogonie. Bliska zeru kurtoza sugeruje zbliżenie danych do rozkładu normalnego. Histogramy (najbardziej popularne wykresy statystyczne) potwierdzają liczbowe wartości statystyk. Rysunek 4: Histogramy dla zmiennej L1 (pszenica) i zmiennej L2 (soja) Jak łatwo zauważyć na Rysynku 4 histogramy dla obu aktywów wyglądają inaczej. W przypadku zmiennej L1 wartość skośności była ujemna, zatem widoczna jest asymetria lewostronna, natomiast w przypadku zmiennej L2 skośność była dodatnia i zauważamy wydłużenie prawego ogona rozkładu. Ewidentna różnica jest również w smukłości rozkładów. Tak jak wskazywały wartości kurtozy dla próbki soi (zmienna L2) dane są rozłożone a wykres przypomina rozkład normalny. Dane dotyczące pszenicy (zmienna L1) są bardziej skoncentrowane, dzięki czemu wykres jest bardziej spiczasty. Należy jednak pamiętać, iż histogramy jedynie potwierdzają zmienność i kształt analizowanych danych. Zawsze należy wykonać testy statystyczne, a nie tylko sugerować się wyglądem wykresu. 2.2 Testy normalności Mając już pewne wyobrażenie na temat naszych danych po przeanalizowaniu charakterystyk liczbowych przystąpimy do analizy rozkładu. W tym celu skorzystamy z testów normalności. Testy te sprawdzają, czy rozkład danych różni się od założonego rozkładu teoretycznego, gdy znana jest tylko pewna skończona liczba obserwacji. Naszym założonym rozkładem teoretycznym będzie 13

rozkład normalny. Badając normalność stawiamy hipotezę zerową o dopasowaniu danych do rozkładu normalnego, wobec hipotezy alternatywnej, że dane takiego rozkładu nie mają. Formalny zapis hipotez: H 0 - dane pochodzą z rozkładu normalnego, H A - dane nie pochodzą z rozkładu normalnego. Przyjmujemy poziom istotność α = 0, 05. Jest to maksymalne ryzyko błędu, jakie możemy dopuścić. Wykonując test porównujemy poziom istotności α z wyliczoną wartością p zgodnie z regułami decyzyjnymi. Jeśli wartość p jest większa od poziomu istotności α to nie mamy podstaw do odrzucenia H 0, w przeciwnym przypadku odrzucamy H 0 na korzyść H A. Formalna definicja rozkładu normalnego umieszczona jest w Dodatku A.7. Korzystając z programu SAS 9.3 przeprowadzimy dwa testy: test Shapiro-Wilka oraz Kołmogorowa-Smirnowa. Bezsporną zaletą użytych testów jest możliwość korzystania z nich w przypadku analizy rozkładów niedużych prób. Ponadto test Shapiro-Wilka jest jednym z najbardziej preferowanych testów na normalność rozkładu ze względu na moc w porównaniu z innymi dostępnymi testami. Tablica 5: Testy normalności dla pszenicy Test Statystyka Wartość p Shapiro-Wilka W 0.952981 Pr.<W 0.0200 Kołmogorowa-Smirnowa D 0.115975 Pr.>D 0.0407 Jak wskazuje Tablica 5 wartość p dla dwóch testów jest mniejsza niż zadany poziom istotności α. Jak wcześniej było powiedziane, w takim przypadku odrzucamy hipotezę o normalności rozkładu danych pszenicy i przyjmujemy hipotezę alternatywną. Tablica 6: Testy normalności dla soi Test Statystyka Wartość p Shapiro-Wilka W 0.964099 Pr.<W 0.0706 Kołmogorowa-Smirnowa D 0.095331 Pr.>D >0.1500 W przypadku próbki soi wartość p jest większa niż poziom istotniści α, co potwierdza Tablica 6. Biorąc pod uwagę otrzymane wyniki nie mamy podstaw do odrzucenia hipotezy zerowej. W związku z tym przyjmujemy, że dane mają rozkład normalny. Kod z programu SAS 9.3, użyty do wyznaczenia statystyk i wykonania testów, znajduje się w Dodatku B.1. 14

3 Miary ryzyka Oceniając ryzyko inwestycji należy oszacować rezerwy, jakie trzeba zgromadzić by inwestycja nie przyniosła straty (w najgorszym przypadku). Funkcje obliczające wysokości tych rezerw nazywane są miarami ryzyka, w szczególności koherentnymi miarami ryzyka. Rozdział ten został opracowany głownie na podstawie pozycji [2]. 3.1 Koherentne miary ryzyka Aby określić czym jest koherentna miara ryzyka zaczniemy od zdefiniowania miary ryzyka. Ustalmy pewną przestrzeń probabilistyczną (Ω,F,P) a oznaczmy przedział czasowy inwestycji. Poprzez L 0 (Ω,F,P) oznaczmy zbiór wszystkich zmiennych losowych określonych na (Ω,F ). Elementy zbioru zmiennych losowych stożka wypukłego M [Dodatek A.8.] należącego do L 0 (Ω,F,P) będziemy rozumieli jako stopy strat inwestycji w przedziale czasowym. Wówczas miarę ryzyka definiujemy nastepująco: Definicja 3.1.1. Miara ryzyka [5] Miarą ryzyka nazywamy pewną funkcję rzeczywistą działającą ze zbioru zmiennych losowych określonych na stożku wypukłym na zbiór liczb rzeczywistych ρ : M R. Mając formalną Definicję 3.1.1. przejdźmy do interpretacji. Miarę ryzyka ρ(l) rozumiemy jako wielkość rezerw dołożonych do inwestycji. W przypadku ujemnej bądź zerowej wartości (ρ(l) 0) możemy stwierdzić, że nie trzeba tworzyć dodatkowych rezerw, gdyż ujemna stopa strat to zysk. W sytuacji odwrotnej (ρ(l)>0) należy przygotować odpowiednią ilość rezerw finansowych. Po wyjaśnieniu czym jest miara ryzyka przejdziemy do omówienia koherentności miar. Definicja 3.1.2. Koherentne miary ryzyka [2] Funkcję ρ : M R nazywamy koherentną miarą ryzyka, jeśli: 1. jest niezmiennicza na translacje, czyli dla dowolnego l R oraz L M ρ(l + L) = l + ρ(l) (3.1) Jeżeli mamy inwestycję na kwotę L i l jest kwotą, którą jesteśmy dłużni to rezerwy ρ(l) naszej inwestycji musimy powiększyć o kwotę l. 2. jest subaddytywna ρ(l 1 + L 2 ) ρ(l 1 ) + ρ(l 2 ) (3.2) Subaddytywność oznacza, że jeśli mamy dwie inwestycje A i B (o stratach odpowiednio L 1 i L 2 ) to ryzyko poniesienia straty dla portfela złożonego z tych inwestycji (A+B) jest mniejsze lub równe niż suma ich indywidualnych ryzyk. 3. jest dodatnio jednorodna, czyli jeśli λ > 0 ρ(λl) = λρ(l) (3.3) 15

Jeżeli ryzyko wzrasta λ-krotnie to rezerwy też muszą być λ-krotnie większe. 4. jest monotoniczna, jeśli L 1 L 2 prawie wszędzie to ρ(l 1 ) ρ(l 2 ). (3.4) Jeżeli strata L 1 dla inwestycji A jest mniejsza niż strata L 2 dla inwestycji B, wówczas ryzyko poniesienia straty z inwestycji A jest mniejsze niż z inwestycji B. Lemat 1. Równoważność warunków miary ryzyka Jeśli miara ryzyka ρ spełnia warunki o subaddytywności i dodatniej jednorodności to warunek monotoniczności jest równoważny z: L M L 0 ρ(l) 0. Dowód powyższego lematu znajduję się w Dodatku A.11. 3.2 Value-at-Risk Jedną z najpopularniejszych miar ryzyka jest miara nazywana wartością zagrożona, w skrócie V ar α (ang. Value-at-Risk). Estymuje ona maksymalną kwotę, jaką można stracić inwestując w przedziale czasowym przy ustalonym poziomie ufności α. Definicja 3.2.1. Value-at-Risk [2] Niech X zmienna losowa. Wówczas wartością zagrożoną (kwantylem) X nazywamy: V ar α (X) = q α (X) = inf{x : F X (x) α} (3.5) gdzie F X oznacza dystrybuantę. Mniej formalnie mówiąc jest to pierwszy moment przecięcia poziomu α na wykresie dystrybuanty. W ujęciu probabilistycznym, V ar α interpretuje się jako kwantyl rzędu α. Poziom ufności α ustala się dowolnie, jednak najczęściej przyjmuje się α=0.95. Co oznacza, że isnieje 95% szansy, iż strata będzie mniejsza niż oszacowana wartość tej miary. Przedział czasowy również ustalamy dowolnie. Wartość zagrożona nie jest koherentną miarą ryzyka, nie spełnia warunku subaddytywności. Dowód znajduje się w Dodatku A.12. Z uwagi na to, że indeksy pszenicy nie formują rozkładu normalnego skorzystamy z programu SAS 9.3, aby wyznaczyć kwantyl nieznanego nam rozkładu [Dodatek B.1.]. Przyjrzyjmy się wartościom otrzymanym dla naszych danych. Tablica 7: Wyestymowana wartość zagrożona Value-at-Risk pszenica soja 0.147 0.126 Na podstawie Tablicy 7 możemy stwierdzić, że możliwa strata inwestycji w soję jest mniejsza niż strata przy inwestycji w pszenicę, gdyż mniejsza wartość Value-at-Risk świadczy o mniejszym ryzyku. Oszacujmy więc potrzebne rezerwy przy inwestycji 1 mln dolarów w każde aktywo, przy pomocy wzoru (3.3): 16

Dla pszenicy V ar 0.95 (1000000 L 1 ) = 1000000 V ar 0.95 (L 1 ) = 1000000 0.147 = 147000[USD] Dla soi V ar 0.95 (1000000 L 2 ) = 1000000 V ar 0.95 (L 2 ) = 1000000 0.126 = 126000[USD] Zastanówmy się czy można zredukować to ryzyko, estymując dane znanym rozkładem normalnym. Przyjmijmy za parametry rozkładu wcześniej oszacowane wartości średniej oraz odchylenia standardowego, umieszczone w Tablicy 3 i 4. Zatem załóżmy, że: stopy strat dla pszenicy mają rozkład normalny: N(-0.0002295;0.10124844), stopy strat dla soi mają rozkład normalny: N(-0.0038689;0.07690589). Na podstawie wzoru umieszczonego w Dodatku A.10. wyznaczymy wartości kwantyli poszczególnych aktywów przyjmując wartość kwantyla standardowego rozkładu normalnego rzędu 0.95 równą 1.6449 [Dodatek C.1.] : Dla pszenicy: V ar α = 0.10124844 1.6449 + ( 0.0002295) = 0.1663141 Dla soi: V ar α = 0.07690589 1.6449 + ( 0.0038689) = 0.1226336 Wyliczmy rezerwy pamiętając, że inwestujemy 1 mln dolarów : Dla pszenicy V ar 0.95 (1000000 L 1 ) = 1000000 V ar 0.95 (L 1 ) = 1000000 0.1663141 = 166314.1[USD] Dla soi V ar 0.95 (1000000 L 2 ) = 1000000 V ar 0.95 (L 2 ) = 1000000 0.1226336 = 122633.6[USD] Porównując powyższe wyniki z wcześniej wyznaczonymi [Tablica 7] stwierdzamy, że program SAS 9.3 generuje mniejsze wartości Value-at-Risk nieznanego nam rozkładu dla stóp strat pszenicy, natomiast dla soi większe. Warto też zauważyć, że w przypadku soi liczby te, wyliczone dwoma sposobami, niewiele się różnią. Stąd też potwierdzenie zbliżenia rozkładu stóp strat soi do rozkładu normalnego. 3.3 Expected Shortfall Kolejną miarą ryzyka jaką omówimy jest tzw. zagrożona wartość oczekiwana lub uśredniona wartość zagrożona, w skrocie ES α (ang. Expected Shortfall). Jej wartość jest większa niż wartość V ar α, gdyż określa ile średnio stracimy jeśli strata przekroczy poziom α. Miara ta oddaje własności ogonów rozkładu. Estymuje średnią stratę dla przypadków znajdujących się w (1-α) ogonie procentowym rozkładu. 17

Definicja 3.3.1. Expected Shortfall [2] Niech X zmienna losowa, taka że E X <. Wówczas uśrednioną wartością zagrożoną (ang. Expected shortfall) nazywamy: gdzie F X oznacza dystrybuantę. ES α (X) = 1 1 V ar u (X)du, (3.6) 1 α α Jak wynika wprost z Definicji 3.3.1. Expected Shortfall jest miarą powiązaną z wartością zagrożoną, zachodzi nierówność: ES α (X) V ar α (X) Zagrożona wartość oczekiwana jest koherentną miarą ryzyka. Dowód umieszczony jest w Dodatku A.13. Po teoretycznym wprowadzeniu przejdźmy do wyliczenia wartości Expected Shortfall dla naszych danych, w tym celu posłużymy się następującym lematem: Lemat 2. [5] Niech L 1, L 2,... będzie ciągiem niezależnych zmiennych losowych o tym samym rozkładzie F L. Wówczas lim n n(1 α) i=1 L i,n n(1 α) = ES α(l) p.w., (3.7) gdzie L 1,n L 2,n... L n,n są statystykami pozycyjnymi L 1, L 2,..., L n. Jak wynika z Lematu 2. będziemy sumować n(1 α) największych strat. Obliczmy: n(1 α) = 61 (1 0.95) = 3. Wspomniane 3 największe straty zostały oznaczone w Tablicy 1 i 2 kolorem czerwonym. Wartości Expected Shortfall dla naszych danych zostały wyliczone za pomocą programu SAS 9.3. Kod został umieszczony w Dodatku B.2. Tablica 8: Wyestymowana uśredniona wartość zagrożona Expected Shortfall pszenica soja 0.1996667 0.1723333 Z Tablicy 8 wynika, że tak jak i w przypadku wartości zagrożonej, wartość dla pszenicy jest większa. Sprawdźmy zatem wysokości rezerw jakie musimy zgromadzić by inwestycja nie przyniosła nam straty. Jak już wcześniej było powiedziane będziemy inwestować kwotę w wysokości 1 mln dolarów w każde aktywo. Wykorzystując dodatnią jednorodność uśrednionej wartości zagrożonej: ES α (1000000 L) = 1000000 ES α (L) dla danych zapiszmy: 18

Dla pszenicy ES 0.95 (1000000 L 1 ) = 1000000 ES 0.95 (L 1 ) = 1000000 0.1996667 = 199666.7[USD] Dla soi ES 0.95 (1000000 L 2 ) = 1000000 ES 0.95 (L 2 ) = 1000000 0.1723333 = 172333.3[USD] Istnieje jeszcze jeden sposób obliczenia uśrednionej wartości zagrożonej. W tym celu skorzystamy z twierdzenia. Twierdzenie 1. Expected Shortfall dla rozkładu normalnego [5] W przypadku, gdy α (0,1) oraz dystrybuanta straty F L ma rozkład normalny o średniej µ oraz o wariancji σ 2, czyli F L N(µ,σ 2 ), możemy zapisać ES α = µ + σ φ(φ 1 (α)) 1 α (3.8) gdzie φ jest gęstością standardowego rozkładu normalnego, a Φ 1 dystrybuantą odwrotną. Jak wynika z Twierdzenia 1. analizowana zmienna musi mieć rozkład normalny. Załóżmy zatem, że obie nasze zmienne (pszenica i soja) mają taki rozkład. Zbadamy na podstawie powyższego twierdzenia, czy dzięki estymacji rozkładem normalnym możemy zmniejszyć ryzyko, a co za tym idzie wysokości potrzebnych rezerw. Jak łatwo zauważyć wzór zależy tylko od parametrów µ i σ, które zostały wyestymowane z rozkładu poszczególnych stóp strat (Tablica 2 i 3), gdyż wartość φ(φ 1 (α)) jest stała (gęstość kwantyla rzędu α standardowego rozkładu normalnego). Posługując się programem SAS 9.3 bez większej trudności wyznaczymy potrzebne wielkości. Tablica 9: Wyestymowana uśredniona wartość zagrożona Expected Shortfall pszenica soja 0.2086010 0.1547537 W tym przypadku również wartość ES dla pszenicy jest znacznie większa. Mając dane z Tablicy 9 wyliczmy wysokości rezerw. Dla pszenicy ES 0.95 (1000000 L 1 ) = 1000000 ES 0.95 (L 1 ) = 1000000 0.2086010 = 208601[USD] Dla soi ES 0.95 (1000000 L 2 ) = 1000000 ES 0.95 (L 2 ) = 1000000 0.1547537 = 154753.7[USD] Wartości Expected Shortfall wyliczone dwoma sposobami różnią się od siebie. Korzystając z Lematu 2. braliśmy pod uwagę tylko konkretne trzy wartości, natomiast korzystając z Twierdzenia 1. parametry rozkładu całej próby, zatem te wyniki są bardziej dokładne. Wyliczając z definicji miarę ryzyka dla próbki pszenicy założyliśmy jej pochodzenie z rozkładu normalnego. Wynik jednak okazał się większy niż przy wykorzystaniu Lematu 2. Możemy zatem stwierdzić, że nasza próba dopasowania próbki pszenicy do rozkładu normalnego nie przyniosła zamierzonego efektu, ponieważ nie zmniejszyliśmy ryzyka. Wartości ES wyliczone dla soi są mniejsze niezależnie od wyboru metody. Najmniejszą wartość otrzymaliśmy analizując parametry rozkładu całej próby, czyli korzystając z Twierdzenia 1. 19

Podsumujmy wszystkie zebrane wyniki. Tablica 10: Porównanie rezerw Var ES Pszenica [USD] Soja [USD] oszacowany kwantyl rzędu 0.95 147000 126000 z założenia o normalności rozkładu 166314.1 122633.6 z Lematu 2. 199666.7 172333.3 z Twierdzenia 1. 208601 154753.7 Jak wynika z Tablicy 10, wszystkie wyliczone wartości dla próbki soi są mniejsze niż dla próbki pszenicy. Zatem dla portfeli jednoskładnikowych stwierdzamy, że inwestując tę samą kwotę w wybrane dwa aktywa, korzystniejsza jest inwestycja w soję, ponieważ potrzebne są mniejsze rezerwy finansowe. 20

4 Modelowanie rozkładów dwuwymiarowych Przeanalizowaliśmy już ryzyko inwestycji portfeli jednoskładnikowych. W tym rozdziale rozpoczniemy badanie portfeli dwuskładnikowych, czyli zajmiemy się znalezieniem rozkładu łącznego portfela. Poznaliśmy już rozkłady obu inwestycji, które w przypadku portfela dwuskładnikowego stają się rozkładami brzegowymi. Rozkład stóp strat dla soi miał rozkład normalny natomiast rozkład dla pszenicy niestety nie (uzasadnienie znajduje się w rozdziale poprzednim). W takim przypadku zweryfikujemy normalność dwuwymiarowego rozkładu. Na początku jednak przedstawimy podstawową definicję wielowymiarowego rozkładu normalnego opracowaną na podstawie pozycji [2]. Definicja 4.1.1. Wielowymiarowy rozkład normalny [2] Wektor X = (X 1, X 2,..., X p ) ma niezdegenerowany rozkład normalny (gaussowski) X N(µ, Σ) jeśli EX = µ R p, Σ = E(X µ)(x µ) T dla macierzy kowariancji detσ 0 zaś gęstość x R p 1 f(x) = exp( 1 (2π) p 2 Σ 1 2 2 (x µ)t Σ 1 (x µ)). Definicja 4.1.1. przedstawia p-wymiarowy rozkład gaussowski wektora losowego X jednoznacznie określony przez p-wymiarowy wektor wartości oczekiwanej µ oraz kwadratową symetryczną i nieujemną macierz kowariancji Σ o wymiarach p x p (oznaczenie X N p (µ, Σ) - zmienna X ma p-wymiarowy rozkład normalny). Jak już wspomnieliśmy we wstępie tego rozdziału będziemy analizować portfel dwuskładnikowy, zatem interesuje nas dwuwymiarowy rozkład normalny (biorąc pod uwagę ww. definicję przyjmujemy p=2). Dla dwuwymiarowego rozkładu normalnego prawdziwe jest twierdzenie. Twierdzenie 2. Niech X = (X 1, X 2,..., X p ) ma rozkład eliptyczny. Wówczas dla L 1,L 2 M zachodzi: V ar α (L 1 + L 2 ) V ar α (L 1 ) + V ar α (L 2 ). Jak wynika z Twierdzenia 2. w przypadku dwuwymiarowości rozkładu normalnego Value-at-Risk jest koherentną miarą ryzyka. 4.1 Test Mardia [2]. Istnieje wiele metod badania dwuwymiarowej normalności. Jedną z nich jest Test Mardia Maridia-test jest oparty na mierze skośności gdzie X,Y są niezależne oraz kurtozie β 1,p = E((X µ) T Σ 1 (Y µ)) 3 21

β 2,p = E((X µ) T Σ 1 (Y µ)) 2. Dla wektorów losowych X,Y wielowymiarowego rozkładu normalnego, jeśli X, Y są niezależne wówczas β 1,p = 0 zaś β 2,p = p(p + 2). Przejdźmy do wykonania tego testu dla naszych danych. Ustalamy standardowo poziom istotności α = 0.05 oraz zakładamy hipotezę zerową: wobec hipotezy alternatywnej: Bierzemy pod uwagę: H 0 - dane pochodzą z dwuwymiarowego rozkładu normalnego H A - dane nie pochodzą z rozkładu normalnego. kurtozę wielowymiarową znormalizowaną - jeśli jej wartość mieści się w przedziale (-1.96,1.96), to nie mamy podstaw do odrzucenia H 0, w przeciwnym wypadku hipotezę tę odrzucamy; kappę według Mardii, średnią skalowaną kurtozę wielowymiarową oraz skorygowaną średnią skalowaną kurtozę wielowymiarową - wszystkie wartości powinny być większe od wartości krytycznej K = 2 p+2 = 1 2 (p liczba wymiarów), wówczas nie mamy podstaw do odrzucenia H 0, w przeciwnym wypadku hipotezę odrzucamy. Wyniki przedstawia Tablica 11 na podstawie Dodatku B.3. Tablica 11: Test na dwuwymiarową normalność Kurtoza warość hipoteza zerowa Kurtoza wielowymiarowa znormalizowana 1.4103 nie odrzucamy Kappa według Mardii 0.1806 nie odrzucamy Średnia skalowana kurtoza wielowymiarowa 0.3305 nie odrzucamy Skorygowana średnia skalowana kurtoza wielowymiarowa 0.3305 nie odrzucamy W wykonanym teście wszystkie kryteria wskazują, że nie mamy podstaw by odrzucić H 0. Moglibyśmy zatem przyjąć, że nasze dane mają dwuwymiarowy rozkład normalny, jednak nie jest to jednoznacznie stwierdzone (brak podstaw do odrzucenia hipotezy nie jest równoważny z jej przyjęciem). Dlatego w kolejnym rozdziale sprawdzimy czy dopasowania znanymi nam kopułami nie przybliżą precyzyjniej naszego rozkładu danych. Warto w tym miejscu wspomnieć, że jeżeli mamy dane dwuwymiarowe o rozkładzie normalnym to rozkłady brzegowe (dla rozkładu łącznego) również mają taki rozkład. Niestety w naszym przypadku nie jest to jasne, gdyż jak wykazały testy na normalność jeden z rozkładów brzegowych nie był normalny oraz w przypadku dwuwymiarowych danych także nie mamy co do tego pewności. 4.2 Estymacja gęstości Estymacja nieznanej funkcji gęstości polega na aproksymacji (zastąpieniu matematycznych wielkości innymi, o przybliżonych własnościach, łatwiejszymi do badania i zastosowania) przy wykorzystaniu znanej funkcji (np. gęstości rozkładu normalnego). Inaczej mówiąc funkcja ta uśrednia dane obserwowane w próbie i tworzy estymator - wygładzoną aproksymację. Dokonujemy tego przy użyciu procedury KDE (kernel density estimation) w programie SAS 9.3. [Dodatek B.4.] 22

Poniżej znajduje się graficzne przedstawienie estymacji dla naszych danych. Rysunek 5: Rozkład i gęstość danych (wykres dwuwymiarowy) Rysunek 6: Gęstość danych (wykres trójwymiarowy) 23

4.3 Kopuły Jednym ze sposobów wyznaczania rozkładu łącznego jest zastosowanie kopuł. Kopuła jest funkcją wyznaczającą dystrybuantę łączną przy użyciu jednostajnych dystrybuant brzegowych, o czym mówi Twierdzenie Sklara. Zanim jednak przejdziemy do wyznaczania rozkładu przedstawimy niezbędną definicję i twierdzenie. Definicja 4.3.1. Kopuła dwuwymiarowa [9] Kopuła dwuwymiarowa C : [0, 1] 2 [0, 1] jest to funkcja spełniająca następujące warunki: a) C(0, t) = C(t, 0) = 0, dla t I b) C(1, t) = C(t, 1) = t, dla t I c) C(u 2, v 2 ) C(u 1, v 2 ) C(u 2, v 1 ) + C(u 1, v 1 ) 0 dla wszystkich u 1, u 2, v 1, v 2 I, takich że u 1 u 2 i v 1 v 2. Dla wyżej opisanej kopuły dwuwymiarowej możemy sformułować twierdzenie: Twierdzenie 2. (Sklar a) [5] Niech F będzie dystrybuantą łączną o rozkładach brzegowych F 1, F 2. Wówczas istnieje kopuła C : [0, 1] 2 [0, 1] taka, że (x1,x 2) R 2 =[, ] F (x 1, x 2 ) = C(F 1 (x 1 ), F 2 (x 2 )). (5.1) Ponadto, jeżeli rozkłady brzegowe są ciągłe, wówczas C jest określona jednoznacznie. 4.3.1 Podstawowy podział kopuł Kopuły dzielimy na dwie rodziny: archimedejskie i eliptyczne. Do kopuł archimedejskich należą: kopuła Claytona, Franka oraz Gumbela, natomiast rodzina kopuł eliptycznych składa się z kopuły Normalnej i T (T-studenta). Poniżej prezentujemy wzory wymienionych kopuł dla jednostajnych rozkładów brzegowych x 1, x 2 (kopuły dwuwymiarowe). Kopuły archimedejskie Clayton Frank Gumbel C θ (x 1, x 2 ) = (x θ 1 + x θ 2 1) 1 θ, gdzie 0 < θ < (5.2) C θ (x 1, x 2 ) = 1 θ ln[1 + (exp( θx 1) 1)(exp( θx 2 ) 1) ], gdzie θ R\{0} (5.3) exp( θ) 1 C θ (x 1, x 2 ) = exp{ (( lnx 1 ) θ + ( lnx 2 ) θ ) 1 θ }, gdzie 1 < θ < (5.4) Kopuły eliptyczne T-student C ν,ρ (x 1, x 2 ) = t 1 ν (x1) t 1 ν (x2) 1 2π(1 ρ 2 ) 1 2 [1 + u2 2ρuv + v 2 ν(1 ρ 2 ] ν+2 2 du dv, (5.5) ) 24

gdzie ν, ρ - parametry kopuły, t 1 ν stopniami swobody. - funkcja odwrotna do dystrybuanty rozkładu T-Studenta z ν Normalna C ρ (x 1, x 2 ) = Φ 1 (x 1) Φ 1 (x 2) 1 2π(1 ρ 2 ) 1 2 exp{ u2 2ρuv + v 2 2(1 ρ 2 } du dv, (5.6) ) gdzie ρ - parametr kopuły, Φ 1 - funkcja odwrotna do dystrybuanty rozkładu normalnego. Jak wynika ze wzorów dla odpowiednich kopuł z rodziny archimedejskich są ode zależne od parametrów θ. Parametr ten mówi o zależności pomiędzy rozkładami brzegowymi. Jeżeli θ zbiega do dolnego ograniczenia parametru (w zależności od rodzaju kopuły) to mamy niezależne rozkłady brzegowe. Najlepsze dopasowanie tych parametrów dobiera nam program SAS 9.3 przy użyciu procedury proc copula. W przypadku kopuł z rodziny eliptycznych otrzymujemy macierze korelacji. Ponadto program generuje podstawowe kryteria najlepszego dopasowania kopuły do naszych danych. I kolejno otrzymujemy: parametr Log Likelihood (w skrócie LOG) - im większa wartość tym lepsze dopasowanie; parametr Akaike (w skrócie AIC) - im mniejsza wartość tym lepsze dopasowanie. W przypadku niejasności wyboru, tzn. gdy wartości LOG i AIC nie wskazują jednoznacznie na którąś z kopuł bierzemy pod uwagę trzeci parametr. Jest to tzw. kryterium Schwarza (baysowskie), w skrócie SBC - i tak jak w przypadku AIC im mniejsza jego wartość tym lepsze dopasowanie. Poniżej przedstawiamy kopuły wraz z kryteriami dopasowania oraz miarami ryzyka odpowiednimi dla każdej z nich. Kod generujący znajduje się w Dodatku B.5. Kopuła Claytona Tablica 13: Kopuła Claytona Tablica 12: Kopuła Claytona - wykres trójwymiarowy θ 1.170232 kryteria Log Likelihood 13.6296 AIC -25.2592 SBC -23.14833 25

Kopuła Franka Tablica 15: Kopuła Franka Tablica 14: Kopuła Franka - wykres trójwymiarowy θ 4.740441 kryteria Log Likelihood 14.43497 AIC -26.86993 SBC -24.75906 Kopuła Gumbela Tablica 17: Kopuła Gumbela Tablica 16: Kopuła Gumbela - wykres trójwymiarowy θ 1.798871 kryteria Log Likelihood 15.90243 AIC -29.80487 SBC -27.69399 Kopuła Normalna macierz korelacji Tablica 19: Kopuła Normalna [ 1 0.654904605 0.654904605 1 ] Tablica 18: Kopuła Normalna - wykres trójwymiarowy 26

Kopuła T macierz korelacji Tablica 21: Kopuła T [ 1 0.684533727 0.684533727 1 ] Tablica 20: Kopuła T - wykres trójwymiarowy v 100 kryteria Log Likelihood 17.16300 AIC -30.32599 SBC -26.10425 Po zaprezentowaniu wszystkich kopuł wróćmy jeszcze do kopuł eliptycznych. Otrzymaliśmy dwie macierze korelacji. Jedną dla kopuły Normalnej: [ 1 0.654904605 ] 0.654904605 1 drugą dla kopuły T: [ 1 0.684533727 0.684533727 1 ] Zanim zinterpretujemy otrzymane wielkości zdefiniujmy potrzebny w tym celu współczynnik korelacji. Definicja 4.3.2 Współczynnik korelacji [7] Współczynnik korelacji między zmiennymi X i Y określonymi na tej samej przestrzeni probabilistycznej, dla których 0 < V ar(x) < i 0 < V ar(y) <, jest liczbą zdefiniowaną następująco: Corr(X, Y) = ρ XY = Cov(X, Y) V ar(x) V ar(y) (5.7) Jeżeli X, Y są niezależnymi zmiennymi losowymi, to Cov(X, Y) = 0 oraz ρ XY = 0. Jak wynika z Definicji 4.3.2. współczynnik korelacji mówi o zależności między zmiennymi. Im wartość bliższa 1 tym większa zależność (jak wiadomo ρ XY [ 1, 1]). Współczynniki korelacji dla naszych kopuł wynoszą odpowiednio 0.654904605 dla kopuły Normalnej i 0.684533727 dla kopuły T. Obie wielkości są porównywalne. Ponadto dla dużej liczby stopni swobody (w naszym przypadku ν=100) rozkład T-Studenta praktycznie pokrywa się z rozkładem normalnym. Dzięki temu i dzięki podobnym wartościom współczynnika korelacji możemy założyć, że kopuły T i Normalna nie różnią się znacznie. Zatem w dalszej części nie będziemy brać pod uwagę kopuły Normalnej. 27

Tablica 22: Porównanie kopuł kopuła θ Log Likelihood AIC SBC VaR ES Clayton 1.170232 13.6296-25.2592-23.14833 0.120580 0.142799 Gumbel 1.798871 15.90243-29.80487-27.69399 0.144757 0.178801 Frank 4.740441 14.43497-26.86993-24.75906 0.120395 0.149366 T - 17.163-30.32599-26.10425 0.142617 0.174153 Na podstawie Tablicy 22 możemy wybrać najlepiej dopasowaną kopułę do naszych danych. Wyniki są jednoznaczne. Według pierwszego (Log Likelihood) jak i drugiego kryterium (Akaike) najlepiej dopasowaną kopułą okazała się kopuła T. Dodatkowo w tablicy zostały umieszczone wartości miar ryzyka dla portfela dwuskładnikowego złożonego z 1 2 kapitału przeznaczonego na aktywo pierwsze i 1 2 kapitału przeznaczonego w aktywo drugie, dzięki którym wyliczymy rezerwy potrzebne do inwestycji łącznej (uzyskane za pomocą kodu znajdującego się w Dodatku B.6). 4.4 Inwestycja łączna Kwota inwestycji łącznej jest taka sama jak w przypadku inwestycji pojedynczych, czyli 1 mln dolarów. Dywersyfikując portfel przeznaczymy połowę kapitału na inwestycję w pszenicę a połowę na inwestycję w soję, tzn. po 500000 dolarów w każde aktywo. Miary ryzyka dla inwestycji łącznej zostały policzone przy pomocy danych wygenerowanych z najlepiej dopasowanej kopuły T, dzięki którym możemy wyliczyć potrzebne rezerwy. V ar 0.95 (1000000 L 3 ) = 1000000 V ar 0.95 (L 3 ) = 1000000 0.142617 = 142617[USD] ES 0.95 (1000000 L 3 ) = 1000000 ES 0.95 (L 3 ) = 1000000 0.174153 = 174153[USD] Jak łatwo zauważyć wyliczone rezerwy finansowe wg pierwszej miary są mniejsze niż wg miary drugiej, czyli ES. Różnica wynika z faktu, że ES bada 5% najgorszych przypadków inwestycyjnych, a VaR jest miarą dokładniejszą i szacuje rezerwy na podstawie całej próby. Zastanówmy się jeszcze jak zmienią się wysokości potrzebnych rezerw przy innym podziale kapitału. W tym celu posłużymy się dodatnią jednorodnością zarówno wartości zagrożonej jak i zagrożonej wartości oczekiwanej, co możemy zapisać następująco: oraz gdzie: A V ar 0.95 (A L 1 + B L 2 ) = (A + B) V ar 0.95 ( A + B L 1 + B A + B L 2) (5.8) A ES 0.95 (A L 1 + B L 2 ) = (A + B) ES 0.95 ( A + B L 1 + B A + B L 2), (5.9) A + B - całkowity kapitał (1 mln dolarów), A - kwota inwestycji w pszenicę, B - kwota inwestycji w soję. 28

Korzystając z programu SAS 9.3, do którego kod znajduję się w Dodatku B.7. oraz zależności (5.8) i (5.9), przyjrzyjmy się wybranym dywersyfikacjom naszego portfela. Posługując się Tablicami 23 i 24 wybierzemy najbardziej optymalną inwestycję, którą porównamy z wcześniej omówioną, czyli dzielącą kapitał pomiędzy dwoma aktywami po równo. Tablica 23: Wybrane dywersyfikacje portfela 1 4 L 1 + 3 4 L 2 3 4 L 1 + 1 4 L 2 1 5 L 1 + 4 5 L 2 4 5 L 1 + 1 5 L 2 VaR 140414.6 154660.1 143100.5 158258.2 ES 171185.9 190552.9 172291.5 194749.3 Tablica 24: Wybrane dywersyfikacje portfela 2 5 L 1 + 3 5 L 2 3 5 L 1 + 2 5 L 2 1 8 L 1 + 7 8 L 2 7 8 L 1 + 1 8 L 2 VaR 142493 146093 143270.1 162698.6 ES 171626.4 179472.4 174692 201211.8 Analizując powyższe tablice łatwo zauważyć, że najmniej ryzykowną inwestycją jest pierwsza spośród analizowanych, czyli składająca się z 1 4 kapitału przeznaczonego w akcje pszenicy i 3 4 kapitału w akcje soi. Rezerwy te wynoszą kolejno 140414.6 USD wg VaR i 171185.9 USD wg ES. Wybierzmy zatem najkorzystniejszą inwestycję łączną. Weźmiemy pod uwagę dwie z nich: 1 2 L 1 + 1 2 L 2 rezerwy wg VaR: 142617[USD] rezerwy wg ES: 174153[USD] 1 4 L 1 + 3 4 L 2 rezerwy wg VaR: 140414.6[USD] rezerwy wg ES: 171185.9[USD] Jak nie trudno zauważyć mniejsze wartości w przypadku obydwu miar otrzymaliśmy dla inwestycji drugiej, czyli 1 4 kapitału przeznaczonego na pszenicę i 3 4 na soję. I tę oto inwestycję uznajemy za najmniej ryzykowną spośród inwestycji łącznych, gdyż wielkości rezerw bez wątpienia wskazują właśnie na nią. 4.5 Porównanie inwestycji Podsumujmy wszystkie przeanalizowane w pracy inwestycje. Jak już wcześniej ustaliliśmy bardziej ryzykowną inwestycją pojedynczą okazały się akcje pszenicy, i co do tego nie mamy żadnych wątpliwości, gdyż obie miary ryzyka oszacowały większe niezbędne zabezpieczenia finansowe. Na tej podstawie za mniej ryzykowną inwestycję uznajemy akcje soi i to właśnie tę inwestycję będziemy porównywać z inwestycją złożoną. Następnie analizowaliśmy różne inwestycje łączne spośród których najkorzystniejszą okazała się inwestycja składająca się z 1 4 kapitału przeznaczonego na akcje pszenicy i 3 4 kapitału przeznaczonego na akcje soi. W Tablicy 25 umieściliśmy wyliczone rezerwy dla tych portfeli. 29

Tablica 25: Rezerwy jakie należy przeznaczyć na poszczególne inwestycje Soja[USD] Łączna[USD] VaR 122633.6 140414.6 ES 154753.7 171185.9 Porównując te dwie wybrane inwestycje łatwo zauważyć, że większe wartości otrzymaliśmy w przypadku inwestycji łącznej. Stąd też najmniej ryzykowną inwestycją okazała się inwestycja w kwocie 1 mln dolarów na okres jednego miesiąca w akcje soi. Rezerwy te wynoszą odpowiednio wg Value-at-Risk 123 tysiące dolarów, czyli około 12% wartości zainwestowanego kapitału, zaś wg Expected Shortfall około 155 tysięcy dolarów, co stanowi niecałe 15,5% wartości całkowitego kapitału. 30

5 Podsumowanie W pracy przeanalizowano inwestycje jedno i dwuskładnikowe (dzielące kapitał w wysokości 1 mln dolarów w różnych proporcjach) w akcje pszenicy oraz soi szacując niezbędne rezerwy, by inwestycje te nie przyniosły strat. W tym celu posłużono się dwiema miarami ryzyka, Value at Risk oraz Expected Shortfall. Na ich podstawie stwierdzono, że w przypadku inwestycji jednoskładnikowych mniej ryzykowną inwestycją okazała się inwestycja w soję, gdyż wymagała znacznie mniejszych zabezpieczeń finansowych niż pszenica. Ponadto wykonano testy Shapiro-Wilka, Kołmogorowa Smirnowa oraz Mardia test sprawdzające normalność rozkładów stóp strat dla wspomnianych aktywów. Poprzedzając analizę inwestycji łącznej wprowadzono teorię dotyczącą dwuwymiarowego rozkładu normalnego oraz sprawdzono dopasowanie danych do rozkładów innych znanych funkcji, funkcji kopuł z rodziny archimedejskich i eliptycznych. Korzystając z dwóch parametrów, Log Likelihood i Akaike wybrano najlepiej dopasowaną kopułę, którą okazała się kopuła zbliżona do normalnej, czyli kopuła T. Mając wybraną kopułę wyliczono wartości omówionych wcześniej miar ryzyka i na ich podstawie oszacowano wysokości rezerw dla inwestycji łącznych dywersyfikując portfel w różnych proporcjach. Najmniej ryzykowną inwestycją dwuskładnikową okazała się inwestycja składająca się z 1 4 kapitału przeznaczonego na akcje pszenicy i 3 4 kapitału przeznaczonego na akcje soi. Biorąc pod uwagę wszystkie omówione w pracy portfele stwierdzono, że najmniej ryzykowną inwestycją okazała się inwestycja w soję. Oszacowane wielkości zabezpieczeń wynosiły kolejno wg VaR 123 tysiące dolarów, a wg ES około 155 tysięcy. 31