1 Wstęp (Edyta Koziara, Iwona Lorenz) Przedstawienie aktywów... 5

Wielkość: px
Rozpocząć pokaz od strony:

Download "1 Wstęp (Edyta Koziara, Iwona Lorenz) 4 1.1 Przedstawienie aktywów... 5"

Transkrypt

1 Spis treści 1 Wstęp (Edyta Koziara, Iwona Lorenz) Przedstawienie aktywów Analiza danych (Iwona Lorenz) Charakterystyki liczbowe Testy normalności Miary ryzyka Koherentne miary ryzyka (Edyta Koziara) Value-at-Risk (Edyta Koziara) Expected Shortfall (Iwona Lorenz) Modelowanie rozkładów dwuwymiarowych Test Mardia (Edyta Koziara) Estymacja gęstości (Edyta Koziara) Kopuły (Iwona Lorenz) Podstawowy podział kopuł Inwestycja łączna (Edyta Koziara) Porównanie inwestycji (Iwona Lorenz) Podsumowanie (Edyta Koziara, Iwona Lorenz) 31 Załączniki 32 Dodatek A Dodatek B Dodatek C Wykaz literatury 46 3

2 1 Wstęp Praca przedstawia ocenę ryzyka straty inwestycji w akcje dwóch wybranych aktywów. Przeanalizowane zostały różne portfele inwestycyjne (jednoskładnikowe oraz złożone) w łącznej kwocie 1 mln dolarów na okres jednego miesiąca. Do oszacowania potrzebnych zabezpieczeń finansowych posłużono się wybranymi miarami ryzyka, Value at Risk oraz Expected Shortfall. Praca złożona jest z 5 rozdziałów. Pierwszy rozdział zawiera wstęp oraz podstawowe wiadomości dotyczące aktywów: pszenicy oraz soi. Ponadto w tym rozdziale przedstawione zostały historyczne notowania na otwarcie i zamknięcie miesiąca z ostatnich 5 lat, razem 61 obserwacji. W rozdziale drugim napisanym przez Iwonę Lorenz znajdują się dane, wartości stóp strat wyliczone na podstawie wszystkich obserwacji. Przedstawiona została także statystyczna analiza danych oraz test na normalność rozkładu stóp strat. W trzecim rozdziale, wprowadzona została teoria miar ryzyka. W podrozdziale 3.1 oraz 3.2 napisanym przez Edytę Koziarę wyróżniono koherentność miary oraz opis i interpretację wartości zagrożonej ryzykiem. Kolejny podrozdział zawierający omówienie i interpretację uśrednionej wartości zagrożonej napisała Iwona Lorenz. Rozdział czwarty zawiera badanie dwuwymiarowego rozkładu, niezbędnego przy analizie dwuskładnikowego portfela inwestycyjnego. Pierwsze dwa podrozdziały napisane przez Edytę Koziarę przedstawiają test Mardia oraz estymację gęstości. W kolejnym podrozdziale napisanym przez Iwonę Lorenz umieszczona została koncepcja funkcji kopuły oraz równania i wykresy wybranych kopuł archimedejskich i eliptycznych. Na podstawie wyestymowanych danych otrzymano parametry kopuł, decydujące o najlepiej dopasowanej funkcji do danych. Podrozdział omawiający dywersyfikacje portfela łącznego napisała Edyta Koziara. Podsumowanie rozdziału zawierające porównanie inwestycji jednoskładnikowej z dwuskładnikową, napisała Iwona Lorenz. Do oszacowania ryzyka inwestycji złożonej posłużono się wybraną wcześniej kopułą. Jest to najważniejsza część pracy, w której podsumowano i porównano różne portfele, dla których przeanalizowano wysokości rezerw koniecznych do zabezpieczenia inwestycji. Na końcu pracy umieszczono Załączniki. W Dodatku A przedstawione są dodatkowe definicje, wzory oraz przeprowadzone dowody. W Dodatku B zawarty jest kod do programu SAS 9.3, dzięki któremu wygenerowano wykresy oraz wartości użyte w pracy. W ostatnim Dodatku C załączono tablicę kwantyli rozkładu normalnego. Abstract This thesis evaluated the risk of loss of investment in the shares of the two selected assets. Different investment portfolios (one-and complex) were analyzed for a period of one month. I took the total amount 1 million U.S. dollars. To estimate the necessary financial security was used to selected risk measures, Value at Risk and Expected Shortfall. The BA thesis consists of five chapters. The first chapter contains an introduction and basic information concerning the assets of wheat and soybeans. In addition, this chapter presents the historical stock quotes for for the opening and closing of the month in the last five years. It included 61 observations. The second section contains data, the feet losses calculated on the based on all observations. Also presents the a statistical analysis of the data and test for normality of distribution losses feet. Iwona Lorenz did it. 4

3 In the third chapter, was introduced the theory of risk measures. In subsection 3.1 and 3.2 written by Edyta Koziara, distinguished coherence in the measurement and description and interpretation of value at risk. The next section contains a discussion and interpretation of averaged value at risk. That wrote Iwona Lorenz. The fourth chapter presents the study of two-dimensional distribution, which is necessary in the analysis of two-component of the investment portfolio. The first two sections written by Edyta Koziara present Mardia test and density estimation. In the next section written by Iwona Lorenz was placed in the dome of the concept of functions and equations and graphs of selected archimedes and elliptical domes.based on assessment data, the parameters of the domes, determining the bestfit function to the data. Subsection discusses the joint portfolio diversification wrote Edyta Koziara. Summary of Chapter containing a comparison of investment mono-component. Iwona Lorenz wrote it. To estimate the risk of the investment complex was used previously selected dome. This is the most important part of the thesis, which summarizes and compares the different portfolios, which were analyzed for the amount of reserves necessary to protect your investment. On the end placed Attachments. Appendix A shows the additional definitions, formulas, and carried out the evidence. In Appendix B is contained code to the SAS 9.3 by which the generated charts and the values used in the work. In the last Appendix C attached array quantile of the normal distribution. 1.1 Przedstawienie aktywów Każda inwestycja powiązana jest ściśle z ryzykiem, bez względu na to czy dotyczy ona działalności gospodarczej, zakupu towaru, czy inwestycji na rynku finansowym. Samo pojęcie ryzyka oznacza zagrożenie osiągnięcia określonych planów, spotykane przy podejmowaniu codziennych decyzji. Szacujemy wówczas prawdopodobieństwo zdarzeń za pomocą rozsądku, doświadczenia czy też rachunku prawdopodobieństwa. W naszej pracy przedstawimy ryzyko inwestycji, będące mierzalną niepewnością. Wyliczone rezerwy określone na podstawie miar ryzyka wykorzystamy do oszacowanie potrzebnych zabezpieczeń przed stratną inwestycją. Analizując wspomniane ryzyko skupimy się na dwóch zbożach pszenicy oraz soi. Są to najpowszechniejsze rośliny odpowiednio wśród zbóż i roślin oleistych. Zboża te są istotnymi składnikami paszy i stanowią wartościową część pożywienia dla człowieka. Soja to roślina jednoroczna należąca do rodziny bobowatych. Pochodzi z południowowschodniej Azji. Jest jedną z najbardziej popularnych roślin oleistych w handlu. Stanowi cenny pokarm dla człowieka i jest ważnym surowcem do produkcji pasz (jej nasiona zawierają 25% tłuszczu i 50% białka). Na bazie jej nasion wytwarza się m.in. olej, mączkę, kaszę oraz mleko sojowe. Preparaty z soi podnoszą wartości odżywcze pokarmów, dodawane są do przetworów, m.in. konserw mięsnych, wędlin. Wyhodowanie dużej liczby odmian soi umożliwiło jej uprawę we wszystkich klimatach. Obecnie największe uprawy znajdują się na obszarach o klimacie umiarkowanym ciepłym. Prawie 1/3 światowej produkcji soi podlega eksportowi. Do największych eksporterów należą: Brazylia, Stany Zjednoczone, kraje Ameryki Południowej, Paragwaj, Kanada i Ukraina, a do największych importerów: Chiny, kraje Europy, Japonia oraz Australia. Na wartości notowań soi na giełdzie znaczący wpływ mają etapy rozwoju rośliny. 5

4 Pszenica jest jednym z najstarszych zbóż. Uprawia się ją od co najmniej 6 tysięcy lat. Pochodzi z południowo-zachodniej i środkowej Azji. Uprawiana jest przede wszystkim w strefach klimatu umiarkowanego i podzwrotnikowego (wymaga okresu wegetacyjnego powyżej 100 dni). Na świecie zajmuje pierwsze miejsce w strukturze zasiewów z powierzchnią 220 mln hektarów. Tak jak i soja, stanowi cenny pokarm dla człowieka. Z pszenicy produkuje się najlepsze gatunki mąk, które służą do wyrobu chleba, makaronów oraz produktów cukierniczych. Spożycie globalne wynosi około 70 kg na osobę rocznie. Na świecie zbiera się około 690 mln ton ziaren pszenicy rocznie, co daje jej trzecie miejsce po ryżu i kukurydzy. Średnio 20% światowej produkcji jest przedmiotem międzynarodowego handlu. Do czołowych producentów tego zboża zaliczamy: Chiny, Indie, Rosję, Francję, Australię i Kanadę, do czołowych eksporterów: Stany Zjednoczone, Kanadę, Francję, Australię i Argentynę, natomiast do czołowych importerów: Rosję, Chiny, Japonię, Egipt, Brazylię i Włochy. Dlaczego akurat surowce rolne? Bardzo dobrą odpowiedź na to pytanie udzielił Biznes.pl 1 : Obrót surowcami rolnymi skupia uwagę inwestorów na całym świecie. Jedną z przyczyn tego zainteresowania jest stosunkowo niska korelacja rynku z rynkiem obrotu akcjami. Dodatkowo rynek surowców rolnych charakteryzuje bardzo duża zmienność ceny poszczególnych towarów rządzą się własnymi prawami, podlegając jednocześnie wypadkowym specyficznym dla tego sektora. Nie są tu rzadkością na przykład kilkuprocentowe wzrosty cen w skali dnia, które poprzedzone znacznymi spadkami w okresie miesiąca, generują kilkunastoprocentowe zyski w ujęciu kwartalnym czy półrocznym. Niekwestionowanym argumentem przemawiającym na korzyść surowców rolnych są rosnące potrzeby konsumpcyjne przy jednocześnie trudnej do zwiększenia w wielu przypadkach podaży, która mimo rosnącej efektywności produkcji, ograniczana jest wieloma czynnikami o charakterze lokalnym i globalnym. Na wskaźniki popytu wyraźnie oddziaływują obecnie państwa wschodzące, które przeobrażając się generują znaczne zapotrzebowanie w zakresie artykułów żywnościowych czy pasz. Z drugiej strony podaż ograniczana jest w wyniku kurczenia się areału upraw, rekalibrowania produkcji czy wreszcie np. na skutek decyzji politycznych, jak wstrzymanie eksportu. Ogromny wpływ posiada tu także niemożliwa do przewidzenia zmienna, czyli pogoda. Powodzie, susze, stopniowa zmiana klimatu czy gwałtowne zjawiska pogodowe w oczywisty sposób wpływają na lokalne i światowe poziomy cen surowców rolnych. 1 Czy rynek surowców rolnych to efektywna alternatywa?, artykuł internetowy [1] 6

5 Poniżej zaprezentujemy wykresy notowań opisanych surowców z ostatnich 5 lat. Rysunek 1: Wykres notowań soi z lat Rysunek 2: Wykres notowań pszenicy z lat Na pierwszy rzut oka widać, że ceny obydwu surowców rosną i maleją w tych samych okresach. Wynika to ze wspomnianej wcześniej zmienności pogody i decyzji politycznych. Dokładniej będzie można to zauważyć na wykresie łącznym. Kolorem niebieskim oznaczone są notowania dla soi a kolorem różowym dla pszenicy. Rysunek 3: Łączny wykres notowań soi (niebieski) i pszenicy (różowy) z lat

6 Rysunek 3 pokazuje, iż notowania soi jak i pszenicy w tych samych momentach spadają a za chwilę gwałtownie rosną. Mimo to trudno jest przewidzieć ceny tych surowców w najbliższym czasie. Niełatwo zatem na podstawie takich danych stwierdzić, która inwestycja (w soję czy pszenicę) jest mniej ryzykowna. W tym celu wylicza się historyczne stopy strat, które mówią o wielkości poniesionych strat na przestrzeni kolejnych miesięcy. 8

7 2 Analiza danych Dane jakie analizujemy to ceny poszczególnych zbóż (cent/buszel) z okresu roku pozyskane z oficjalnej strony internetowej stooq.com. Bierzemy pod uwagę wartości notowań na otwarciu i na zamknięciu w poszczególnych miesiącach. Stopy strat wyliczamy na podstawie wzoru: gdzie: W o -wartość notowania początkowego, W z -wartość notowania końcowego. L = W o W z W o (2.1) Wszystkie dane zostały zaprezentowane w Tablicy 1 i 2. Tablica 1: Notowania na giełdzie Data Pszenica Soja Rok Miesiąc Otwarcie Zamknięcie Stopy strat Otwarcie Zamknięcie Stopy strat 2014 styczeń grudzień listopad październik wrzesień sierpień lipiec czerwiec maj kwiecień marzec luty styczeń grudzień listopad październik wrzesień sierpień lipiec czerwiec maj kwiecień marzec luty styczeń

8 Tablica 2: Notowania na giełdzie Data Pszenica Soja Rok Miesiąc Otwarcie Zamknięcie Stopy strat Otwarcie Zamknięcie Stopy strat grudzień listopad październik wrzesień sierpień lipiec czerwiec maj kwiecień marzec luty styczeń grudzień listopad październik wrzesień sierpień lipiec czerwiec maj kwiecień marzec luty styczeń grudzień listopad październik wrzesień sierpień lipiec czerwiec maj kwiecień marzec luty styczeń W związku, ze wzorem (2.1) ujemne stopy strat są zyskami, zaś dodatnie - stratami. W przypadku obu surowców kolorem czerwonym zostały oznaczone 3 największe straty a kolorem niebieskim największe zyski. 10

9 2.1 Charakterystyki liczbowe Oceniając ryzyko inwestycji warto przeprowadzić analizę zebranych danych. Zaczniemy od wyznaczenia charakterystyk liczbowych wyznaczonych na podstawie danych statystycznych oraz od przeanalizowania rozkładu. Poniżej przedstawiamy podstawowe definicje opracowane na podstawie pozycji [6] umieszczonej w Wykazie literatury. Punktem wyjścia badania statystycznego cechy X jest wylosowanie z całej populacji pewnej skończonej liczby n elementów. Uzyskane w ten sposób wartości x 1, x 2,..., x n są zaobserwowanymi wartościami n-elementowej próby o rozkładzie X. Do najważniejszych form wnioskowania statystycznego należą: estymacja (ocena) nieznanych parametrów bądź ich funkcji. Parametry te charakteryzują rozkład badanej cechy populacji, weryfikacja (badanie prawdziwości) postawionych hipotez statystycznych. Wnioskowanie statystyczne dostarcza jedynie wniosków wiarygodnych - a nie absolutnie prawdziwych. Dowolne dwie n-elementowe próbki z tej samej populacji są na ogół różne. Wygodnie jest traktować ciąg x 1, x 2,..., x n jako realizację ciągu X 1, X 2,..., X n, gdzie X i, i=1,2,...,n jest ciągiem niezależnych zmiennych losowych. Ciąg tych zmiennych losowych X 1, X 2,..., X n będziemy nazywali n-elementową próbą losową. Ciąg liczb x 1, x 2,..., x n będziemy nazywali zaobserwowaną próbą losową, bądź po prostu próbką. [6] Definicja Estymator wartości oczekiwanej [6] Estymatorem wartości oczekiwanej µ = E(X), inaczej średnią z próby x 1,...x n nazywamy liczbę x określoną wzorem: Definicja Estymator mediany ˆµ = x = 1 n n x i. Miedianą nazywamy kwantyl rzędu 1 2, co oznaczamy q 0.5(F ). Zachodzi równość: gdzie m e jest medianą próbki. Uzupełnienie znajduje się w Dodatku A.1. i A.2. i=1 ˆq 0.5 (F ) = m e, Definicja Estymator odchylenia standardowego i wariancji Estymatory miar rozproszenia wyrażają się wzorami: a) wariancja: ˆσ 2 = 1 n 1 n (x i x) 2, i=1 b) odchylenie standardowe: ˆσ = ˆσ 2 = 1 n 1 n (x i x) 2. i=1 Odchylenie standardowe mówi, jak rozlegle rozrzucone są wartości wokół średniej. 11

10 Definicja Estymator skośności Estymator skośności wyraża się wzorem: gdzie: Â = M3 σ 3 = M 3 -trzeci moment centralny [Dodatek A.6], σ-odchylenie standardowe. 1 n n (x i x) 3 i=1 σ, 3 Ujemna wartość skośności wskazuje na lewostronną asymetrię (wydłużone lewe ramię rozkładu), dodatnia na prawostronną (wydłużone prawe ramię rozkładu), natomiast skośność równa zeru oznacza rozkład symetryczny. Definicja Estymator kurtozy Estymator kurtozy wyraża się wzorem: gdzie: M 4 -czwarty moment centralny, σ-odchylenie standardowe. ˆK = M4 σ 4 3 = 1 n n i=1 (x i x) 4 σ 4 3, Im większa kurtoza, tym bardziej dane skupiają się wokół średniej. Jeśli jej wartość jest ujemna to dane są bardziej skoncentrowane niż przy rozkładzie normalnym, a jeśli dodatnia to odwrotnie. Gdy kurtoza wynosi zero, spłaszczenie rozkładu jest podobne do spłaszczenia rozkładu normalnego. Po zdefiniowaniu charakterystyk liczbowych przejdźmy do omówienia poszczególnych wartości dla stóp strat pszenicy i soi uzyskanych w wyniku działania programu SAS 9.3. Tablica 3: Wyestymowane charakterystyki liczbowe dla pszenicy Momenty N 61 Suma wag 61 Średnia Mediana 0.01 Odchylenie std Wariancja Skośność Kurtoza Tablica 3 prezentuje wyestymowane wartości dla pszenicy. Średnia arytmetyczna jest ujemna, co wskazuje, że średnio z inwestycji w to zboże osiągamy nieznaczne zyski. Odchylenie standardowe jest bliskie zeru, zatem dane nie odstają daleko od średniej. Mediana ma również wartość nieznacznie różną od zera, co oznacza, że zysków i strat jest mniej więcej po równo. Ujemna skośność świadczy o lewostronnej asymetrii (czyli dłuższym lewym ogonie). Dodatnia kurtoza mówi o większej smukłości rozkładu danych próbki pszenicy niż w przypadku rozkładu normalnego. 12

11 Tablica 4: Wyestymowane charakterystyki liczbowe dla soi Momenty N 61 Suma wag 61 Średnia Mediana Odchylenie std Wariancja Skośność Kurtoza Tablica 4 prezentuje oszacowane wartości dla soi. Średnia arytmetyczna również jest ujemna, co wskazuje, że średnio z inwestycji osiągamy zyski. Odchylenie standardowe jest bliskie zeru, zatem dane nie odstają daleko od średniej. Mediana ma wartość nieznacznie różną od zera, co oznacza, że zysków i strat jest mniej więcej po równo, tak jak i w przypadku pszenicy. Dodatnia skośność świadczy o dłuższym prawym ogonie. Bliska zeru kurtoza sugeruje zbliżenie danych do rozkładu normalnego. Histogramy (najbardziej popularne wykresy statystyczne) potwierdzają liczbowe wartości statystyk. Rysunek 4: Histogramy dla zmiennej L1 (pszenica) i zmiennej L2 (soja) Jak łatwo zauważyć na Rysynku 4 histogramy dla obu aktywów wyglądają inaczej. W przypadku zmiennej L1 wartość skośności była ujemna, zatem widoczna jest asymetria lewostronna, natomiast w przypadku zmiennej L2 skośność była dodatnia i zauważamy wydłużenie prawego ogona rozkładu. Ewidentna różnica jest również w smukłości rozkładów. Tak jak wskazywały wartości kurtozy dla próbki soi (zmienna L2) dane są rozłożone a wykres przypomina rozkład normalny. Dane dotyczące pszenicy (zmienna L1) są bardziej skoncentrowane, dzięki czemu wykres jest bardziej spiczasty. Należy jednak pamiętać, iż histogramy jedynie potwierdzają zmienność i kształt analizowanych danych. Zawsze należy wykonać testy statystyczne, a nie tylko sugerować się wyglądem wykresu. 2.2 Testy normalności Mając już pewne wyobrażenie na temat naszych danych po przeanalizowaniu charakterystyk liczbowych przystąpimy do analizy rozkładu. W tym celu skorzystamy z testów normalności. Testy te sprawdzają, czy rozkład danych różni się od założonego rozkładu teoretycznego, gdy znana jest tylko pewna skończona liczba obserwacji. Naszym założonym rozkładem teoretycznym będzie 13

12 rozkład normalny. Badając normalność stawiamy hipotezę zerową o dopasowaniu danych do rozkładu normalnego, wobec hipotezy alternatywnej, że dane takiego rozkładu nie mają. Formalny zapis hipotez: H 0 - dane pochodzą z rozkładu normalnego, H A - dane nie pochodzą z rozkładu normalnego. Przyjmujemy poziom istotność α = 0, 05. Jest to maksymalne ryzyko błędu, jakie możemy dopuścić. Wykonując test porównujemy poziom istotności α z wyliczoną wartością p zgodnie z regułami decyzyjnymi. Jeśli wartość p jest większa od poziomu istotności α to nie mamy podstaw do odrzucenia H 0, w przeciwnym przypadku odrzucamy H 0 na korzyść H A. Formalna definicja rozkładu normalnego umieszczona jest w Dodatku A.7. Korzystając z programu SAS 9.3 przeprowadzimy dwa testy: test Shapiro-Wilka oraz Kołmogorowa-Smirnowa. Bezsporną zaletą użytych testów jest możliwość korzystania z nich w przypadku analizy rozkładów niedużych prób. Ponadto test Shapiro-Wilka jest jednym z najbardziej preferowanych testów na normalność rozkładu ze względu na moc w porównaniu z innymi dostępnymi testami. Tablica 5: Testy normalności dla pszenicy Test Statystyka Wartość p Shapiro-Wilka W Pr.<W Kołmogorowa-Smirnowa D Pr.>D Jak wskazuje Tablica 5 wartość p dla dwóch testów jest mniejsza niż zadany poziom istotności α. Jak wcześniej było powiedziane, w takim przypadku odrzucamy hipotezę o normalności rozkładu danych pszenicy i przyjmujemy hipotezę alternatywną. Tablica 6: Testy normalności dla soi Test Statystyka Wartość p Shapiro-Wilka W Pr.<W Kołmogorowa-Smirnowa D Pr.>D > W przypadku próbki soi wartość p jest większa niż poziom istotniści α, co potwierdza Tablica 6. Biorąc pod uwagę otrzymane wyniki nie mamy podstaw do odrzucenia hipotezy zerowej. W związku z tym przyjmujemy, że dane mają rozkład normalny. Kod z programu SAS 9.3, użyty do wyznaczenia statystyk i wykonania testów, znajduje się w Dodatku B.1. 14

13 3 Miary ryzyka Oceniając ryzyko inwestycji należy oszacować rezerwy, jakie trzeba zgromadzić by inwestycja nie przyniosła straty (w najgorszym przypadku). Funkcje obliczające wysokości tych rezerw nazywane są miarami ryzyka, w szczególności koherentnymi miarami ryzyka. Rozdział ten został opracowany głownie na podstawie pozycji [2]. 3.1 Koherentne miary ryzyka Aby określić czym jest koherentna miara ryzyka zaczniemy od zdefiniowania miary ryzyka. Ustalmy pewną przestrzeń probabilistyczną (Ω,F,P) a oznaczmy przedział czasowy inwestycji. Poprzez L 0 (Ω,F,P) oznaczmy zbiór wszystkich zmiennych losowych określonych na (Ω,F ). Elementy zbioru zmiennych losowych stożka wypukłego M [Dodatek A.8.] należącego do L 0 (Ω,F,P) będziemy rozumieli jako stopy strat inwestycji w przedziale czasowym. Wówczas miarę ryzyka definiujemy nastepująco: Definicja Miara ryzyka [5] Miarą ryzyka nazywamy pewną funkcję rzeczywistą działającą ze zbioru zmiennych losowych określonych na stożku wypukłym na zbiór liczb rzeczywistych ρ : M R. Mając formalną Definicję przejdźmy do interpretacji. Miarę ryzyka ρ(l) rozumiemy jako wielkość rezerw dołożonych do inwestycji. W przypadku ujemnej bądź zerowej wartości (ρ(l) 0) możemy stwierdzić, że nie trzeba tworzyć dodatkowych rezerw, gdyż ujemna stopa strat to zysk. W sytuacji odwrotnej (ρ(l)>0) należy przygotować odpowiednią ilość rezerw finansowych. Po wyjaśnieniu czym jest miara ryzyka przejdziemy do omówienia koherentności miar. Definicja Koherentne miary ryzyka [2] Funkcję ρ : M R nazywamy koherentną miarą ryzyka, jeśli: 1. jest niezmiennicza na translacje, czyli dla dowolnego l R oraz L M ρ(l + L) = l + ρ(l) (3.1) Jeżeli mamy inwestycję na kwotę L i l jest kwotą, którą jesteśmy dłużni to rezerwy ρ(l) naszej inwestycji musimy powiększyć o kwotę l. 2. jest subaddytywna ρ(l 1 + L 2 ) ρ(l 1 ) + ρ(l 2 ) (3.2) Subaddytywność oznacza, że jeśli mamy dwie inwestycje A i B (o stratach odpowiednio L 1 i L 2 ) to ryzyko poniesienia straty dla portfela złożonego z tych inwestycji (A+B) jest mniejsze lub równe niż suma ich indywidualnych ryzyk. 3. jest dodatnio jednorodna, czyli jeśli λ > 0 ρ(λl) = λρ(l) (3.3) 15

14 Jeżeli ryzyko wzrasta λ-krotnie to rezerwy też muszą być λ-krotnie większe. 4. jest monotoniczna, jeśli L 1 L 2 prawie wszędzie to ρ(l 1 ) ρ(l 2 ). (3.4) Jeżeli strata L 1 dla inwestycji A jest mniejsza niż strata L 2 dla inwestycji B, wówczas ryzyko poniesienia straty z inwestycji A jest mniejsze niż z inwestycji B. Lemat 1. Równoważność warunków miary ryzyka Jeśli miara ryzyka ρ spełnia warunki o subaddytywności i dodatniej jednorodności to warunek monotoniczności jest równoważny z: L M L 0 ρ(l) 0. Dowód powyższego lematu znajduję się w Dodatku A Value-at-Risk Jedną z najpopularniejszych miar ryzyka jest miara nazywana wartością zagrożona, w skrócie V ar α (ang. Value-at-Risk). Estymuje ona maksymalną kwotę, jaką można stracić inwestując w przedziale czasowym przy ustalonym poziomie ufności α. Definicja Value-at-Risk [2] Niech X zmienna losowa. Wówczas wartością zagrożoną (kwantylem) X nazywamy: V ar α (X) = q α (X) = inf{x : F X (x) α} (3.5) gdzie F X oznacza dystrybuantę. Mniej formalnie mówiąc jest to pierwszy moment przecięcia poziomu α na wykresie dystrybuanty. W ujęciu probabilistycznym, V ar α interpretuje się jako kwantyl rzędu α. Poziom ufności α ustala się dowolnie, jednak najczęściej przyjmuje się α=0.95. Co oznacza, że isnieje 95% szansy, iż strata będzie mniejsza niż oszacowana wartość tej miary. Przedział czasowy również ustalamy dowolnie. Wartość zagrożona nie jest koherentną miarą ryzyka, nie spełnia warunku subaddytywności. Dowód znajduje się w Dodatku A.12. Z uwagi na to, że indeksy pszenicy nie formują rozkładu normalnego skorzystamy z programu SAS 9.3, aby wyznaczyć kwantyl nieznanego nam rozkładu [Dodatek B.1.]. Przyjrzyjmy się wartościom otrzymanym dla naszych danych. Tablica 7: Wyestymowana wartość zagrożona Value-at-Risk pszenica soja Na podstawie Tablicy 7 możemy stwierdzić, że możliwa strata inwestycji w soję jest mniejsza niż strata przy inwestycji w pszenicę, gdyż mniejsza wartość Value-at-Risk świadczy o mniejszym ryzyku. Oszacujmy więc potrzebne rezerwy przy inwestycji 1 mln dolarów w każde aktywo, przy pomocy wzoru (3.3): 16

15 Dla pszenicy V ar 0.95 ( L 1 ) = V ar 0.95 (L 1 ) = = [USD] Dla soi V ar 0.95 ( L 2 ) = V ar 0.95 (L 2 ) = = [USD] Zastanówmy się czy można zredukować to ryzyko, estymując dane znanym rozkładem normalnym. Przyjmijmy za parametry rozkładu wcześniej oszacowane wartości średniej oraz odchylenia standardowego, umieszczone w Tablicy 3 i 4. Zatem załóżmy, że: stopy strat dla pszenicy mają rozkład normalny: N( ; ), stopy strat dla soi mają rozkład normalny: N( ; ). Na podstawie wzoru umieszczonego w Dodatku A.10. wyznaczymy wartości kwantyli poszczególnych aktywów przyjmując wartość kwantyla standardowego rozkładu normalnego rzędu 0.95 równą [Dodatek C.1.] : Dla pszenicy: V ar α = ( ) = Dla soi: V ar α = ( ) = Wyliczmy rezerwy pamiętając, że inwestujemy 1 mln dolarów : Dla pszenicy V ar 0.95 ( L 1 ) = V ar 0.95 (L 1 ) = = [USD] Dla soi V ar 0.95 ( L 2 ) = V ar 0.95 (L 2 ) = = [USD] Porównując powyższe wyniki z wcześniej wyznaczonymi [Tablica 7] stwierdzamy, że program SAS 9.3 generuje mniejsze wartości Value-at-Risk nieznanego nam rozkładu dla stóp strat pszenicy, natomiast dla soi większe. Warto też zauważyć, że w przypadku soi liczby te, wyliczone dwoma sposobami, niewiele się różnią. Stąd też potwierdzenie zbliżenia rozkładu stóp strat soi do rozkładu normalnego. 3.3 Expected Shortfall Kolejną miarą ryzyka jaką omówimy jest tzw. zagrożona wartość oczekiwana lub uśredniona wartość zagrożona, w skrocie ES α (ang. Expected Shortfall). Jej wartość jest większa niż wartość V ar α, gdyż określa ile średnio stracimy jeśli strata przekroczy poziom α. Miara ta oddaje własności ogonów rozkładu. Estymuje średnią stratę dla przypadków znajdujących się w (1-α) ogonie procentowym rozkładu. 17

16 Definicja Expected Shortfall [2] Niech X zmienna losowa, taka że E X <. Wówczas uśrednioną wartością zagrożoną (ang. Expected shortfall) nazywamy: gdzie F X oznacza dystrybuantę. ES α (X) = 1 1 V ar u (X)du, (3.6) 1 α α Jak wynika wprost z Definicji Expected Shortfall jest miarą powiązaną z wartością zagrożoną, zachodzi nierówność: ES α (X) V ar α (X) Zagrożona wartość oczekiwana jest koherentną miarą ryzyka. Dowód umieszczony jest w Dodatku A.13. Po teoretycznym wprowadzeniu przejdźmy do wyliczenia wartości Expected Shortfall dla naszych danych, w tym celu posłużymy się następującym lematem: Lemat 2. [5] Niech L 1, L 2,... będzie ciągiem niezależnych zmiennych losowych o tym samym rozkładzie F L. Wówczas lim n n(1 α) i=1 L i,n n(1 α) = ES α(l) p.w., (3.7) gdzie L 1,n L 2,n... L n,n są statystykami pozycyjnymi L 1, L 2,..., L n. Jak wynika z Lematu 2. będziemy sumować n(1 α) największych strat. Obliczmy: n(1 α) = 61 (1 0.95) = 3. Wspomniane 3 największe straty zostały oznaczone w Tablicy 1 i 2 kolorem czerwonym. Wartości Expected Shortfall dla naszych danych zostały wyliczone za pomocą programu SAS 9.3. Kod został umieszczony w Dodatku B.2. Tablica 8: Wyestymowana uśredniona wartość zagrożona Expected Shortfall pszenica soja Z Tablicy 8 wynika, że tak jak i w przypadku wartości zagrożonej, wartość dla pszenicy jest większa. Sprawdźmy zatem wysokości rezerw jakie musimy zgromadzić by inwestycja nie przyniosła nam straty. Jak już wcześniej było powiedziane będziemy inwestować kwotę w wysokości 1 mln dolarów w każde aktywo. Wykorzystując dodatnią jednorodność uśrednionej wartości zagrożonej: ES α ( L) = ES α (L) dla danych zapiszmy: 18

17 Dla pszenicy ES 0.95 ( L 1 ) = ES 0.95 (L 1 ) = = [USD] Dla soi ES 0.95 ( L 2 ) = ES 0.95 (L 2 ) = = [USD] Istnieje jeszcze jeden sposób obliczenia uśrednionej wartości zagrożonej. W tym celu skorzystamy z twierdzenia. Twierdzenie 1. Expected Shortfall dla rozkładu normalnego [5] W przypadku, gdy α (0,1) oraz dystrybuanta straty F L ma rozkład normalny o średniej µ oraz o wariancji σ 2, czyli F L N(µ,σ 2 ), możemy zapisać ES α = µ + σ φ(φ 1 (α)) 1 α (3.8) gdzie φ jest gęstością standardowego rozkładu normalnego, a Φ 1 dystrybuantą odwrotną. Jak wynika z Twierdzenia 1. analizowana zmienna musi mieć rozkład normalny. Załóżmy zatem, że obie nasze zmienne (pszenica i soja) mają taki rozkład. Zbadamy na podstawie powyższego twierdzenia, czy dzięki estymacji rozkładem normalnym możemy zmniejszyć ryzyko, a co za tym idzie wysokości potrzebnych rezerw. Jak łatwo zauważyć wzór zależy tylko od parametrów µ i σ, które zostały wyestymowane z rozkładu poszczególnych stóp strat (Tablica 2 i 3), gdyż wartość φ(φ 1 (α)) jest stała (gęstość kwantyla rzędu α standardowego rozkładu normalnego). Posługując się programem SAS 9.3 bez większej trudności wyznaczymy potrzebne wielkości. Tablica 9: Wyestymowana uśredniona wartość zagrożona Expected Shortfall pszenica soja W tym przypadku również wartość ES dla pszenicy jest znacznie większa. Mając dane z Tablicy 9 wyliczmy wysokości rezerw. Dla pszenicy ES 0.95 ( L 1 ) = ES 0.95 (L 1 ) = = [USD] Dla soi ES 0.95 ( L 2 ) = ES 0.95 (L 2 ) = = [USD] Wartości Expected Shortfall wyliczone dwoma sposobami różnią się od siebie. Korzystając z Lematu 2. braliśmy pod uwagę tylko konkretne trzy wartości, natomiast korzystając z Twierdzenia 1. parametry rozkładu całej próby, zatem te wyniki są bardziej dokładne. Wyliczając z definicji miarę ryzyka dla próbki pszenicy założyliśmy jej pochodzenie z rozkładu normalnego. Wynik jednak okazał się większy niż przy wykorzystaniu Lematu 2. Możemy zatem stwierdzić, że nasza próba dopasowania próbki pszenicy do rozkładu normalnego nie przyniosła zamierzonego efektu, ponieważ nie zmniejszyliśmy ryzyka. Wartości ES wyliczone dla soi są mniejsze niezależnie od wyboru metody. Najmniejszą wartość otrzymaliśmy analizując parametry rozkładu całej próby, czyli korzystając z Twierdzenia 1. 19

18 Podsumujmy wszystkie zebrane wyniki. Tablica 10: Porównanie rezerw Var ES Pszenica [USD] Soja [USD] oszacowany kwantyl rzędu z założenia o normalności rozkładu z Lematu z Twierdzenia Jak wynika z Tablicy 10, wszystkie wyliczone wartości dla próbki soi są mniejsze niż dla próbki pszenicy. Zatem dla portfeli jednoskładnikowych stwierdzamy, że inwestując tę samą kwotę w wybrane dwa aktywa, korzystniejsza jest inwestycja w soję, ponieważ potrzebne są mniejsze rezerwy finansowe. 20

19 4 Modelowanie rozkładów dwuwymiarowych Przeanalizowaliśmy już ryzyko inwestycji portfeli jednoskładnikowych. W tym rozdziale rozpoczniemy badanie portfeli dwuskładnikowych, czyli zajmiemy się znalezieniem rozkładu łącznego portfela. Poznaliśmy już rozkłady obu inwestycji, które w przypadku portfela dwuskładnikowego stają się rozkładami brzegowymi. Rozkład stóp strat dla soi miał rozkład normalny natomiast rozkład dla pszenicy niestety nie (uzasadnienie znajduje się w rozdziale poprzednim). W takim przypadku zweryfikujemy normalność dwuwymiarowego rozkładu. Na początku jednak przedstawimy podstawową definicję wielowymiarowego rozkładu normalnego opracowaną na podstawie pozycji [2]. Definicja Wielowymiarowy rozkład normalny [2] Wektor X = (X 1, X 2,..., X p ) ma niezdegenerowany rozkład normalny (gaussowski) X N(µ, Σ) jeśli EX = µ R p, Σ = E(X µ)(x µ) T dla macierzy kowariancji detσ 0 zaś gęstość x R p 1 f(x) = exp( 1 (2π) p 2 Σ (x µ)t Σ 1 (x µ)). Definicja przedstawia p-wymiarowy rozkład gaussowski wektora losowego X jednoznacznie określony przez p-wymiarowy wektor wartości oczekiwanej µ oraz kwadratową symetryczną i nieujemną macierz kowariancji Σ o wymiarach p x p (oznaczenie X N p (µ, Σ) - zmienna X ma p-wymiarowy rozkład normalny). Jak już wspomnieliśmy we wstępie tego rozdziału będziemy analizować portfel dwuskładnikowy, zatem interesuje nas dwuwymiarowy rozkład normalny (biorąc pod uwagę ww. definicję przyjmujemy p=2). Dla dwuwymiarowego rozkładu normalnego prawdziwe jest twierdzenie. Twierdzenie 2. Niech X = (X 1, X 2,..., X p ) ma rozkład eliptyczny. Wówczas dla L 1,L 2 M zachodzi: V ar α (L 1 + L 2 ) V ar α (L 1 ) + V ar α (L 2 ). Jak wynika z Twierdzenia 2. w przypadku dwuwymiarowości rozkładu normalnego Value-at-Risk jest koherentną miarą ryzyka. 4.1 Test Mardia [2]. Istnieje wiele metod badania dwuwymiarowej normalności. Jedną z nich jest Test Mardia Maridia-test jest oparty na mierze skośności gdzie X,Y są niezależne oraz kurtozie β 1,p = E((X µ) T Σ 1 (Y µ)) 3 21

20 β 2,p = E((X µ) T Σ 1 (Y µ)) 2. Dla wektorów losowych X,Y wielowymiarowego rozkładu normalnego, jeśli X, Y są niezależne wówczas β 1,p = 0 zaś β 2,p = p(p + 2). Przejdźmy do wykonania tego testu dla naszych danych. Ustalamy standardowo poziom istotności α = 0.05 oraz zakładamy hipotezę zerową: wobec hipotezy alternatywnej: Bierzemy pod uwagę: H 0 - dane pochodzą z dwuwymiarowego rozkładu normalnego H A - dane nie pochodzą z rozkładu normalnego. kurtozę wielowymiarową znormalizowaną - jeśli jej wartość mieści się w przedziale (-1.96,1.96), to nie mamy podstaw do odrzucenia H 0, w przeciwnym wypadku hipotezę tę odrzucamy; kappę według Mardii, średnią skalowaną kurtozę wielowymiarową oraz skorygowaną średnią skalowaną kurtozę wielowymiarową - wszystkie wartości powinny być większe od wartości krytycznej K = 2 p+2 = 1 2 (p liczba wymiarów), wówczas nie mamy podstaw do odrzucenia H 0, w przeciwnym wypadku hipotezę odrzucamy. Wyniki przedstawia Tablica 11 na podstawie Dodatku B.3. Tablica 11: Test na dwuwymiarową normalność Kurtoza warość hipoteza zerowa Kurtoza wielowymiarowa znormalizowana nie odrzucamy Kappa według Mardii nie odrzucamy Średnia skalowana kurtoza wielowymiarowa nie odrzucamy Skorygowana średnia skalowana kurtoza wielowymiarowa nie odrzucamy W wykonanym teście wszystkie kryteria wskazują, że nie mamy podstaw by odrzucić H 0. Moglibyśmy zatem przyjąć, że nasze dane mają dwuwymiarowy rozkład normalny, jednak nie jest to jednoznacznie stwierdzone (brak podstaw do odrzucenia hipotezy nie jest równoważny z jej przyjęciem). Dlatego w kolejnym rozdziale sprawdzimy czy dopasowania znanymi nam kopułami nie przybliżą precyzyjniej naszego rozkładu danych. Warto w tym miejscu wspomnieć, że jeżeli mamy dane dwuwymiarowe o rozkładzie normalnym to rozkłady brzegowe (dla rozkładu łącznego) również mają taki rozkład. Niestety w naszym przypadku nie jest to jasne, gdyż jak wykazały testy na normalność jeden z rozkładów brzegowych nie był normalny oraz w przypadku dwuwymiarowych danych także nie mamy co do tego pewności. 4.2 Estymacja gęstości Estymacja nieznanej funkcji gęstości polega na aproksymacji (zastąpieniu matematycznych wielkości innymi, o przybliżonych własnościach, łatwiejszymi do badania i zastosowania) przy wykorzystaniu znanej funkcji (np. gęstości rozkładu normalnego). Inaczej mówiąc funkcja ta uśrednia dane obserwowane w próbie i tworzy estymator - wygładzoną aproksymację. Dokonujemy tego przy użyciu procedury KDE (kernel density estimation) w programie SAS 9.3. [Dodatek B.4.] 22

21 Poniżej znajduje się graficzne przedstawienie estymacji dla naszych danych. Rysunek 5: Rozkład i gęstość danych (wykres dwuwymiarowy) Rysunek 6: Gęstość danych (wykres trójwymiarowy) 23

22 4.3 Kopuły Jednym ze sposobów wyznaczania rozkładu łącznego jest zastosowanie kopuł. Kopuła jest funkcją wyznaczającą dystrybuantę łączną przy użyciu jednostajnych dystrybuant brzegowych, o czym mówi Twierdzenie Sklara. Zanim jednak przejdziemy do wyznaczania rozkładu przedstawimy niezbędną definicję i twierdzenie. Definicja Kopuła dwuwymiarowa [9] Kopuła dwuwymiarowa C : [0, 1] 2 [0, 1] jest to funkcja spełniająca następujące warunki: a) C(0, t) = C(t, 0) = 0, dla t I b) C(1, t) = C(t, 1) = t, dla t I c) C(u 2, v 2 ) C(u 1, v 2 ) C(u 2, v 1 ) + C(u 1, v 1 ) 0 dla wszystkich u 1, u 2, v 1, v 2 I, takich że u 1 u 2 i v 1 v 2. Dla wyżej opisanej kopuły dwuwymiarowej możemy sformułować twierdzenie: Twierdzenie 2. (Sklar a) [5] Niech F będzie dystrybuantą łączną o rozkładach brzegowych F 1, F 2. Wówczas istnieje kopuła C : [0, 1] 2 [0, 1] taka, że (x1,x 2) R 2 =[, ] F (x 1, x 2 ) = C(F 1 (x 1 ), F 2 (x 2 )). (5.1) Ponadto, jeżeli rozkłady brzegowe są ciągłe, wówczas C jest określona jednoznacznie Podstawowy podział kopuł Kopuły dzielimy na dwie rodziny: archimedejskie i eliptyczne. Do kopuł archimedejskich należą: kopuła Claytona, Franka oraz Gumbela, natomiast rodzina kopuł eliptycznych składa się z kopuły Normalnej i T (T-studenta). Poniżej prezentujemy wzory wymienionych kopuł dla jednostajnych rozkładów brzegowych x 1, x 2 (kopuły dwuwymiarowe). Kopuły archimedejskie Clayton Frank Gumbel C θ (x 1, x 2 ) = (x θ 1 + x θ 2 1) 1 θ, gdzie 0 < θ < (5.2) C θ (x 1, x 2 ) = 1 θ ln[1 + (exp( θx 1) 1)(exp( θx 2 ) 1) ], gdzie θ R\{0} (5.3) exp( θ) 1 C θ (x 1, x 2 ) = exp{ (( lnx 1 ) θ + ( lnx 2 ) θ ) 1 θ }, gdzie 1 < θ < (5.4) Kopuły eliptyczne T-student C ν,ρ (x 1, x 2 ) = t 1 ν (x1) t 1 ν (x2) 1 2π(1 ρ 2 ) 1 2 [1 + u2 2ρuv + v 2 ν(1 ρ 2 ] ν+2 2 du dv, (5.5) ) 24

23 gdzie ν, ρ - parametry kopuły, t 1 ν stopniami swobody. - funkcja odwrotna do dystrybuanty rozkładu T-Studenta z ν Normalna C ρ (x 1, x 2 ) = Φ 1 (x 1) Φ 1 (x 2) 1 2π(1 ρ 2 ) 1 2 exp{ u2 2ρuv + v 2 2(1 ρ 2 } du dv, (5.6) ) gdzie ρ - parametr kopuły, Φ 1 - funkcja odwrotna do dystrybuanty rozkładu normalnego. Jak wynika ze wzorów dla odpowiednich kopuł z rodziny archimedejskich są ode zależne od parametrów θ. Parametr ten mówi o zależności pomiędzy rozkładami brzegowymi. Jeżeli θ zbiega do dolnego ograniczenia parametru (w zależności od rodzaju kopuły) to mamy niezależne rozkłady brzegowe. Najlepsze dopasowanie tych parametrów dobiera nam program SAS 9.3 przy użyciu procedury proc copula. W przypadku kopuł z rodziny eliptycznych otrzymujemy macierze korelacji. Ponadto program generuje podstawowe kryteria najlepszego dopasowania kopuły do naszych danych. I kolejno otrzymujemy: parametr Log Likelihood (w skrócie LOG) - im większa wartość tym lepsze dopasowanie; parametr Akaike (w skrócie AIC) - im mniejsza wartość tym lepsze dopasowanie. W przypadku niejasności wyboru, tzn. gdy wartości LOG i AIC nie wskazują jednoznacznie na którąś z kopuł bierzemy pod uwagę trzeci parametr. Jest to tzw. kryterium Schwarza (baysowskie), w skrócie SBC - i tak jak w przypadku AIC im mniejsza jego wartość tym lepsze dopasowanie. Poniżej przedstawiamy kopuły wraz z kryteriami dopasowania oraz miarami ryzyka odpowiednimi dla każdej z nich. Kod generujący znajduje się w Dodatku B.5. Kopuła Claytona Tablica 13: Kopuła Claytona Tablica 12: Kopuła Claytona - wykres trójwymiarowy θ kryteria Log Likelihood AIC SBC

24 Kopuła Franka Tablica 15: Kopuła Franka Tablica 14: Kopuła Franka - wykres trójwymiarowy θ kryteria Log Likelihood AIC SBC Kopuła Gumbela Tablica 17: Kopuła Gumbela Tablica 16: Kopuła Gumbela - wykres trójwymiarowy θ kryteria Log Likelihood AIC SBC Kopuła Normalna macierz korelacji Tablica 19: Kopuła Normalna [ ] Tablica 18: Kopuła Normalna - wykres trójwymiarowy 26

25 Kopuła T macierz korelacji Tablica 21: Kopuła T [ ] Tablica 20: Kopuła T - wykres trójwymiarowy v 100 kryteria Log Likelihood AIC SBC Po zaprezentowaniu wszystkich kopuł wróćmy jeszcze do kopuł eliptycznych. Otrzymaliśmy dwie macierze korelacji. Jedną dla kopuły Normalnej: [ ] drugą dla kopuły T: [ ] Zanim zinterpretujemy otrzymane wielkości zdefiniujmy potrzebny w tym celu współczynnik korelacji. Definicja Współczynnik korelacji [7] Współczynnik korelacji między zmiennymi X i Y określonymi na tej samej przestrzeni probabilistycznej, dla których 0 < V ar(x) < i 0 < V ar(y) <, jest liczbą zdefiniowaną następująco: Corr(X, Y) = ρ XY = Cov(X, Y) V ar(x) V ar(y) (5.7) Jeżeli X, Y są niezależnymi zmiennymi losowymi, to Cov(X, Y) = 0 oraz ρ XY = 0. Jak wynika z Definicji współczynnik korelacji mówi o zależności między zmiennymi. Im wartość bliższa 1 tym większa zależność (jak wiadomo ρ XY [ 1, 1]). Współczynniki korelacji dla naszych kopuł wynoszą odpowiednio dla kopuły Normalnej i dla kopuły T. Obie wielkości są porównywalne. Ponadto dla dużej liczby stopni swobody (w naszym przypadku ν=100) rozkład T-Studenta praktycznie pokrywa się z rozkładem normalnym. Dzięki temu i dzięki podobnym wartościom współczynnika korelacji możemy założyć, że kopuły T i Normalna nie różnią się znacznie. Zatem w dalszej części nie będziemy brać pod uwagę kopuły Normalnej. 27

26 Tablica 22: Porównanie kopuł kopuła θ Log Likelihood AIC SBC VaR ES Clayton Gumbel Frank T Na podstawie Tablicy 22 możemy wybrać najlepiej dopasowaną kopułę do naszych danych. Wyniki są jednoznaczne. Według pierwszego (Log Likelihood) jak i drugiego kryterium (Akaike) najlepiej dopasowaną kopułą okazała się kopuła T. Dodatkowo w tablicy zostały umieszczone wartości miar ryzyka dla portfela dwuskładnikowego złożonego z 1 2 kapitału przeznaczonego na aktywo pierwsze i 1 2 kapitału przeznaczonego w aktywo drugie, dzięki którym wyliczymy rezerwy potrzebne do inwestycji łącznej (uzyskane za pomocą kodu znajdującego się w Dodatku B.6). 4.4 Inwestycja łączna Kwota inwestycji łącznej jest taka sama jak w przypadku inwestycji pojedynczych, czyli 1 mln dolarów. Dywersyfikując portfel przeznaczymy połowę kapitału na inwestycję w pszenicę a połowę na inwestycję w soję, tzn. po dolarów w każde aktywo. Miary ryzyka dla inwestycji łącznej zostały policzone przy pomocy danych wygenerowanych z najlepiej dopasowanej kopuły T, dzięki którym możemy wyliczyć potrzebne rezerwy. V ar 0.95 ( L 3 ) = V ar 0.95 (L 3 ) = = [USD] ES 0.95 ( L 3 ) = ES 0.95 (L 3 ) = = [USD] Jak łatwo zauważyć wyliczone rezerwy finansowe wg pierwszej miary są mniejsze niż wg miary drugiej, czyli ES. Różnica wynika z faktu, że ES bada 5% najgorszych przypadków inwestycyjnych, a VaR jest miarą dokładniejszą i szacuje rezerwy na podstawie całej próby. Zastanówmy się jeszcze jak zmienią się wysokości potrzebnych rezerw przy innym podziale kapitału. W tym celu posłużymy się dodatnią jednorodnością zarówno wartości zagrożonej jak i zagrożonej wartości oczekiwanej, co możemy zapisać następująco: oraz gdzie: A V ar 0.95 (A L 1 + B L 2 ) = (A + B) V ar 0.95 ( A + B L 1 + B A + B L 2) (5.8) A ES 0.95 (A L 1 + B L 2 ) = (A + B) ES 0.95 ( A + B L 1 + B A + B L 2), (5.9) A + B - całkowity kapitał (1 mln dolarów), A - kwota inwestycji w pszenicę, B - kwota inwestycji w soję. 28

27 Korzystając z programu SAS 9.3, do którego kod znajduję się w Dodatku B.7. oraz zależności (5.8) i (5.9), przyjrzyjmy się wybranym dywersyfikacjom naszego portfela. Posługując się Tablicami 23 i 24 wybierzemy najbardziej optymalną inwestycję, którą porównamy z wcześniej omówioną, czyli dzielącą kapitał pomiędzy dwoma aktywami po równo. Tablica 23: Wybrane dywersyfikacje portfela 1 4 L L L L L L L L 2 VaR ES Tablica 24: Wybrane dywersyfikacje portfela 2 5 L L L L L L L L 2 VaR ES Analizując powyższe tablice łatwo zauważyć, że najmniej ryzykowną inwestycją jest pierwsza spośród analizowanych, czyli składająca się z 1 4 kapitału przeznaczonego w akcje pszenicy i 3 4 kapitału w akcje soi. Rezerwy te wynoszą kolejno USD wg VaR i USD wg ES. Wybierzmy zatem najkorzystniejszą inwestycję łączną. Weźmiemy pod uwagę dwie z nich: 1 2 L L 2 rezerwy wg VaR: [USD] rezerwy wg ES: [USD] 1 4 L L 2 rezerwy wg VaR: [USD] rezerwy wg ES: [USD] Jak nie trudno zauważyć mniejsze wartości w przypadku obydwu miar otrzymaliśmy dla inwestycji drugiej, czyli 1 4 kapitału przeznaczonego na pszenicę i 3 4 na soję. I tę oto inwestycję uznajemy za najmniej ryzykowną spośród inwestycji łącznych, gdyż wielkości rezerw bez wątpienia wskazują właśnie na nią. 4.5 Porównanie inwestycji Podsumujmy wszystkie przeanalizowane w pracy inwestycje. Jak już wcześniej ustaliliśmy bardziej ryzykowną inwestycją pojedynczą okazały się akcje pszenicy, i co do tego nie mamy żadnych wątpliwości, gdyż obie miary ryzyka oszacowały większe niezbędne zabezpieczenia finansowe. Na tej podstawie za mniej ryzykowną inwestycję uznajemy akcje soi i to właśnie tę inwestycję będziemy porównywać z inwestycją złożoną. Następnie analizowaliśmy różne inwestycje łączne spośród których najkorzystniejszą okazała się inwestycja składająca się z 1 4 kapitału przeznaczonego na akcje pszenicy i 3 4 kapitału przeznaczonego na akcje soi. W Tablicy 25 umieściliśmy wyliczone rezerwy dla tych portfeli. 29

28 Tablica 25: Rezerwy jakie należy przeznaczyć na poszczególne inwestycje Soja[USD] Łączna[USD] VaR ES Porównując te dwie wybrane inwestycje łatwo zauważyć, że większe wartości otrzymaliśmy w przypadku inwestycji łącznej. Stąd też najmniej ryzykowną inwestycją okazała się inwestycja w kwocie 1 mln dolarów na okres jednego miesiąca w akcje soi. Rezerwy te wynoszą odpowiednio wg Value-at-Risk 123 tysiące dolarów, czyli około 12% wartości zainwestowanego kapitału, zaś wg Expected Shortfall około 155 tysięcy dolarów, co stanowi niecałe 15,5% wartości całkowitego kapitału. 30

29 5 Podsumowanie W pracy przeanalizowano inwestycje jedno i dwuskładnikowe (dzielące kapitał w wysokości 1 mln dolarów w różnych proporcjach) w akcje pszenicy oraz soi szacując niezbędne rezerwy, by inwestycje te nie przyniosły strat. W tym celu posłużono się dwiema miarami ryzyka, Value at Risk oraz Expected Shortfall. Na ich podstawie stwierdzono, że w przypadku inwestycji jednoskładnikowych mniej ryzykowną inwestycją okazała się inwestycja w soję, gdyż wymagała znacznie mniejszych zabezpieczeń finansowych niż pszenica. Ponadto wykonano testy Shapiro-Wilka, Kołmogorowa Smirnowa oraz Mardia test sprawdzające normalność rozkładów stóp strat dla wspomnianych aktywów. Poprzedzając analizę inwestycji łącznej wprowadzono teorię dotyczącą dwuwymiarowego rozkładu normalnego oraz sprawdzono dopasowanie danych do rozkładów innych znanych funkcji, funkcji kopuł z rodziny archimedejskich i eliptycznych. Korzystając z dwóch parametrów, Log Likelihood i Akaike wybrano najlepiej dopasowaną kopułę, którą okazała się kopuła zbliżona do normalnej, czyli kopuła T. Mając wybraną kopułę wyliczono wartości omówionych wcześniej miar ryzyka i na ich podstawie oszacowano wysokości rezerw dla inwestycji łącznych dywersyfikując portfel w różnych proporcjach. Najmniej ryzykowną inwestycją dwuskładnikową okazała się inwestycja składająca się z 1 4 kapitału przeznaczonego na akcje pszenicy i 3 4 kapitału przeznaczonego na akcje soi. Biorąc pod uwagę wszystkie omówione w pracy portfele stwierdzono, że najmniej ryzykowną inwestycją okazała się inwestycja w soję. Oszacowane wielkości zabezpieczeń wynosiły kolejno wg VaR 123 tysiące dolarów, a wg ES około 155 tysięcy. 31

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41 Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna

Bardziej szczegółowo

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40 Statystyka Wykład 5 Magdalena Alama-Bućko 26 marca 2018 Magdalena Alama-Bućko Statystyka 26 marca 2018 1 / 40 Uwaga Gdy współczynnik zmienności jest większy niż 70%, czyli V s = s x 100% > 70% (co świadczy

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki

Bardziej szczegółowo

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014 Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014 Zmienne losowe i ich rozkłady Doświadczenie losowe: Rzut monetą Rzut kostką Wybór losowy n kart z talii 52 Gry losowe

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Ryzyko inwestycji na dwóch wybranych rynkach. Optymalny portfel ze względu na VAR i ES. Paweł Karyś

Ryzyko inwestycji na dwóch wybranych rynkach. Optymalny portfel ze względu na VAR i ES. Paweł Karyś Ryzyko inwestycji na dwóch wybranych rynkach. Optymalny portfel ze względu na VAR i ES. Paweł Karyś 11 czerwca 2015 Spis treści 1 Wstęp 2 2 Opis wybranych rynków 3 2.1 WIG20...............................................

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

STATYSTYKA

STATYSTYKA Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

dr hab. Renata Karkowska 1

dr hab. Renata Karkowska 1 dr hab. Renata Karkowska 1 Czym jest ryzyko? Rodzaje ryzyka? Co oznacza zarządzanie? Dlaczego zarządzamy ryzykiem? 2 Przedmiot ryzyka Otoczenie bliższe/dalsze (czynniki ryzyka egzogeniczne vs endogeniczne)

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015 Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015 Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

Statystyka i eksploracja danych

Statystyka i eksploracja danych Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Statystyka opisowa. Robert Pietrzykowski.

Statystyka opisowa. Robert Pietrzykowski. Statystyka opisowa Robert Pietrzykowski email: robert_pietrzykowski@sggw.pl www.ekonometria.info 2 Na dziś Sprawy bieżące Przypominam, że 14.11.2015 pierwszy sprawdzian Konsultacje Sobota 9:00 10:00 pok.

Bardziej szczegółowo

Zmienne losowe ciągłe i ich rozkłady

Zmienne losowe ciągłe i ich rozkłady Statystyka i opracowanie danych W3 Zmienne losowe ciągłe i ich rozkłady Dr Anna ADRIAN Paw B5, pok47 adan@agh.edu.pl Plan wykładu Rozkład Poissona. Zmienna losowa ciągła Dystrybuanta i funkcja gęstości

Bardziej szczegółowo

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu

Bardziej szczegółowo

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe Statystyka i opracowanie danych W4 Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Rozkład normalny wykres funkcji gęstości

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

1 Podstawy rachunku prawdopodobieństwa

1 Podstawy rachunku prawdopodobieństwa 1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej

Bardziej szczegółowo

Zmienne losowe ciągłe i ich rozkłady

Zmienne losowe ciągłe i ich rozkłady Rachunek Prawdopodobieństwa i Statystyka - W3 Zmienne losowe ciągłe i ich rozkłady Dr Anna ADRIAN Paw B5, pok47 adan@agh.edu.pl Plan wykładu Zmienna losowa ciągła Dystrybuanta i unkcja gęstości rozkładu

Bardziej szczegółowo

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych. Wykład 3 Momenty zmiennych losowych. Wrocław, 19 października 2016r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Wykład 3 Momenty zmiennych losowych.

Wykład 3 Momenty zmiennych losowych. Wykład 3 Momenty zmiennych losowych. Wrocław, 18 października 2017r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną

Bardziej szczegółowo

Porównanie metod szacowania Value at Risk

Porównanie metod szacowania Value at Risk Porównanie metod szacowania Value at Risk Metoda wariancji i kowariancji i metoda symulacji historycznej Dominika Zarychta Nr indeksu: 161385 Spis treści 1. Wstęp....3 2. Co to jest Value at Risk?...3

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Stanisław Cichocki Natalia Nehrebecka. Wykład 7 Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014 Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Biostatystyka, # 3 /Weterynaria I/

Biostatystyka, # 3 /Weterynaria I/ Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Prawa wielkich liczb, centralne twierdzenia graniczne

Prawa wielkich liczb, centralne twierdzenia graniczne , centralne twierdzenia graniczne Katedra matematyki i ekonomii matematycznej 17 maja 2012, centralne twierdzenia graniczne Rodzaje zbieżności ciągów zmiennych losowych, centralne twierdzenia graniczne

Bardziej szczegółowo

Wykład 7 Testowanie zgodności z rozkładem normalnym

Wykład 7 Testowanie zgodności z rozkładem normalnym Wykład 7 Testowanie zgodności z rozkładem normalnym Wrocław, 05 kwietnia 2017 Rozkład normalny Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie normalnym określonym przez dystrybuantę

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych Przykłady: Błąd pomiarowy Wzrost, wydajność Temperatura ciała Zawartość różnych składników we

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

Ekonometria Finansowa II EARF. Michał Rubaszek

Ekonometria Finansowa II EARF. Michał Rubaszek Ekonometria Finansowa II EARF Michał Rubaszek 1 Cele - Zapoznanie z charakterystykami szeregów finansowych - Omówienie jednowymiarowych metod liczenia VaR - Omówienie wielowymiarowych metod liczenia VaR

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego Rozdział 1 Statystyki Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego X = (X 1,..., X n ). Uwaga 1 Statystyka jako funkcja wektora zmiennych losowych jest zmienną losową

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD

Bardziej szczegółowo

Statystyka w przykładach

Statystyka w przykładach w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie

Bardziej szczegółowo

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych cd. Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Ważne rozkłady i twierdzenia c.d.

Ważne rozkłady i twierdzenia c.d. Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby

Bardziej szczegółowo

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE

Bardziej szczegółowo

Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak

Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego Katarzyna Kuziak Cel: łączenie różnych rodzajów ryzyka rynkowego za pomocą wielowymiarowej funkcji powiązań 2 Ryzyko rynkowe W pomiarze ryzyka

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Komputerowa Analiza Danych Doświadczalnych

Komputerowa Analiza Danych Doświadczalnych Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A Zad. 1. Korzystając z podanych poniżej mini-tablic, oblicz pierwszy, drugi i trzeci kwartyl rozkładu N(10, 2 ). Rozwiązanie. Najpierw ogólny komentarz

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r. Matematyka ubezpieczeń majątkowych..00 r. Zadanie. Proces szkód w pewnym ubezpieczeniu jest złożonym procesem Poissona z oczekiwaną liczbą szkód w ciągu roku równą λ i rozkładem wartości szkody o dystrybuancie

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Przykład Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszkań w

Bardziej szczegółowo