PRACA DYPLOMOWA. Wydziaª Podstawowych Problemów Techniki. Metody Oceny Ryzyka Operacyjnego (Methods of Operational Risk Assessment) Katarzyna Smaga

Wielkość: px
Rozpocząć pokaz od strony:

Download "PRACA DYPLOMOWA. Wydziaª Podstawowych Problemów Techniki. Metody Oceny Ryzyka Operacyjnego (Methods of Operational Risk Assessment) Katarzyna Smaga"

Transkrypt

1 Wydziaª Podstawowych Problemów Techniki PRACA DYPLOMOWA Metody Oceny Ryzyka Operacyjnego (Methods of Operational Risk Assessment) Katarzyna Smaga Promotor: dr hab. Rafaª Weron sªowa kluczowe: Ryzyko Operacyjne Umowa Bazylejska Teoria warto±ci ekstremalnych Extreme Value Theory (EVT) Warto± nara»ona na ryzyko Value at Risk (VaR) streszczenie: Praca dotyczy oceny ryzyka operacyjnego. Przedstawiono przegl d metod proponowanych przez Komitet Bazylejski oraz zaprezentowano metod modelowania rozkªadu strat operacyjnych z u»yciem teorii warto±ci ekstremalnych. Algorytmy zostaªy zaimplementowane w ±rodowisku MatLab. Przeprowadzono testy zgodno±ci oraz wyliczono warto±ci nara»one na ryzyko. Wrocªaw 2009

2

3 Spis treści Wstęp v Rozdział 1. Ryzyko operacyjne Definicja ryzyka operacyjnego Historyczne straty operacyjne Techniki szacowania ryzyka operacyjnego Rozdział 2. Dane Opis bazy danych Wizualizacja Statystyki opisowe Rozdział 3. Dobór rozkładu Rozkład wielkości szkody Rozdział 4. Wykorzystanie teorii wartości ekstremalnych (EVT) Wybór progu Mean Excess Plot Wykres estymatora parametru kształtu Wykres Gertensgarbe-Wernera Dopasowanie Modelu GPD Skalowanie rozkładu Dokładność doboru modelu Test KS porównujący rozkłady dwóch próbek Testy graficzne Test oparty na residuach Rozdział 5. VaR i badanie modelu Estymacja kwantyli wyższych rzędów Badanie dokładności estymacji kwantyli Test Kupca Rozdział 6. Modelowanie wielkości straty mieszaniną rozkładów Model dla strat poniżej progu Mieszanina rozkładów Weibulla Model wielkości straty Test Andersona-Darlinga Test Kupca Test Crnkovica-Drachmana Rozdział 7. Dobór rozkładu do częstości występowania strat Process Poissona dla rozkładu GPD wielkości szkody Niejednorodny proces Poissona jako proces liczący liczby strat Wybór odpowiedniej funkcji intensywności λ(t)

4 iv Spis treści Rozdział 8. Rozkład złożony Symulacja metodą Monte Carlo Test Andersona-Darlinga Test Kupca Test Crnkovica-Drachmana Rozdział 9. Zakończenie Dodatek A. Teoria wartości ekstremalnych Extreme Value Theory (EVT) Dodatek B. Proces Poissona B.1. Jednorodny proces Poissona (HPP) B.2. Niejednorodny proces Poissona (NPP) B.2.1. Symulowanie NPP - metoda rozcieńczania Bibliografia

5 Wstęp Ocena ryzyka operacyjnego stanowi ważny element zarządzania ryzykiem. Zgodnie z definicją, przyjętą przez Komitet Bazylejski, straty operacyjne wynikają głównie z błędów popełnianych przez ludzi, bądź są spowodowane czynnikami zewnętrznymi. Z tego powodu są one nieodłącznym elementem funkcjonowania przedsiębiorstw. Analiza historycznych przypadków prowadzi do wniosku, że wielkość strat tego typu może sięgać setek miliardów dolarów, dlatego monitorowanie ryzyka operacyjnego nie może być zaniedbywane. Bazylejski Komitet Nadzoru Bankowego w dokumencie zwanym Umową Kapitałową przedstawia podstawowe metody oceny ryzyka operacyjnego. Najdoskonalszą z nich jest tzw. Metoda Rozkładu Straty Loss Distribution Approach. Polega ona na dobraniu pewnych rozkładów prawdopodobieństwa do danych opisujących wielkość szkody oraz do danych o częstości występowania strat, a następnie na połączeniu ich w rozkład złożony. Główną częścią niniejszej pracy jest zaimplementowanie metody LDA. Rozkłady strat operacyjnych charakteryzują się grubymi ogonami, co oznacza, że z dodatnim prawdopodobieństwem mogą pojawiać się straty o nietypowych, ekstremalnie dużych wartościach. Z tego powodu potrzebne są modele dobrze opisujące obszar ogonowy rozkładu. Najbardziej powszechną metodą stosowaną do modelowania obszaru ogonowego rozkładu strat jest wykorzystanie Teorii Wartości Ekstremalnych (EVT Extreme Value Theory). W niniejszej pracy zastosowano jedną z metod EVT Peaks Over Treshold (POT). Model częstości występowania strat oparty został na niejednorodnym procesie Poissona. Na każdym etapie przeprowadzono szereg testów statystycznych sprawdzających zgodność modelu z danymi rzeczywistymi. Plan pracy: 1. Analiza historycznych przypadków strat operacyjnych 2. Przedstawienie metod oceny ryzyka operacyjnego zaproponowanych przez Komitet Bazylejski 3. Zastosowanie metody POT dobór modelu opartego na uogólnionym rozkładzie Pareto (GPD) do ogona rozkładu strat 4. Model dla całościowego rozkładu strat modelowanie mieszaniną rozkładów GPD i Weibulla 5. Model częstości występowania szkód 6. Model złożony

6

7 Rozdział 1 Ryzyko operacyjne 1.1. Definicja ryzyka operacyjnego Definicja ryzyka operacyjnego ewoluowała znacząco na przestrzeni ostatnich 12 lat. Od lat 50-tych zaczęto zauważać potrzebę kontrolowania rzadkich, ale katastrofalnych w skutkach wypadków. Termin ryzyko operacyjne został prawdopodobnie wspomniany po raz pierwszy po niechlubnym przypadku bankructwa banku Barringsa w 1995 roku. Jeden z maklerów - Nick Leeson, poprzez prowadzenie nielegalnych transakcji naraził bank na stratę 1.3 miliarda dolarów. To wydarzenie pokazało, że istnieją wcześniej ignorowane rodzaje ryzyka, które mogą w znaczący sposób odbić się na rynku finansowym. Ponieważ przypadki takie jak bank Barringsa nie mogły być zaklasyfikowane jako ryzyko kredytowe, ani rynkowe powstał termin ryzyka operacyjnego. Obecnie banki estymują, że ryzyko, które ponoszą dzieli się na ryzyko kredytowe (50%), ryzyko rynkowe i płynności (15%) oraz ryzyko operacyjne (35%) [7]. Formalnie definicja ryzyka operacyjnego została wprowadzona przez Bazylejski Komitet Nadzoru Bankowego, który opracował zespół najlepszych praktyk rynkowych w zakresie zarządzania ryzykiem finansowym w sektorze bankowym, bezpieczeństwa oraz poziomu kapitału koniecznego do utrzymywania przez banki. Pierwsza wersja dokumentu opublikowana w 1988 roku zwana jest Umową Kapitałową. Jej rozbudowana i uaktualniona wersja znana jest pod nazwą Basel II / Nowa Umowa Kapitałowa (NUK) [19]. Według NUK ryzyko operacyjne to ryzyko strat spowodowanych niewłaściwymi lub zawodnymi procesami wewnętrznymi, błędem ludzkim lub czynnikami natury zewnętrznej Historyczne straty operacyjne Analizując bazy danych strat operacyjnych możemy zauważyć występowanie przypadków o niskiej frekwencji, przy jednoczesnych ekstremalnych możliwych wartościach zaistniałej szkody. Poniżej przedstawiono kilka przykładów ekstemalnie dużych strat operacyjnych [6, 22]: 1. Orange Country W 1994 roku wzrost stóp procentowych spowodował bankructwo Orange Country, które straciło 1.7 miliarda dolarów. Było to wynikiem działania zarządcy finansowego, Boba Citrona, który zainwestował rezerwowe zasoby finansowe powiatu w instrumenty pochodne ściśle związane ze stopami procentowymi.

8 2 Rozdział 1. Ryzyko operacyjne 2. Daiwa W lipcu 1995 roku Toshihide Iguchi, makler japońskiego banku Daiwa ujawnił zarządowi banku stratę 1.1 miliarda dolarów. Była ona wynikiem nieautoryzowanych transakcji, których Iguchi dokonał na przestrzeni 11 lat. 3. NatWest W lutym 1997 roku bank inwestycyjny NatWest ogłosił stratę 150 milionów dolarów z powodu nieupoważnionych transakcji zawartych przez młodszego maklera, który użył własnych, przeszacowanych prognoz zmienności rynku przy wycenie opcji. 4. Nomura Securities W marcu 1997 roku Nomura Securities ogłosiło, że dwójka dyrektorów dokonała nieupoważnionych transakcji akcjami, a profity z nich przelała na konta klientów. W rezultacie cena akcji spadła o 16%, a strata wyniosła przynajmniej 413 milionów dolarów. 5. Long Term Capital Managmenent LTCM był funduszem hedgingowym. Wśród jego założycieli znajdowali się dwaj nobliści Myron Scholes i Robert Merton. Działalność funduszu opierała się na wyszukiwaniu możliwość arbitrażu na rynku i generowaniu zysków dzięki zastosowaniu strategii zabezpieczających. W 1998 roku LTCM stracił 4,6 mld dolarów w niecałe 4 miesiące, gdy jego pozycje zaczęły przynosić straty po rozpoczęciu kryzysu rosyjskiego Techniki szacowania ryzyka operacyjnego Do oceny obciążenia kapitału firmy z tytułu ryzyka operacyjnego Komitet Bazylejski proponuje 3 metody: 1. Metoda wskaźnika podstawowego Basic Indicator Approach (BIA) Jest to najprostsze z zaproponowanych rozwiązań. Polega na przemnożeniu średniego dochodu brutto z ostatnich 3 lat (GI) przez parametr α K op = αgi Współczynnik α jest ustalany przez Komitet i aktualnie wynosi 15% [12]. 2. Metoda standardowa Standardized Approach (SA) W przypadku tej metody wynik brutto banku zostaje rozbity na 8 linii biznesowych określonych przez Komitet Bazylejski. Każda z nich posiada własny zdefiniowany wskaźnik β (patrz tabela 1.1). Miernikiem wrażliwości na ryzyko operacyjne są średnie wyniki brutto w poszczególnych liniach biznesowych z ostatnich 3 lat (GI i ) i wskaźniki β i. 8 K op = β i GI i i=1 3. Metoda zaawansowanego pomiaru Advanced Measurement Approach (AMA) W podejściu zaawansowanym obliczenie wielkości kapitału regulacyjnego

9 1.3. Techniki szacowania ryzyka operacyjnego 3 Tabela 1.1. Podział na linie biznesowe i wartości współczynników w metodzie standardowej Linia biznesowa Współczynnik Bankowość korporacyjna 18% Bankowość inwestycyjna 18% Bankowość detaliczna 12% Bankowość komercyjna 15% Rozliczenia 18% Usługi pośrednictwa 15% Zarządzanie aktywami 12% Pośrednictwo brokerskie 12% jest efektem zastosowania wewnętrznych modeli pomiaru ryzyka operacyjnego, opartych na kryteriach ilościowych i jakościowych. Modelowanie w ramach tej metody wymaga akceptacji przyjętych w banku metodologii przez nadzór bankowy. Jedną z zaproponowanych przez Komitet metod jest metoda wewnętrznego pomiaru Internal Measurement Approach (IMA). Oprócz podziału na linie biznesowe rozpatruje się też podział na 7 typów strat/ryzyka (patrz tabela 1.2). Tabela 1.2. Podział na typy strat/ryzyka Typy strat/ryzyka Wewnętrzna defraudacja Zewnętrzna defraudacja Procedura zatrudnienia i bezpieczeństwo miejsca pracy Postępowania biznesowe z klientami Fizyczne zniszczenia Awarie systemowe i przerwy w interesach Zarządzanie procesami, wykonawstwem i dostawą Obciążenie kapitału oblicza się ze wzoru: 8 7 K op = γ ik ES ik, i=1 k=1 gdzie ES ik jest oczekiwaną zagregowaną szkodą z k-tego powodu w i-tej linii biznesowej, a γ ik jest czynnikiem skalującym. Najbardziej udoskonaloną metodą jest podejście Rozkładu Straty Loss Distribution Approach (LDA), które opiera się na modelowaniu rozkładu prawdopodobieństwa zmiennej losowej opisującej straty, które wystąpiły w zadanym okresie czasu. Implementacja tej metody będzie przedmiotem niniejszej pracy.

10

11 Rozdział 2 Dane Dane, którymi można posłużyć się przy ocenie ryzyka operacyjnego metodą LDA mogą pochodzić z trzech źródeł: Dane wewnętrzne Szereg czasowy złożony z historycznych przypadków strat operacyjnych, które wystąpiły w danej firmie jest prawdopodobnie najbardziej wiarygodnym źródłem danych do oceny ryzyka operacyjnego. Komitet Bazylejski wymaga od banków gromadzenia danych z przynajmniej 5 lat, aby mogły stosować jedną z metod zaawansowanego pomiaru. Należy jednak rozpatrzyć dwie kwestie: w danym momencie firma może jeszcze nie dysponować wystarczająco dużą bazą danych lub może okazać się, że okres 5 lat był za krótki, żeby mogły wystąpić szkody o niskiej frekwencji występowania, ale o dużej wielkości. Dla pełnej oceny ryzyka może okazać się konieczne połączenie wewnętrznej bazy danych z danymi zewnętrznymi. Dane zewnętrzne Istnieją firmy oferujące bazy strat operacyjnych, które mogą zostać użyte do modelowania rozkładów strat. Zaletą takich baz jest zazwyczaj duża liczba danych, pochodzących z wielu instytucji. Dane zewnętrzne powinny być w odpowiedni sposób połączone z danymi wewnętrznymi. Jeden ze sposobów mieszania danych przedstawiony jest w [13]. Estymacja ekspercka Trzecią możliwością zdobycia odpowiednich danych jest zaangażowanie ekspertów, którzy są w stanie oszacować potrzebne parametry. Oczywiście takie rozwiązanie będzie oparte na subiektywnej opinii i z tego powodu musi być nieustannie poddawane testom sprawdzającym jego adekwatność Opis bazy danych Wykorzystane w niniejszej pracy dane pochodzą z bazy IC 2 Operational Loss Database First udostępnionej przez IC 2 Zurich. Baza zawiera informacje o 2845 przypadkach, które zostały podane do wiadomości publicznej. Lata występowania szkód zawarte są w przedziale od 1950 do 2002 roku, jednak przeważająca większość przypadków wystąpiła po roku Dane zostały podzielone na 5 grup, ze względu na przyczynę wystąpienia straty: 1. Błędy ludzkie Human Do tej grupy zaliczane są straty powstałe w wyniku błędów ludzkich wewnątrz firmy (błędy pracowników) lub poza nią (np. wyłudzenia klientów).

12 6 Rozdział 2. Dane 2. Błędy procesowe Process Straty odzwierciedlające słabości w procedurach. Np. brak zgodności w wewnętrznych procesach lub w relacjach z klientami. 3. Zła organizacja pracy Relationship Ryzyko wynikające np. ze zmian w zarządzie, sposobów komunikacji w firmie. 4. Błędy technologiczne Technology Awarie sprzętowe, błędy w oprogramowaniu, awarie sieci lub innych technologii. Również luki w zabezpieczeniach systemów informatycznych. 5. Przyczyny zewnętrzne External Obszar ryzyka powodowanego zewnętrznymi przyczynami takimi jak postępowania sądowe lub katastrofy naturalne. W niektórych przypadkach zdiagnozowano więcej niż jedną przyczynę powstania szkody. Konieczne było usunięcie z bazy takich danych, ponieważ w modelu przyjmuje się założenie o niezależności zmiennych w poszczególnych grupach (zob. definicja 1 rozdział 3). Wielkości strat podane są w różnych walutach, większość (91%) w dolarach amerykańskich. Pozostałe dane zostały przewalutowane zgodnie ze średnimi rocznymi kursami walut. Zostały również uwzględnione współczynniki inflacji wyliczane na koniec każdego roku, przez które odpowiednio przemnożono dane Wizualizacja Na rysunku 2.1 przedstawiono wielkość straty w poszczególnych latach. Każdy punkt wykresu oznacza pojedynczą stratę. Już na tym etapie możemy zauważyc gruboogonowy charakter rozkładów. Widoczne są rzadkie, ale ekstremalnie wysokie straty. Na rysunku 2.2 przedstawiono liczbę strat w poszczególnych latach. Można zauważyć wyraźne rosnące trendy Statystyki opisowe Tabela 2.1 zawiera podstawowe statystyki opisowe rozkładów wielkości strat w poszczególnych grupach. Tabela 2.1. Podstawowe statystyki rozkładu wielkości strat rozkład Human Process Relationship Technology External minimum maksimum 6.75e e e e e11 średnia 3.25e9 4.47e9 1.99e9 1.69e9 2.02e9 wariancja 9.75e e e e e20 skośność kurtoza

13 2.3. Statystyki opisowe 7 (a) Human (b) Process (c) Relationship (d) Technology (e) External Rysunek 2.1. Wielkości strat w poszczególnych grupach Obserwując wartości minimum można zauważyć, że wszystkie wartości są dodatnie. Maksymalne wartości strat sięgają setek miliardów dolarów, co wpływa na wysoką wartość średniej. Ogromne wartości wariancji świadczą o dużym rozrzucie wśród danych. Dodatnia kurtoza oznacza grubszy ogon niż rozkładu normalnego. Dodatnia skośność świadczy o tym, że prawy ogon jest grubszy od lewego. Możemy wnioskować, że ekstremalne wartości strat są obserwacjami nietypowymi, a rozkład jest gruboogonowy.

14 8 Rozdział 2. Dane (a) Human (b) Process (c) Relationship (d) Technology (e) External Rysunek 2.2. Liczba strat w poszczególnych grupach

15 Rozdział 3 Dobór rozkładu Aby skutecznie móc prognozować przyszłe straty operacyjne potrzebny jest model strat. Do jego stworzenia zostanie użyta baza danych IC 2 Operational Loss Database First (patrz rozdział 2). Model będzie składał się z dwóch części: modelu wielkości straty i modelu frekwencji występowania szkód. Aby uzasadnić, że modelowanie osobno wielkości i liczby strat jest konieczne posłużmy się przykładem [7]. Załóżmy, że w celu uniknięcia ataku hakerów na stronę internetową firmy instalujemy zaporę sieciową (firewall). Na pewno wpłynie on na ilość skutecznych ataków hakerskich, jednak jeśli niepożądana osoba złamie zabezpieczenia, szkody jakie poniesie firma prawdopodobnie będą podobnie dotkliwe jak w przypadku, gdyby zapora nie była zainstalowana. Podobnie można znaleźć przykład działania, które ograniczny wielkość szkody, ale nie częstotliwość jej występowania. Przyjmujemy następującą definicję: Definicja 1. Model strat [3] 1. Proces wielkości straty: Zmienne (X k ) k N są dodatnie, niezależne i pochodzą z jednego rozkładu (iid). Opisują wielkość losowo występującej straty. 2. Proces frekwencji występowania szkody: N t jest losową liczbą strat, które wystąpiły w przedziale czasowym [0, t], gdzie t 0. Proces liczący (N t ) t 0 jest generowany przez sekwencję punktów (T n ) n 1 nieujemnych zmiennych losowych spełniających nierówność: 0 T 1 T 2... oraz N t = sup{n 1 : T n t}, t Procesy wielkości straty i frekwencji występowania strat są niezależne 4. Proces zagregowanej straty: N t S t = X i, t 0 i=1 W ubezpieczeniach taki model nosi nazwę modelu ryzyka kolektywnego. Dane podzielone są na 5 grup związanych z przyczyną powstania szkody. W związku z tym stworzone zostanie 5 modeli, po jednym dla każdej grupy ryzyka.

16 10 Rozdział 3. Dobór rozkładu 3.1. Rozkład wielkości szkody Pierwszą próbą dobrania modelu do wielkości straty będzie dobór pewnego rozkładu gruboogonowego przy użyciu metody największej wiarogodności [4]. Do estymacji parametrów użyte zostały algorytmy zaimplementowane w środowisku MatLab. Wybrano 4 rozkłady najlepiej dopasowujące się do danych, a następnie przy pomocy testu Kołmogorowa-Smirnowa (KS) porównano dystrybuanty empiryczne 1 z dystrybuantami rozkładów o wyestymowanych parametrach (wykresy dystrybuant zawiera rysunek 3.1). Tabela 3.1 przedstawia p-wartości testu KS. Tabela 3.1. Test Kołmogorowa-Smirnowa rozkład Human Process Relationship Technology External lognormalny weibulla 1.49e wykładniczy 1.71e e e e e-69 gamma 1.94e e e e-9 Jedynie rozkłady lognormalny i Weibulla mogą być uznane za dobrze opisujące wielkość szkody. Aby sprawdzić czy dopasowanie jest dobre w obszarze ogonowym rozkładu, przeprowadzimy test Andersona-Darlinga. Statystyka A dla próby X 1,..., X n ma następującą postać: S = n k=1 2k 1 n [log (F (X k )) + log (1 F (X n+1 k ))], A = n S, (3.1) gdzie F jest dystrybuantą rozkładu teoretycznego. Otrzymane wartości przedstawione są w tabeli 3.2. Tabela 3.2. Test Andersona-Darlinga rozkład Human Process Relationship Technology External lognormalny 1.22 (0.75) 0.78 (0.76) 1.48 (0.73) 0.76 (0.74) 1.60 (0.75) weibulla 7.72 (0.76) 1.71 (0.76) 3.52 (0.75) 0.90 (0.74) 2.22 (0.73) Wartości statystyki należy porównać z otrzymanymi metodą Monte Carlo wartościami krytycznymi, które podano w nawiasach. Wszystkie wartości w 1 Dystrybuantą empiryczną ciągu zmiennych losowych X 1,..., X n nazywamy ˆF X (x) = 1 n n i=1 1 {Xi<x}

17 3.1. Rozkład wielkości szkody 11 (a) Human (b) Process (c) Relationship (d) Technology (e) External Rysunek 3.1. Dystrybuanta empiryczna rozkładu wraz z dopasowanymi dystrybuantami teoretycznymi tabeli 3.2 są większe od odpowiednich wartości krytycznych, co oznacza, że żaden z rozkładów nie opisuje dobrze ogona rozkładu strat. Potrzebne będą modele lepiej opisujące ten rejon, ponieważ odpowiada on stratom, których wystąpienie jest mało prawdopodobne, jednak jeśli się pojawią, ich wartość będzie ekstremalna. To właśnie straty tego rodzaju powodują największe spustoszenia w finansach firm i przewidywanie ich będzie jednym z celów ninejszej pracy.

18

19 Rozdział 4 Wykorzystanie teorii wartości ekstremalnych (EVT) W tym rozdziale przedstawiona zostanie metoda doboru modelu GP D (uogólniony rozkład Pareto) do ogona rozkładu wielkości strat X z wykorzystaniem teorii wartości ekstremalnych (patrz dodatek A). Dystrybuanta rozkładu GP D przedstwia się następująco: 1 ( ) 1 + ξ x µ 1 ξ, jeśli ξ 0 GP D ξ,σ,µ (x) = σ 1 exp ( ) (4.1) x σ, jeśli ξ = 0 Używana będzie również dwuparametrowa wersja uogólnionego rozkładu Pareto: GP D ξ,σ, która jest równoważna GPD ξ,σ, Wybór progu Jak wspomniano w poprzednim rozdziale, część ogonowa rozkładu strat jest najbardziej istotna przy ocenie ryzyka operacyjnego. Straty z tego obszaru występują rzadko, ale charakteryzują się dużymi wartościami. Metoda wartości ekstremalnych polega na modelowaniu tylko ogona rozkładu. Kluczowy będzie odpowiedni wybór progu u. Wartości poniżej progu są ignorowane, a te powyżej modelowane jednym z rozkładów wartości ekstremalnych. W niniejszej pracy wykorzystany zostanie uogólniony rozkład Pareto (GPD), ponieważ jest on najczęściej używany do modelowania strat operacyjnych. Rysunek 4.1 przedstawia ideę podziału danych na dane poniżej i powyżej progu u. W kolejnych paragrafach zostaną przedstawione najpopularniejsze metody wyboru odpowiedniej wartości progu Mean Excess Plot Użytecznym narzędziem do oceny gruboogonowej natury rozkładu jest zastosowanie tzw. wykresu średniej nadwyżki ponad próg mean excess. Estymatorem funkcji e(u) = E(X u X > u) jest e n (u) = 1 #{1 i n : X i > u} n (X i u) + (4.2) i=1 Wykres mean excess dla rozkładów gruboogonowych jest liniowy i rosnący, rozkładów wykładniczych jest stały, natomiast rozkłady lekkoogonowe charakteryzują się wykresem malejącym do zera. Na rysunku 4.2 przedstawiono wykres estymatora (4.2) w zależności od progu u.

20 14 Rozdział 4. Wykorzystanie teorii wartości ekstremalnych (EVT) Rysunek 4.1. Straty ponad progiem u Metoda wyboru progu oparta na wykresie mean excess opiera się na wyborze miejsca, od którego wykres staje się liniowy. Ignorujemy prawą część wykresu, gdzie jego punkty charakteryzują się dużym rozrzutem, ponieważ wynika to z zastosowanej techniki - w końcowej fazie algorytmu średnia obliczana jest na podstawie tylko kilku wartości Wykres estymatora parametru kształtu Ta metoda polega na estymowaniu parametru kształtu w zależności od wyboru progu. Na rysunku 4.3 Przedstawiono wartości estymatora największej wiarogodności parametru ξ wraz z 95% przedziałami ufności. W idealnym przypadku wykresy powinny się stabilizować powyżej pewnej wartości progu. Powyższa analiza została przeprowadzona na podstawie [11] Wykres Gertensgarbe-Wernera Powyższe testy charakteryzują się małą dokładnością wyboru odpowiedniego progu, ponieważ pożądana wartość, którą trzeba odczytywać z wykresu, nie zawsze jest łatwo zauważalna. Metoda Gertensgarbe-Wernera jest pod tym względem o wiele bardziej jednoznaczna. Zgodnie z [5] należy przeprowadzić następującą procedurę: Obliczamy różnice i pomiędzy kolejnymi statystykami pozycyjnymi X [1], X [2],..., X [n] : i = X [i] X [i 1], i = 2, 3,..., n Ideą metody jest założenie, że zachowanie różnic odpowiadających wartościom ekstremalnym będzie inne, niż to odpowiadające wartościom nieekstremalnym. Miejsce zmiany zachowania będzie widoczne na wykresie wartości

21 4.1. Wybór progu 15 (a) Human (b) Process (c) Relationship (d) Technology (e) External Rysunek 4.2. Estymator warunkowej wartości oczekiwanej wielkości straty ponad progiem i, i = 2, 3,..., n. W celu zidentyfikowania tego punktu zastosujemy sekwencyjną wersję testu Manna-Kendalla. W tym teście znormalizowany szereg wartości U i zdefiniowany jest następująco [5]: U i = U i i(i 1) 4 i(i 1)(i+5) 72 gdzie Ui = i n k, a n k jest liczbą wartości 1,..., k mniejszych od k. k=1 Kolejna seria U p jest obliczana w oparciu o tą samą procedurę zastosowaną

22 16 Rozdział 4. Wykorzystanie teorii wartości ekstremalnych (EVT) (a) Human (b) Process (c) Relationship (d) Technology (e) External Rysunek 4.3. Wartości estymatora największej wiarogodności parametru kształtu w zależności od progu do szeregu różnic od końca do początku, n,..., 1, zamiast od początku do końca. Punkt przecięcia się obu wykresów odpowiada prawdopodobnemu punktowi zwrotnemu. Na rysunku 4.4 przedstawiono wykresy Gertensgarbe-Wernera dla każdej z grup ryzyka. Tabela 4.1 przedstawia pożądane wartości progu u, które odczytujemy jako wartość statystyki X k, gdzie k jest odciętą punktu przecięcia się wykresów.

23 4.2. Dopasowanie Modelu GPD 17 (a) Human (b) Process (c) Relationship (d) Technology (e) External Rysunek 4.4. Wykres Gertensgarbe-Wernera z zaznaczonym punktem przecięcia Tabela 4.1. Pożądana wartość progu Human Process Relationship Technology External u 9.90e7 5.01e8 1.38e8 9.40e7 1.59e Dopasowanie Modelu GPD Zgodnie z twierdzeniem Balkema i de Haana oraz Pickandsa, dane powyżej wybranego omawianymi w rozdziale 4.1 metodami progu u, powinny pochodzić z rozkładu uogólnionego Pareto. Niektóre źródła (takie jak [10]) proponują wybór takiego progu, aby ponad nim znalazło się jedynie 10% obserwacji. Tabela 4.2 przedstawia p-wartości testu Kołmogorowa-Smirnowa badającego zgodność rozkładu GPD, o wyestymowanych za pomocą metody ML współczynnikach, z empirycznym rozkładem strat X u. Źródła takie jak

24 18 Rozdział 4. Wykorzystanie teorii wartości ekstremalnych (EVT) [15, 16] polecają użycie estymatorów największej wiarogodności do estymacji parametrów modelu. Tabela 4.2. P-wartości testu KS próg Human Process Relationship Technology External u tab X 90% Testy przeprowadzono na poziomie istotności We wszystkich przypadkach możemy uznać modele za dobrze dopasowane do danych rzeczywistych, ponieważ p-wartości są wyższe od zadanego poziomu istotności. Widać jednocześnie, że wybór wyższego progu powoduje lepsze dopasowanie. Należy jednak pamiętać, że za wysoki próg spowoduje odrzucenie zbyt wielu danych. Może to spowodować istotne zaniżenie sumarycznej wielkości szkody w zadanym okresie czasowym Skalowanie rozkładu W rozdziale 4.2 dobrano rozkład do danych obciętych z dołu przez próg u. W celu uzyskania rozkładu całych (nieobciętych) danych chcemy przedstawić dystrybuantę F strat X poprzez dystrybuantę rozkładu GP D, dopasowaną do danych X u (ozn. F u ). Postępujemy zgodnie z [5] (patrz też [2]). Oznaczmy F = 1 F, wtedy F u (x) = P [X u x X > u] = F (u + x). F (u) Stąd i z aproksymacji rozkładem GP Dˆξ,ˆσ wartości ponad progiem u otrzymujemy: F (u + x) F (u) ( 1 GP Dˆξ,ˆσ (x) ) Jako estymatora F (u) można użyć dystrybuanty empirycznej w punkcie u otrzymując: F (u + x) = N ( u 1 GP n Dˆξ,ˆσ (x) ) gdzie N u oznacza liczbę obserwacji ponad progiem u, a n liczbę wszytskich obserwacji. Podsumowując możemy oszacować prawdopodobieństwo, że strata będzie większa niż y, gdzie y > u jako: F (y) = N ( u 1 GP n Dˆξ,ˆσ (y u) ) (4.3) Łatwo zauważyć, że F jest również dystrybuantą rozkładu GPD z parametrami: ξ = ˆξ ( σ = ˆσ 1 N u n )ˆξ µ = u ˆσˆξ ( 1, 1 N u n )ˆξ. (4.4)

25 4.4. Dokładność doboru modelu 19 Uwaga: Innymi słowy ogon rozkładu wielkości strat X X > u jest modelowany ogonem dystrybuanty F, czyli P (X > y) F (y), dla y > u (4.5) Uwaga: Wprowadzamy następujące notacje: Definicja 2. Poprzez GP D ξ,σ rozumieć będziemy warunkowy rozkład uogólniony Pareto dobrany do danych X u X > u Poprzez całościowy GP D (GP D ξ,σ,µ ) rozumieć będziemy rozkład przeskalowany zgodnie z wzorem (4.4) Dokładność doboru modelu W poprzednim paragrafie przedstawiono p-wartości testu KS porównującego wartość dystrybuanty empirycznej z dystrybuantą rozkładu GPD danych X u. Po przeskalowaniu modelu nie możemy już użyć tego testu, ponieważ dystrybuanta dobrana jest tylko do ogona rozkładu. W tym paragrafie omówione zostaną sposoby oceny dokładności doboru modelu do danych X opisujących wielkości strat Test KS porównujący rozkłady dwóch próbek Zgodnie ze wzorami (4.3) i (4.4) możemy wygenerować próbkę z rozkładu F (y) GP D ξ, σ, µ i porównać rozkład jej ogona (GP D ξ, σ, µ (y) dla y > u) z rozładem ogona strat X (F (y) dla y > u). Rozkłady obu próbek możemy porównać przy użyciu tesu Kołmogorowa-Smirnowa. Tabela 4.3 przedstawia średnie p-wartości zwracane przez test. Tabela 4.3. P-wartości testu KS próg Human Process Relationship Technology External u tab X 90% Notacja u tab. 4.1 oznacza, że jako próg u przyjęto wartość obliczoną na podstawie wykresu Gertensgarbe-Wernera. X 90% oznacza u równe kwantylowi próbkowemu zmiennej X na poziomie 90%. Wszytskie p-wartości są większe od zadanego poziomu istotności 0.05, dlatego w żadnym z przypadków nie mamy podstaw do odrzucenia hipotezy o zgodności rozkładu teoretycznego z rozkładem empirycznym Testy graficzne Na rysunku 4.5 przedstawiono graficzne porównanie obu dystrybuant. Jako próg przyjęto wartości wynikające z tabeli 4.1. Analogiczne porównanie dla ogona powyżej progu u = X 90% widoczne jest na rysunku 4.6. Testy graficzne nie są testami dokładnymi, jednak jesteśmy w stanie stwierdzić, że dopasowanie rozkładu w obszarze ogona jest dużo lepsze niż

26 20 Rozdział 4. Wykorzystanie teorii wartości ekstremalnych (EVT) (a) Human (b) Process (c) Relationship (d) Technology (e) External Rysunek 4.5. Porównanie ogonów dystrybuant empirycznej i teoretycznej rozkładu wielkości straty. Wielkość progu wynikająca z tabeli 4.1 dopasowanie przedstawione na rysunku 3.1. Na rysunku 4.5(a) widać rozbieżność od około 97%-towego kwantyla. Obserwacja tej samej części rysunku 4.6 pozwala stwierdzić, że użycie wyższego progu, niż ten wynikający z tabeli 4.1 da lepsze dopasowanie rozkładu GP D ξ, σ, µ do ogona rozkładu empirycznego zmiennej X. Ostatecznie zdecydowano się dla danych z grupy ryzyka Human wybrać próg u =

Metody oceny ryzyka operacyjnego

Metody oceny ryzyka operacyjnego Instytut Matematyki i Informatyki Wrocław, 10 VII 2009 Bazylejski Komitet Nadzoru Bankowego Umowa Kapitałowa - 1988 Opracowanie najlepszych praktyk rynkowych w zakresie zarządzania ryzykiem Nowa Umowa

Bardziej szczegółowo

Szacowanie miary zagrożenia Expected Shortfall dla wybranych instrumentów polskiego rynku kapitałowego

Szacowanie miary zagrożenia Expected Shortfall dla wybranych instrumentów polskiego rynku kapitałowego Radosław Pietrzyk Katedra Inwestycji Finansowych i Ubezpieczeń Akademia Ekonomiczna we Wrocławiu Szacowanie miary zagrożenia Expected Shortfall dla wybranych instrumentów polskiego rynku kapitałowego 1.

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody

Bardziej szczegółowo

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport Michał Krzemiński Streszczenie Projekt dotyczy metod generowania oraz badania własności statystycznych ciągów liczb pseudolosowych.

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r. Matematyka ubezpieczeń majątkowych 0.0.005 r. Zadanie. Likwidacja szkody zaistniałej w roku t następuje: w tym samym roku z prawdopodobieństwem 0 3, w następnym roku z prawdopodobieństwem 0 3, 8 w roku

Bardziej szczegółowo

Ryzyko operacyjne metoda zaawansowana. Wyzwania

Ryzyko operacyjne metoda zaawansowana. Wyzwania Ryzyko operacyjne metoda zaawansowana. Wyzwania dr Paweł Matkowski LUKAS BANK SA 1 Ryzyko operacyjne: up-date Dokumenty regulacyjne status: Dyrektywy europejskie: 2006/48/WE, 2006/49/WE Projekty uchwał

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład XIV: Metody Monte Carlo 19 stycznia 2016 Przybliżone obliczanie całki oznaczonej Rozważmy całkowalną funkcję f : [0, 1] R. Chcemy znaleźć przybliżoną wartość liczbową całki 1 f (x) dx. 0 Jeden ze

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

STATYSTYKA

STATYSTYKA Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Statystyka w przykładach

Statystyka w przykładach w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

W4 Eksperyment niezawodnościowy

W4 Eksperyment niezawodnościowy W4 Eksperyment niezawodnościowy Henryk Maciejewski Jacek Jarnicki Jarosław Sugier www.zsk.iiar.pwr.edu.pl Badania niezawodnościowe i analiza statystyczna wyników 1. Co to są badania niezawodnościowe i

Bardziej szczegółowo

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k = Matematyka ubezpieczeń majątkowych 0.0.006 r. Zadanie. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k 5 Pr( N = k) =, k = 0,,,... 6 6 Wartości kolejnych szkód Y, Y,, są i.i.d.,

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

EXPECTED SHORTFALL W OCENIE RYZYKA AKCYJNYCH FUNDUSZY INWESTYCYJNYCH

EXPECTED SHORTFALL W OCENIE RYZYKA AKCYJNYCH FUNDUSZY INWESTYCYJNYCH Radosław Pietrzyk Uniwersytet Ekonomiczny We Wrocławiu EXPECTED SHORTFALL W OCENIE RYZYKA AKCYJNYCH FUNDUSZY INWESTYCYJNYCH 1. Wstęp Rok 2008 zapoczątkował kryzys na rynkach finansowych. Duża niestabilność

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 4 1 / 23 ZAGADNIENIE ESTYMACJI Zagadnienie

Bardziej szczegółowo

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS Folia Univ. Agric. Stetin. 007, Oeconomica 54 (47), 73 80 Mateusz GOC PROGNOZOWANIE ROZKŁADÓW LICZBY BEZROBOTNYCH WEDŁUG MIAST I POWIATÓW FORECASTING THE DISTRIBUTION

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r. Matematyka ubezpieczeń majątkowych..00 r. Zadanie. Proces szkód w pewnym ubezpieczeniu jest złożonym procesem Poissona z oczekiwaną liczbą szkód w ciągu roku równą λ i rozkładem wartości szkody o dystrybuancie

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych 1.10.2012 r.

Matematyka ubezpieczeń majątkowych 1.10.2012 r. Zadanie. W pewnej populacji każde ryzyko charakteryzuje się trzema parametrami q, b oraz v, o następującym znaczeniu: parametr q to prawdopodobieństwo, że do szkody dojdzie (może zajść co najwyżej jedna

Bardziej szczegółowo

Monte Carlo, bootstrap, jacknife

Monte Carlo, bootstrap, jacknife Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych. Wprowadzenie Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Detekcja rozkładów o ciężkich ogonach

Detekcja rozkładów o ciężkich ogonach Detekcja rozkładów o ciężkich ogonach J. Śmiarowska, P. Jamer Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska 24 kwietnia 2012 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja

Bardziej szczegółowo

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N = HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Ćwiczenia Zarządzanie Ryzykiem. dr hab. Renata Karkowska, ćwiczenia Zarządzanie ryzykiem 1

Ćwiczenia Zarządzanie Ryzykiem. dr hab. Renata Karkowska, ćwiczenia Zarządzanie ryzykiem 1 Ćwiczenia Zarządzanie Ryzykiem 1 VaR to strata wartości instrumentu (portfela) taka, że prawdopodobieństwo osiągnięcia jej lub przekroczenia w określonym przedziale czasowym jest równe zadanemu poziomowi

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r. Zadanie 1. W pewnej populacji podmiotów każdy podmiot narażony jest na ryzyko straty X o rozkładzie normalnym z wartością oczekiwaną równą μ i wariancją równą. Wszystkie podmioty z tej populacji kierują

Bardziej szczegółowo

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki

Bardziej szczegółowo

Biostatystyka, # 3 /Weterynaria I/

Biostatystyka, # 3 /Weterynaria I/ Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

Spacery losowe generowanie realizacji procesu losowego

Spacery losowe generowanie realizacji procesu losowego Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego Rozdział 1 Statystyki Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego X = (X 1,..., X n ). Uwaga 1 Statystyka jako funkcja wektora zmiennych losowych jest zmienną losową

Bardziej szczegółowo

Cenzurowanie danych w bankowości

Cenzurowanie danych w bankowości Cenzurowanie danych w bankowości Ryzyko operacyjne Tomasz Szkutnik Uniwersytet Ekonomiczny w Katowicach Katedra Statystyki, Ekonometrii i Matematyki 2017 Cenzurowanie danych w bankowości Plan wystąpienia

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Wykład 7 Testowanie zgodności z rozkładem normalnym

Wykład 7 Testowanie zgodności z rozkładem normalnym Wykład 7 Testowanie zgodności z rozkładem normalnym Wrocław, 05 kwietnia 2017 Rozkład normalny Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie normalnym określonym przez dystrybuantę

Bardziej szczegółowo

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie METODY ESTYMACJI PUNKTOWEJ X 1,..., X n - próbka z rozkładu P θ, θ Θ, θ jest nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie P θ. Definicja. Estymatorem

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: przedmiot obowiązkowy w ramach treści kierunkowych, moduł kierunkowy ogólny Rodzaj zajęć: wykład, ćwiczenia I KARTA PRZEDMIOTU CEL PRZEDMIOTU

Bardziej szczegółowo

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =. Prawdopodobieństwo i statystyka 3..00 r. Zadanie Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX 4 i EY 6. Rozważamy zmienną losową Z. X + Y Wtedy (A) EZ 0,

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Symulacyjne metody analizy ryzyka inwestycyjnego wybrane aspekty. Grzegorz Szwałek Katedra Matematyki Stosowanej Uniwersytet Ekonomiczny w Poznaniu

Symulacyjne metody analizy ryzyka inwestycyjnego wybrane aspekty. Grzegorz Szwałek Katedra Matematyki Stosowanej Uniwersytet Ekonomiczny w Poznaniu Symulacyjne metody analizy ryzyka inwestycyjnego wybrane aspekty Grzegorz Szwałek Katedra Matematyki Stosowanej Uniwersytet Ekonomiczny w Poznaniu Plan prezentacji 1. Opis metody wyceny opcji rzeczywistej

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,

Bardziej szczegółowo

Rachunek Prawdopodobieństwa Anna Janicka

Rachunek Prawdopodobieństwa Anna Janicka Rachunek Prawdopodobieństwa Anna Janicka wykład XIV, 24.01.2017 ŁAŃCUCHYMARKOWA CD. KRÓTKIE INFO O RÓŻNYCH WAŻNYCH ROZKŁADACH Plan na dzisiaj Łańcuchy Markowa cd. Różne ważne rozkłady prawdopodobieństwa,

Bardziej szczegółowo

Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014

Zmienne losowe. dr Mariusz Grządziel Wykład 12; 20 maja 2014 Zmienne losowe dr Mariusz Grządziel Wykład 2; 20 maja 204 Definicja. Zmienna losowa nazywamy dyskretna (skokowa), jeśli zbiór jej wartości x, x 2,..., można ustawić w ciag. Zmienna losowa X, która przyjmuje

Bardziej szczegółowo

Ogólnopolska Konferencja Aktuarialna Zagadnienia aktuarialne teoria i praktyka Warszawa, IE SGH 2009

Ogólnopolska Konferencja Aktuarialna Zagadnienia aktuarialne teoria i praktyka Warszawa, IE SGH 2009 Rafał M. Łochowski Szkoła Główna Handlowa w Warszawie O pewnym modelu pojawiania się szkód Ogólnopolska Konferencja Aktuarialna Zagadnienia aktuarialne teoria i praktyka Warszawa, IE SGH 2009 Modele pojawiania

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r. Matematyka ubezpieczeń majątkowych 4.04.0 r. Zadanie. Przy danej wartości λ parametru ryzyka Λ liczby szkód generowane przez ubezpieczającego się w kolejnych latach to niezależne zmienne losowe o rozkładzie

Bardziej szczegółowo

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Przetwarzanie Sygnałów Studia Podyplomowe, Automatyka i Robotyka. Wstęp teoretyczny Zmienne losowe Zmienne losowe

Bardziej szczegółowo

Ważne rozkłady i twierdzenia c.d.

Ważne rozkłady i twierdzenia c.d. Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym

Bardziej szczegółowo

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną: Zadanie. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną: Pr Pr ( = k) ( N = k ) N = + k, k =,,,... Jeśli wiemy, że szkód wynosi: k= Pr( N = k) =, to prawdopodobieństwo,

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje

Bardziej szczegółowo

Niezawodność i diagnostyka projekt. Jacek Jarnicki

Niezawodność i diagnostyka projekt. Jacek Jarnicki Niezawodność i diagnostyka projekt Jacek Jarnicki Zajęcia wprowadzające 1. Cel zajęć projektowych 2. Etapy realizacji projektu 3. Tematy zadań do rozwiązania 4. Podział na grupy, wybór tematów, organizacja

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1). PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem

Bardziej szczegółowo

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO Zał. nr 4 do ZW WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA STOSOWANA Nazwa w języku angielskim APPLIED STATISTICS Kierunek studiów (jeśli dotyczy): Specjalność

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

6.4 Podstawowe metody statystyczne

6.4 Podstawowe metody statystyczne 156 Wstęp do statystyki matematycznej 6.4 Podstawowe metody statystyczne Spóbujemy teraz w dopuszczalnym uproszczeniu przedstawić istotę analizy statystycznej. W szczególności udzielimy odpowiedzi na postawione

Bardziej szczegółowo

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej KATEDRA MATEMATYKI TEMAT PRACY: ROZKŁAD NORMALNY ROZKŁAD GAUSSA AUTOR: BARBARA MARDOSZ Kraków, styczeń 2008 Spis treści 1 Wprowadzenie 2 2 Definicja

Bardziej szczegółowo

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r. Zadanie. W pewnej populacji kierowców każdego jej członka charakteryzują trzy zmienne: K liczba przejeżdżanych kilometrów (w tysiącach rocznie) NP liczba szkód w ciągu roku, w których kierowca jest stroną

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r. Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje

Bardziej szczegółowo

Metody probabilistyczne

Metody probabilistyczne Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo