WYKŁAD: Szeregi czasowe II. Zaawansowane Metody Uczenia Maszynowego
|
|
- Kornelia Popławska
- 5 lat temu
- Przeglądów:
Transkrypt
1 WYKŁAD: Szeregi czasowe II Zaawansowane Metody Uczenia Maszynowego
2 Zwroty indeksów finansowych Y t : indeks finansowy w momencie t (wartość waloru, kurs walutowy itp). Określimy zwrot indeksu finansowego jako jego relatywną zmianę. Z reguły rozpatruje się dwa rodzaje zwrotów: Zwrot prosty Y t w momencie t (simple return) jest zdefiniowany jako R t = Y t Y t 1 Y t 1 Zwrot prosty jest zmianą Y t, Y t = Y t Y t 1 względem wartości Y t 1. Znacznie częściej używanym zwrotem jest zwrot logarytmiczny Y t w momencie t (dla okresu czasu h = 1) zdefiniowany jako R t = log(y t /Y t 1 ) = (1 B) log Y t = log Y t = log(1+ Y t Y t 1 Y t 1 ) R t, gdzie przybliżona rowność zachodzi, gdy wartość R t jest mała. (BY t = Y t 1.)
3 Zwroty indeksów finansowych cd Analogicznie definiuje się zwrot logarytmiczny dla okresu czasu h: R t,h = log(y t /Y t h ). Kilka użytecznych własności powoduje, że zwroty logarytmiczne są częściej używane. Suma zwrotów logarytmicznych dla h kolejnych jednostek czasu daje zwrot logarytmiczny dla okresu czasu h R t R t h+1 = log(y t /Y t h ). Zwroty logarytmiczne są symetryczne: ujemna wartość zwrotu logarytmicznego równa co do wartości bezwzględnej dodatniej wartości w poprzednim momencie oznacza powrót do tej samej wartości indeksu. Np. R t = log( Y t Y t 1 ) = 0, 5 R t+1 = log( Y t+1 Y t ) = 0, 5 wtedy Y t+1 = exp( 0, 5)Y t = exp( 0, 5) exp(0, 5)Y t 1 = Y t 1.
4 Inaczej dla zwrotów prostych R t = (Y t Y t 1 ) Y t 1 = 0.5 R t+1 = (Y t+1 Y t ) Y t = 0.5, then Y t+1 = 0.5Y t = 0, 5 1, 5Y t 1 = 0.75Y t 1. Historycznie pierwszym modelem dla zwrotów (R t ) była hipoteza bładzenia przypadkowego: Hipoteza bładzenia przypadkowego R t jest ciągiem niezależnych zmiennych losowych o tym samym rozkładzie. Niezgodna z faktami empirycznymi, które później sformułowano w postaci praw (stylizowanych faktów) zwrotów finansowych.
5 Stylizowane fakty o zwrotach indeksów finansowych Analiza danych finansowych prowadzi do sformułowania trzech faktów o zwrotach: Ogony rozkładu zwrotów R t maleją wolniej niż rozkładu N(0, 1); R t są nieskorelowane, ale Rt 2 są skorelowane, Duże zmiany kolejnych wartości R t często następują po poprzednich dużych zmianach indeksu. Zauważmy, że drugi i trzeci z faktów przeczy hipotezie błądzenia przypadkowego. Zdefiniujmy zmienność (volatility) indeksu jako pewną miarę rozproszenia R t, z reguły odchylenie standardowe, ale, w zależności od kontekstu, rozumiane bezwarunkowo lub warunkowo pod warunkiem przeszłości procesu.
6 Pierwszy fakt stylizowany Rozpatrzmy pierwszy fakt stylizowany dla indeksu S&P500. Dla tego szeregu min R t = 23%. Przy założeniu normalności prawdopodobieństwo, że otrzymamy taką wartość lub większą wynosi 2, , to powinno zdarzyć się nie częściej raz na lat (wiek ziemi oceniany jest na 10 7 lat). Przeczy to w oczywisty sposób normalności rozkładu zwrotów. Poniżej histogram indeksu S&P500 (w procentach i obciety na 4%) z nałożoną gęstością rozkładu normalnego ze średnia i wariancją takimi, jak parametry empiryczne.
7 Poniżej histogram indeksu S&P500 (w procentach i obciety na 4%) z nałożoną gęstościa rozkładu normalnego ze średnia i wariancją takimi, jak parametry empiryczne. Histogram of SPtrunc Density SPtrunc Zauważmy, że pik rozkładu zwrotów jest wyższy niż pik referencyjnego rozkładu normalnego. Jednocześnie jego ogony są grubsze niż rozkładu normalnego. Ponadto ramiona rozkładu empirycznego są niższe niż dla rozkładu normalnego. Dwie pierwsze obserwacje oznaczają, że jest więcej dni z mniejszą i większą zmiennością indeksu w rzeczywistości niż dla dopasowanego rozkładu normalnego.
8 y y y y Spróbujmy dopasować inny rozkład niż rozkład normalny. Rysunki poniżej przedstawiają wykresy kwantylowe dla rozkładu normalnego vs rozkład empiryczny i analogiczne wykresy dla rozkładu z 3,4 i 5 stopniami swobody (pokazanymi zgodnie z ruchem zegara) norm quantiles t quantiles t quantiles t quantiles Najlepsze dopasowanie uzyskuje się dla rozkładu t z 4 st. swobody.
9 Rysunek poniżej pokazuje zwroty dla Y będącego indeksem S&P500 od początku wieku do 31 sierpnia 2012 roku (na podstawie cen zamknięcia). Skupiska zmienności są bardzo wyraźnie. y Index
10 Drugi fakt stylizowany stwierdza, że zwroty są nieliniowo zależne. Tak dzieje się również w następującym przykładzie. Jesli X jest symetryczną zmienna losową i rozpatrzymy parę zmiennych X i Y = X 2. T e zmienne są oczywiście zależne, ale nie liniowo zależne: ρ(x, Y ) = 0, gdyż Cov(X, Y ) = EX X 2 EXEX 2 = 0. W takich sytuacjach współczynnik korelacji nie wykryje zależności między zmiennymi. Podobne zjawisko występuje dla zwrotów indeksów finansowych. Rozpatrzmy wykresy ACF dla Y = S&P500 i jego kwadratu.
11 Wykres ACF sugeruje, że zwroty Y są nieskorelowane. Jednakże, powtarzająca się zależność jest widoczna na drugim rysunku. AdjClose ACF Lag AdjClose ACF Lag
12 Procesy ARCH(p) Zdefiniujemy teraz klasę procesów ARCH (Autoregressive Conditionally Heteroscedastic) wprowadzonych przez Engle a w 1982 dla modelowania inflacji w Wielkiej Brytanii. Niech p N. (X t ) jest procesem ARCH(p) jeśli X t = σ t Z t, σ 2 t = α 0 +α 1 X 2 t 1+ +α p X 2 t p, α 0, α 1,..., α p 0, gdzie Z t jest silnym WN(0, 1) (ciąg niezależnych zmiennych losowych) i Z t jest niezależne od X s, s < t. Zauważmy, że warunkując dostaniemy EX t = EE(σ t Z t X s, s < t) = Eσ t E(Z t X s, s < t) = Eσ t E(Z t )) = 0
13 Podobnie uzyskujemy Var(X t X s, s < t) = α 0 + α 1 X 2 t α p X 2 t p. Tak więc Var(X t X s, s < t) jest kombinacją afiniczną poprzednich wartości X 2 s. Zatem duże wartości X 2 t 1,... X 2 t p implikują dużą wartość Var(X t X s, s < t). Odpowiada to drugiemu faktowi stylizowanemu. Własności procesu ARCH(p) Stacjonarny proces ARCH(p) istnieje gdy p j=1 α i < 1. Wtedy EX t = 0 VarX t = α 0 1 p j=1 α. i
14 Własności procesu ARCH(p) cd X t jest słabym białym szumem (ciągiem nieskorelowanych zmiennych losowych). Jeśli EZt 4 < to p Xt 2 = α 0 + α i Xt i 2 + ε t, i=1 ( ) gdzie ε t = (Zt 2 1)(α 0 + p i=1 α ixt i 2 ) jest słabym białym szumem. Kurtoza X t jest nie mniejsza niż kurtoza Z t : gdzie κ X = EX 4 /σ 4 X κ Xt κ Zt, (miara grubości ogona rozkładu). Własność (*) jest ważna w identyfikacji: Xt 2 zachowuje się jak proces AR(p)!
15 Procesy GARCH(p, q) Proces GARCH(p, q) : uogólniony ARCH(p) (X t ) t Z jest procesem GARCH(p, q) (Generalized ARCH) jeśli X t = σ t Z t, (1) σt 2 = p q α 0 + α i Xt i 2 + β j σt j, 2 (2) i=1 gdzie, jak poprzednio Z t jest niezależny od of X s, s < t, p, q N, p 1 wszystkie współczynniki α 0, α i, β j są nieujemne. j=1
16 Procesy GARCH(p, q) Własności procesu GARCH(p, q) Stacjonarny proces GARCH(p, q) istnieje gdy Wtedy p α i + j=1 EX t = 0 VarX t = q β j < 1. j=1 Var(X t X t s, σ 2 t s) = α 0 + α 0 1 p i=1 α i q j=1 β j p α i Xt i 2 + β j σt j 2 i=1 zależność wariancji warunkowej od σ 2 t j.
17 Własności procesu GARCH(p, q) cd Jeśli EZ 4 t < to p q Xt 2 = α 0 + (α i + β j )Xt j 2 + ε t i=1 q β j ε t j, j=1 gdzie α p+j = β q+j = 0, dla j 1 i p q = max(p, q). Żeby udowodnić ostatnią równość, zauważmy, że gdzie X 2 t = σ 2 t + X 2 t σ 2 t = α 0 + p α i Xt i 2 + i=1 ε t = X 2 t σ 2 t q β j σt j 2 + ε t, Tak więc podstawiając ε t j = X 2 t j σ2 t j, otrzymujemy przedstawienie. Własność ważna w identyfikacji: kwadrat procesu GARCH(p, q) jest procesem ARMA(p, q)!. j=1
18 Modelowanie procesów niestacjonarnych Wiele procesów jest niestacjonarnych tzn. trajektorie wykazują istnienie trendu i/lub komponent sezonowych. Jak modelować takie procesy? Klasyczny addytywny model procesu niestacjonarnego X t = m t + s t + Y t, gdzie Y t jest procesem stacjonarnym w szerszym sensie o średniej 0, m t jest deterministycznym trendem i s t jest deterministycznym komponentem sezonowym (tzn istnieje takie d N, że s t+d = s t ) Jeśli s t 0, to m t może być estymowane metodami funkcji regresji, np przy użyciu średniej ruchomej lub estymatora lokalnie liniowego. Jeśli komponent sezonowy jest niezerowy, to z reguły dokonuje się wstepnej estymacji nieparametrycznej trendu z długościa okna d (przy założeniu, że d i=1 s i = 0 i d jest znane), po odjęciu estymatora trendu estymuje sie składową sezonową, a później parametryczy model dopasowany do X t ˆm t ŝ t. (procedura pięciostopniowa).
19 Procedura Holta-Wintersa Inne podejście: procedura Holta-Wintersa. Opiszemy metodę najpierw dla sytuacji s t 0. Zamiast estymacji tylko trendu m t będziemy estymowali trend i jego zminę (m t, b t ), gdzie b t oznacza zmianę trendu w momencie t. Procedura jest rekurencyjna. Niech 0 α, β 1 będą parametrami metody. Zdefiniujmy (równania H-W) { m n+1 = ( m n + b n )(1 α) + αx n+1, 0 α 1, b n+1 = ( m n+1 â n )β + (1 β) b n, 0 β 1, i kładziemy m 2 = X 2, b 2 = (X 2 X 1 ),
20 W momencie n + 1 tend estymowany jest przez kombinację wypukła trendu w momencie n + 1 (tj. m n + b n h dla h = 1) oraz wartości obserwacji X n+1. Równania H-W są rozwiązywane rekurencyjnie dla i = 3,..., n. W przypadku ogólnym chcemy estymować (m t, b t, s t ),, gdzie s t ma okres d. Równania H-W mają postać m n+1 = ( m n + b n )(1 α) + α(x n+1 ŝ n+1 d ), 0 α 1, b n+1 = ( m n+1 m n )β + (1 β) b n, 0 β 1, ĉ n+1 = (1 γ)ŝ n+1 d + γ(x n+1 m n+1 ), 0 γ 1.
21 W pierwszym równaniu wykorzystaliśmy fakt, że estymator składowej sezonowej s n+1, ktory nie jest dostępny w momencie n + 1, może być zastąpiony przez estymator ŝ n+1 d. Ponadto: m d+1 = X d+1, b d+1 = (X d+1 X 1 )/d, ŝ i = Y i (Y 1 + b d+1 (i 1)), i = 1, 2,..., d. Standardowa metoda wyboruα, β i γ to: (α 0, β 0 ) := arg min α,β,γ n i=d+1 (X i X i (α, β, γ)) 2. Estymatory Holta -Wintersa dają prognozę X n+h, mianowicie X n+h = â n + b n h + ĉ n+h d ]
22 Wygładzanie wykładnicze W przypadku gdy β = γ = 0 i tylko α 0 mamy: m n+1 = m n (1 α) + αx n+1 Rozwiązanie explicite (wygładzanie wykładnicze) t 1 m t+1 = α(1 α) j X t+1 j + (1 α) t X 1. j=0 Zauważmy, że dla estymacji m t+1 wpływ X t+1 j dany przez współczynnik α(1 α) j maleje wykładniczo, stąd nazwa metody (często wprowadzana niezależnie od metody Holta-Wintersa).
Szeregi czasowe, analiza zależności krótkoi długozasięgowych
Szeregi czasowe, analiza zależności krótkoi długozasięgowych Rafał Weron rweron@im.pwr.wroc.pl Definicje Mając dany proces {X t } autokowariancję definiujemy jako : γ(t, t ) = cov(x t, X t ) = = E[(X t
Finansowe szeregi czasowe
24 kwietnia 2009 Modelem szeregu czasowego jest proces stochastyczny (X t ) t Z, czyli rodzina zmiennych losowych, indeksowanych liczbami całkowitymi i zdefiniowanych na pewnej przestrzeni probabilistycznej
WYKŁAD: Szeregi czasowe I. Zaawansowane Metody Uczenia Maszynowego
WYKŁAD: Szeregi czasowe I Zaawansowane Metody Uczenia Maszynowego Szereg czasowy (X t ) - ciąg zmiennych losowych indeksowany parametrem t (czas). Z reguły t N lub t Z. Dotąd rozpatrywaliśmy: (X t )- ciąg
3. Analiza własności szeregu czasowego i wybór typu modelu
3. Analiza własności szeregu czasowego i wybór typu modelu 1. Metody analizy własności szeregu czasowego obserwacji 1.1. Analiza wykresu szeregu czasowego 1.2. Analiza statystyk opisowych zmiennej prognozowanej
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Analiza autokorelacji
Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.
WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki
WYKŁAD 6 Witold Bednorz, Paweł Wolff 1 Instytut Matematyki Uniwersytet Warszawski Rachunek Prawdopodobieństwa, WNE, 2010-2011 Własności Wariancji Przypomnijmy, że VarX = E(X EX) 2 = EX 2 (EX) 2. Własności
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
Stacjonarność Integracja. Integracja. Integracja
Biały szum AR(1) Słaba stacjonarność Szereg czasowy nazywamy słabo (wariancyjnie) stacjonarnym jeżeli: Biały szum AR(1) Słaba stacjonarność Szereg czasowy nazywamy słabo (wariancyjnie) stacjonarnym jeżeli:
Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania
Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład
Rozdział 1 Wektory losowe 1.1 Wektor losowy i jego rozkład Definicja 1 Wektor X = (X 1,..., X n ), którego każda współrzędna jest zmienną losową, nazywamy n-wymiarowym wektorem losowym (krótko wektorem
Stosowana Analiza Regresji
prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Modele warunkowej heteroscedastyczności
Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Racjonalne oczekiwania inwestorów P t = E(P t+1 I t ) 1 + R (1) Teoria Przykład - zwroty
3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Statystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski
Modelowanie zależności pomiędzy zmiennymi losowymi Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski P Zmienne losowe niezależne - przypomnienie Dwie rzeczywiste zmienne losowe X i Y
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Stosowana Analiza Regresji
Model jako : Stosowana Analiza Regresji Wykład XI 21 Grudnia 2011 1 / 11 Analiza kowariancji Model jako : Oprócz czynnika o wartościach nominalnych chcemy uwzględnić wpływ predyktora o wartościach ilościowych
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Prawdopodobieństwo i statystyka
Wykład XIII: Prognoza. 26 stycznia 2015 Wykład XIII: Prognoza. Prognoza (predykcja) Przypuśćmy, że mamy dany ciąg liczb x 1, x 2,..., x n, stanowiących wyniki pomiaru pewnej zmiennej w czasie wielkości
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Prawdopodobieństwo i statystyka
Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.
1 Gaussowskie zmienne losowe
Gaussowskie zmienne losowe W tej serii rozwiążemy zadania dotyczące zmiennych o rozkładzie normalny. Wymagana jest wiedza na temat własności rozkładu normalnego, CTG oraz warunkowych wartości oczekiwanych..
Heteroskedastyczość w szeregach czasowyh
Heteroskedastyczość w szeregach czasowyh Czesto zakłada się, że szeregi czasowe wykazuja autokorelację ae sa homoskedastyczne W rzeczywistości jednak często wariancja zmienia się w czasie Dobrym przykładem
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Stacjonarne procesy gaussowskie, czyli o zwiazkach pomiędzy zwykła
Stacjonarne procesy gaussowskie, czyli o zwiazkach pomiędzy zwykła autokorelacji Łukasz Dębowski ldebowsk@ipipan.waw.pl Instytut Podstaw Informatyki PAN autokorelacji p. 1/25 Zarys referatu Co to sa procesy
Zawansowane modele wyborów dyskretnych
Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów
2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona
Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru
Przyczynowość Kointegracja. Kointegracja. Kointegracja
korelacja a związek o charakterze przyczynowo-skutkowym korelacja a związek o charakterze przyczynowo-skutkowym Przyczynowość w sensie Grangera Zmienna x jest przyczyną w sensie Grangera zmiennej y jeżeli
zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych
zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych 1. [E.A 5.10.1996/zad.4] Funkcja gęstości dana jest wzorem { 3 x + 2xy + 1 y dla (x y) (0 1) (0 1) 4 4 P (X > 1 2 Y > 1 2 ) wynosi:
Estymacja parametrów rozkładu cechy
Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Modelowanie rynków finansowych
Modelowanie rynków finansowych Jerzy Mycielski WNE UW 5 października 2017 Jerzy Mycielski (WNE UW) Modelowanie rynków finansowych 5 października 2017 1 / 12 Podstawowe elementy teorii 1 racjonalne oczekiwania
Ćwiczenie 5 PROGNOZOWANIE
Ćwiczenie 5 PROGNOZOWANIE Prognozowanie jest procesem przewidywania przyszłych zdarzeń. Obszary zastosowań prognozowania obejmują np. analizę danych giełdowych, przewidywanie zapotrzebowania na pracowników,
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.
Stopy zbieżności Stopę zbieżności ciagu zmiennych losowych a n, takiego, że a n oznaczamy jako a n = o p (1 p 0 a Jeśli n p n α 0, to a n = o p (n α i mówimy a n zbiega według prawdopodobieństwa szybciej
Statystyka i eksploracja danych
Wykład XII: Zagadnienia redukcji wymiaru danych 12 maja 2014 Definicja Niech X będzie zmienną losową o skończonym drugim momencie. Standaryzacją zmiennej X nazywamy zmienną losową Z = X EX Var (X ). Definicja
Detekcja rozkładów o ciężkich ogonach
Detekcja rozkładów o ciężkich ogonach J. Śmiarowska, P. Jamer Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska 24 kwietnia 2012 J. Śmiarowska, P. Jamer (Politechnika Warszawska) Detekcja
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Statystyka i eksploracja danych
Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,
Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),
Zależność przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna), funkcyjna stochastyczna Korelacja brak korelacji korelacja krzywoliniowa korelacja dodatnia korelacja ujemna Szereg korelacyjny numer
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Rozkłady dwóch zmiennych losowych
Rozkłady dwóch zmiennych losowych Uogólnienie pojęć na rozkład dwóch zmiennych Dystrybuanta i gęstość prawdopodobieństwa Rozkład brzegowy Prawdopodobieństwo warunkowe Wartości średnie i odchylenia standardowe
Prawdopodobieństwo i statystyka
Wykład IV: 27 października 2014 Współczynnik korelacji Brak korelacji a niezależność Definicja współczynnika korelacji Współczynnikiem korelacji całkowalnych z kwadratem zmiennych losowych X i Y nazywamy
Prawdopodobieństwo i statystyka
Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014 Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
5. Model sezonowości i autoregresji zmiennej prognozowanej
5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki 22 listopada 2016 Uprzednio wprowadzone pojęcia i ich własności Definicja zmiennej losowej Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to funkcja
Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34
Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006
Modele dynamiczne Paweł Cibis pcibis@o2.pl 27 kwietnia 2006 1 Wyodrębnianie tendencji rozwojowej 2 Etap I Wyodrębnienie tendencji rozwojowej Etap II Uwolnienie wyrazów szeregu empirycznego od trendu Etap
STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 Zależność przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna), funkcyjna stochastyczna
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 19 października 2016r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Natalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
Wykład 3 Momenty zmiennych losowych.
Wykład 3 Momenty zmiennych losowych. Wrocław, 18 października 2017r Momenty zmiennych losowych Wartość oczekiwana - przypomnienie Definicja 3.1: 1 Niech X będzie daną zmienną losową. Jeżeli X jest zmienną
Matematyka ubezpieczeń majątkowych r.
Matematyka ubezpieczeń majątkowych 3..007 r. Zadanie. Każde z ryzyk pochodzących z pewnej populacji charakteryzuje się tym że przy danej wartości λ parametru ryzyka Λ rozkład wartości szkód z tego ryzyka
Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji
Wykład 11. Metoda najmniejszych kwadratów Szukamy zależności Dane są wyniki pomiarów dwóch wielkości x i y: (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Przypuśćmy, że nanieśliśmy je na wykres w układzie
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
4. Średnia i autoregresja zmiennej prognozowanej
4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 2013/2014 Wykład 3 Zmienna losowa i jej rozkłady Zdarzenia losowe Pojęcie prawdopodobieństwa
STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA
STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;
STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND Finanse i Rachunkowość rok 2 Analiza dynamiki Szereg czasowy: y 1 y 2... y n 1 y n. y t poziom (wartość) badanego zjawiska w
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Statystyka matematyczna. Wykład III. Estymacja przedziałowa
Statystyka matematyczna. Wykład III. e-mail:e.kozlovski@pollub.pl Spis treści Rozkłady zmiennych losowych 1 Rozkłady zmiennych losowych Rozkład χ 2 Rozkład t-studenta Rozkład Fischera 2 Przedziały ufności
Następnie przypominamy (dla części studentów wprowadzamy) podstawowe pojęcia opisujące funkcje na poziomie rysunków i objaśnień.
Zadanie Należy zacząć od sprawdzenia, co studenci pamiętają ze szkoły średniej na temat funkcji jednej zmiennej. Na początek można narysować kilka krzywych na tle układu współrzędnych (funkcja gładka,
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Regresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
Modelowanie ekonometryczne
Modelowanie ekonometryczne Kamil Skoczylas Kamilskoczylas@wp.pl 1. Wstęp Otaczający nas świat to zbiór różnych zjawisk. W zależności od zainteresowań człowiek staje się obserwatorem niektórych z nich.
1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:
Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).
HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =
HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki
Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb
Współzależność Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb (x i, y i ). Geometrycznie taką parę
Logarytmy. Funkcje logarytmiczna i wykładnicza. Równania i nierówności wykładnicze i logarytmiczne.
Logarytmy. Funkcje logarytmiczna i wykładnicza. Równania i nierówności wykładnicze i logarytmiczne. Definicja. Niech a i b będą dodatnimi liczbami rzeczywistymi i niech a. Logarytmem liczby b przy podstawie
Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA
Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Modele tej klasy są modelami ateoretycznymi Ważną klasę modeli dynamicznych stanowią
Metody probabilistyczne
Metody probabilistyczne Teoria estymacji Jędrzej Potoniec Bibliografia Bibliografia Próba losowa (x 1, x 2,..., x n ) Próba losowa (x 1, x 2,..., x n ) (X 1, X 2,..., X n ) Próba losowa (x 1, x 2,...,
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
WYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
Modelowanie Rynków Finansowych
Modelowanie Rynków Finansowych Modelowanie zmienności, modele GARCH Zajęcia 6 Katarzyna Lada, Paweł Sakowski, Paweł Strawiński 23 marca, 2009 Literatura na dziś Engle (2001), The Use of ARCH/GARCH Models
Regresja linearyzowalna
1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:
Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.
Trochę teorii W celu przeprowadzenia rygorystycznej ekonometrycznej analizy szeregu finansowego będziemy traktowali obserwowany ciąg danych (x 1, x 2,..., x T ) jako realizację pewnego procesu stochastycznego.
STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009
STATYSTYKA MATEMATYCZNA WYKŁAD 7 23 listopada 2009 Wykład 6 (16.XI.2009) zakończył się zdefiniowaniem współczynnika korelacji: E X µ x σ x Y µ y σ y = T WSPÓŁCZYNNIK KORELACJI ρ X,Y = ρ Y,X (!) WSPÓŁCZYNNIK
Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne
Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne 5.2. Momenty rozkładów łącznych. Katarzyna Rybarczyk-Krzywdzińska rozkładów wielowymiarowych Przypomnienie Jeśli X jest zmienną losową o rozkładzie
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne