Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona 3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe a 4. Normalność rozkładu zakłóceń - test Jarque-Bera Szum Pomiar (wyodrębnienie) poszczególnych składowych systematycznych szeregu następuje poprzez jego dekompozycję. Prawidłowo przeprowadzona dekompozycja powinna zakończyć się wyodrębnieniem szumu - "czysto" losowego składnika, który nie wykazuje żadnych tendencji czy regularności. Proces wyodrębniania szumu nazywamy filtracją. Formalnie szum to stacjonarny proces stochastyczny Z 1, Z 2,..., Z n,... o przyrostach niezależnych. W praktyce na ogół zadowalamy się stacjonarnością w szerszym sensie, tzn. niezmienniczością momentów pierwszego i drugiego rzędu ze względu na przesuniecie w czasie. Szum nazywamy białym, jeśli zmienne losowe Z i, i=1,2, mają rozkład normalny o stałych (takich samych) momentach. 1
Przypomnienie Proces stochastyczny jest procesem o przyrostach niezależnych jeśli dla dowolnych t 1, t 2,..., t n, przyrosty (zmienne losowe): są niezależne Z t2 - Z t1, Z t3 - Z t2,, Z tn - Z tn-1 Proces stacjonarny w węższym sensie (strictly stationary process ): dla dowolnych t 1, t 2,..., t n oraz k rozkład wektora (Z t1, Z t2,..., Z tn ) jest identyczny z rozkładem wektora (Z t1+k, Z t2+k,..., Z tn+k ) Proces stacjonarny w szerszym sensie (weakly stationary process): Momenty drugiego rzędu są niezmiennicze ze względu na przesunięcie. Zachodzi to wtedy tylko wtedy, gdy E(Z t )= m = constans Var(Z t )= σ 2 = constans cov(z t,z t+k )=R(k) Karty kontrolne w badaniu szumu 1. Karta obserwacji 2. Karta (karta średnich) 3. Karta s (karta odchyleń standardowych) 4. Karta R (karta rozstępów) Przykłady w pakiecie Mathematica 2
Weryfikacja hipotezy losowości odchyleń Hipoteza zerowa: Hipoteza alternatywna: Opis testu: Obserwowane wartości mają losowe odchylenia od średniej Obliczamy reszty tj: odchylenia wartości od ich średniej. Szeregujemy reszty według czasu Resztom dodatnim przypisujemy znak +, resztom ujemnym. Reszty równe 0 odrzucamy! odchylenia obserwowanych wartości od średniej wykazują regularność Otrzymujemy w ten sposób ciąg typu: + + + + + + + + + Obliczmy liczbę serii występujących w otrzymanym ciągu. Serią jest ciąg takich samych znaków (także jednoelementowy) Odczytujemy z tablic dla testu serii i danego poziomu istotności wartość krytyczną N* (zależy ona od liczby znaków + i liczby znaków. Hipotezę zerową odrzucamy, jeśli liczba serii Ns jest mniejsza od N*. Wartości kwantyli dla testu serii dla małych prób 3
Przybliżone wartości kwantyli dla testu serii dla dużych prób można obliczyć z wzoru Hipotezę o liniowości modelu odrzucamy, gdy liczba serii jest mniejsza od wartości kwantyla k α gdzie α jest poziomem istotności testu 2. Założenie niezależności zakłóceń modelu - autokorelacja zakłóceń Model: Y = β 1 X 1 + β 2 X 2 +...+ β k X k +Z Autokorelacja zakłóceń (proces autokorelacji pierwszego rzędu): Z i+1 = ρ Z i + V, i=1,2,...,n-1 ρ - współczynnik autokorelacji, ρ <1 V - zmienna losowa o średniej 0 i skończonej wariancji Autokorelacja występuje często, gdy model szacujemy na podstawie szeregów czasowych 4
2. Założenie niezależności zakłóceń modelu - autokorelacja zakłóceń Model z wyrazem wolnym: Y = β 1 + β 2 X 2 +...+ β k X k + Z Hipoteza zerowa: ρ =0 ( brak autokorelacji) Hipoteza alternatywna: ρ 0 ( autokorelacja występuje) Test Durbina - Watsona Krok 1 Krok 2 Krok 3 Estymujemy parametry modelu. Obliczmy reszty w oszacowanym modelu : e 1,e 2,...,e n Wyznaczamy wartość statystyki testowej 2. Założenie niezależności zakłóceń modelu - autokorelacja zakłóceń Test Durbina - Watsona Schemat podejmowania decyzji: d L oraz d u - wartości krytyczne wyznaczane z tablic d d L d L < d < d U d U < d < 4 - d U Hipotezę zerową odrzucamy brak decyzji Nie ma podstaw do odrzucenia hipotezy zerowej 4-d U d 4-d L brak decyzji 4-d L < d Hipotezę zerową odrzucamy 5
Test Durbina Watsona: Wartości krytyczne d L oraz d U dla poziomu istotności α = 0.05: 3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe a Model nazywamy heteroskedastycznym, jeżeli składniki losowe dla poszczególnych obserwacji mają różne wariancje. Jeśli wariancje są takie same dla każdej obserwacji model nazywamy homoskedastycznym Heteroskedastyczność składnika losowego pojawia sie czesto, gdy szacujemy model na podstawie danych przekrojowych lub przekrojowo-czasowych Formułujemy hipotezy. Hipoteza zerowa: σ i = const i=1,2,...,n (model homoskedastyczny) Hipoteza alternatywna: σ i const ( model heteroskedastyczny) 6
3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe a Krok 1 Krok 2 Krok 3 Estymujemy parametry modelu : Y = β 1 X 1 + β 2 X 2 +...+ β k X k + Z Obliczamy reszty w oszacowanym modelu i porządkujemy je od najmniejszej do największej : e 1,e 2,...,e n Wyznaczamy wartość statystyki testowej gdzie m jest środkowym numerem obserwacji (dla n parzystego przyjmujemy m=n/2) Uwaga: musi być spełniony warunek: n>2k 3. Założenie stałości momentów rozkładu zakłóceń modelu - modele homo- i heteroskedastyczne. Test Harrisona-McCabe a Krok 4 Dla przyjętego poziomu istotności a odczytujemy z tablic rozkładu F-Snedecora wartości: F 1 dla stopni swobody (n-m) i (m-k ) oraz F 2 dla stopni swobody (n-m-k ) i m. Krok 5 Wyznaczamy wartości krytyczne b L oraz d U dla poziomu istotności α : Schemat podejmowania decyzji: b b L b L < b < d U d U b Hipotezę zerową odrzucamy brak decyzji Nie ma podstaw do odrzucenia hipotezy zerowej 7
4. Normalność rozkładu zakłóceń Test Jarque-Bera Hipoteza zerowa: Składnik losowy Z ma rozkład normalny Hipoteza alternatywna: Składnik losowy Z ma rozkład inny niż normalny Krok 1 Krok 2 Estymujemy parametry modelu : Y = β 1 X 1 + β 2 X 2 +...+ β k X k + Z Obliczamy reszty w oszacowanym modelu : e 1,e 2,...,e n Krok 3 Obliczamy 4. Normalność rozkładu zakłóceń Test Jarque-Bera Statystyka testowa: Zbiór krytyczny: gdzie χ 1-α jest kwantylem rzędu 1-α z rozkładu χ 2 o dwóch stopniach swobody, α jest przyjętym poziomem istotności testu 8
4. Normalność rozkładu zakłóceń Uwaga: Jeśli pakiety które wykorzystujemy umożliwiają weryfikacje założnia o normalności rozkładu zakłóceń za pomocą testu Shapiro-Wilka, to go wykorzystujemy! Jest to test mocniejszy od testu Jarque-Bera Uwaga: A jakie są konsekwencje niespełnienia poszczególnych założeń? 9