Budowa modelu i testowanie hipotez

Podobne dokumenty
Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Metoda najmniejszych kwadratów

Ekonometria Ćwiczenia 19/01/05

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Testowanie hipotez statystycznych

Przyczynowość Kointegracja. Kointegracja. Kointegracja

1 Modele ADL - interpretacja współczynników

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Egzamin z ekonometrii wersja IiE, MSEMAT

Metodologia budowy modelu

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Czasowy wymiar danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Egzamin z ekonometrii - wersja ogólna

Ekonometria dla IiE i MSEMat Z12

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Zmienne sztuczne i jakościowe

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka

Egzamin z ekonometrii wersja ogolna

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Egzamin z ekonometrii wersja IiE, MSEMAT

Problem równoczesności w MNK

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Ekonometria egzamin 07/03/2018

Zmienne Binarne w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Ekonometria egzamin wersja ogólna 17/06/08

Modele warunkowej heteroscedastyczności

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria dla IiE i MSEMat Z7

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

1.9 Czasowy wymiar danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Modele wielorównaniowe (forma strukturalna)

Diagnostyka w Pakiecie Stata

Autokorelacja i heteroskedastyczność

Analiza Szeregów Czasowych. Egzamin

Egzamin z Ekonometrii

Diagnostyka w Pakiecie Stata

1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL)

Stanisław Cichocki Natalia Neherbecka

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Heteroskedastyczość w szeregach czasowyh

1.7 Ograniczenia nakładane na równanie regresji

1.8 Diagnostyka modelu

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Ekonometria egzamin semestr drugi 14/06/09

Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Stanisław Cichocki. Natalia Nehrebecka

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Testowanie hipotez statystycznych.

Stanisław Cihcocki. Natalia Nehrebecka

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Metoda najmniejszych kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

2.3 Modele nieliniowe

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Nieliniowe. Liniowe. Nieliniowe. Liniowe. względem parametrów. Linearyzowane. sensu stricto

Prawdopodobieństwo i rozkład normalny cd.

Natalia Nehrebecka. Wykład 1

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

166 Wstęp do statystyki matematycznej

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Metody Ekonometryczne

(LMP-Liniowy model prawdopodobieństwa)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

1.3 Własności statystyczne estymatorów MNK

Transkrypt:

Problemy metodologiczne

Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t

Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Celem jest weryfikacja łącznej istotności parametrów modelu

Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Celem jest weryfikacja łącznej istotności parametrów modelu Czy sposób testowania ma wpływ na uzyskiwany wynik testu?

Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Celem jest weryfikacja łącznej istotności parametrów modelu Czy sposób testowania ma wpływ na uzyskiwany wynik testu? H 0 : β 1 = β 2 =... = β k = 0

Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Celem jest weryfikacja łącznej istotności parametrów modelu Czy sposób testowania ma wpływ na uzyskiwany wynik testu? H 0 : β 1 = β 2 =... = β k = 0 H 1 0 : β 1 = 0, H 2 0 : β 2 = 0,..., H k 0 : β k = 0

Gdzie jest problem? Obciążenie Lovella Zakładamy, że statystyki są niezależne od siebie

Gdzie jest problem? Obciążenie Lovella Zakładamy, że statystyki są niezależne od siebie przyjmijmy, że prawdopodobieństwo popełnienia błędu 1 rodzaju wynosi α

Gdzie jest problem? Obciążenie Lovella Zakładamy, że statystyki są niezależne od siebie przyjmijmy, że prawdopodobieństwo popełnienia błędu 1 rodzaju wynosi α poziom istotności w pierwszej procedurze wynosi oczywiście 1 α

Gdzie jest problem? Obciążenie Lovella Zakładamy, że statystyki są niezależne od siebie przyjmijmy, że prawdopodobieństwo popełnienia błędu 1 rodzaju wynosi α poziom istotności w pierwszej procedurze wynosi oczywiście 1 α w drugiej procedurze odrzucamy H 0 gdy zostanie odrzucona choć jedna z k hipotez

Gdzie jest problem? Obciążenie Lovella Zakładamy, że statystyki są niezależne od siebie przyjmijmy, że prawdopodobieństwo popełnienia błędu 1 rodzaju wynosi α poziom istotności w pierwszej procedurze wynosi oczywiście 1 α w drugiej procedurze odrzucamy H 0 gdy zostanie odrzucona choć jedna z k hipotez zatem rzeczywisty poziom istotności testu wynosi α = 1 (1 α) k

Gdzie jest problem? Obciążenie Lovella Obciążenie Lovella Obciążeniem Lovella nazywamy różnicę między nominalnym (założonym) poziomem istotności α a rzeczywistym poziomem istotności przeprowadzanego testu α

Gdzie jest problem? Obciążenie Lovella Obciążenie Lovella Obciążeniem Lovella nazywamy różnicę między nominalnym (założonym) poziomem istotności α a rzeczywistym poziomem istotności przeprowadzanego testu α wraz ze wzrostem ilości pojedynczych hipotez składających się na hipotezę łączną obciążenie Lovella rośnie, bowiem lim k α = lim 1 (1 α)k = 1 k }{{} 0

Gdzie jest problem? Obciążenie Lovella Czy miesiąc urodzenia wpływa na poziom uzyskiwanego dochodu? Dane: Diagnoza Społeczna 2007 ------------------------------------------ dochod Coef. Std. Err. t P> t -------+---------------------------------- LUT -23.33821 47.06868-0.50 0.620 MAR -41.63749 45.35714-0.92 0.359 KWI -42.24827 45.62751-0.93 0.354 MAJ -58.53747 46.9147-1.25 0.212 CZE -46.12517 46.70989-0.99 0.323 LIP -30.14434 47.25495-0.64 0.524 SIE -48.19725 46.73686-1.03 0.302 WRZ -42.534 47.81215-0.89 0.374 PAZ -91.11514 47.37196-1.98 0.049 LIS -57.73076 48.37949-1.19 0.233 GRU.127865 48.27925 0.00 0.998 stala 1153.077 32.03349 36.00 0.000 ------------------------------------------

Gdzie jest problem? Obciążenie Lovella Na poziomie istotności 5% zmienna dla października jest statystycznie istotna

Gdzie jest problem? Obciążenie Lovella Na poziomie istotności 5% zmienna dla października jest statystycznie istotna ale rzeczywisty poziom istotności dla łącznej hipotezy wynosi α = 0,44

Gdzie jest problem? Obciążenie Lovella Diagnostyka modelu: Number of obs = 10921 F( 11, 10909) = 0.54 Prob > F = 0.8808 R-squared = 0.0005 Adj R-squared = -0.0005 Root MSE = 1030.6

Gdzie jest problem? Obciążenie Lovella Diagnostyka modelu: Number of obs = 10921 F( 11, 10909) = 0.54 Prob > F = 0.8808 R-squared = 0.0005 Adj R-squared = -0.0005 Root MSE = 1030.6 ale nieprawidłowe wyniki testów mogą mieć inną przyczynę

Gdzie jest problem? Obciążenie Lovella Diagnostyka modelu: Number of obs = 10921 F( 11, 10909) = 0.54 Prob > F = 0.8808 R-squared = 0.0005 Adj R-squared = -0.0005 Root MSE = 1030.6 ale nieprawidłowe wyniki testów mogą mieć inną przyczynę zatem należy zwracać uwagę na ewentualne obciążenie

Jak ustalić listę zmiennych, które należy uwzględnić w modelu?

Jak ustalić listę zmiennych, które należy uwzględnić w modelu? W jaki sposób wybrać optymalny podzbiór zmiennych?

Jak ustalić listę zmiennych, które należy uwzględnić w modelu? W jaki sposób wybrać optymalny podzbiór zmiennych? Niebezpieczeństwa związane ze złą specyfikacją

Stopniowe upraszczanie modelu ogólnego

Stopniowe upraszczanie modelu ogólnego Narzucanie ograniczeń na parametry modelu

Stopniowe upraszczanie modelu ogólnego Narzucanie ograniczeń na parametry modelu Model zagnieżdżony jako szczególny przypadek modelu ogólnego

Przykład 1 y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε (1) y = β 0 + β 1 x 1 + β 2 x 2 + ε (2) y = β 0 + β 1 x 1 + ε (3) y = β 0 + β 1 x 1 + β 3 x 3 + ε (4)

Przykład 1 y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε (1) y = β 0 + β 1 x 1 + β 2 x 2 + ε (2) y = β 0 + β 1 x 1 + ε (3) y = β 0 + β 1 x 1 + β 3 x 3 + ε (4) Zapis hipotez H0 2 β 3 = 0 H0 3 β 2 = β 3 = 0 H0 4 β 1 = β 2 = 0

Przykład 2. Dochód gospodarstwa=f(miasto, płeć, wykształcenie)

Przykład 2. Dochód gospodarstwa=f(miasto, płeć, wykształcenie) H 1 0 płeć głowy nie ma znaczenia

Przykład 2. Dochód gospodarstwa=f(miasto, płeć, wykształcenie) H 1 0 H 2 0 płeć głowy nie ma znaczenia płeć głowy, oraz miejsce zamieszkania nie ma znaczenia

Przykład 2. Dochód gospodarstwa=f(miasto, płeć, wykształcenie) H 1 0 H 2 0 płeć głowy nie ma znaczenia płeć głowy, oraz miejsce zamieszkania nie ma znaczenia H0 3 płeć głowy, miejsce zamieszkania i wykształcenie głowy nie ma znaczenia

Krzywa Philipsa Testowanie hipotez Na podstawie danych miesięcznych dla Polski szacujemy krzywą Philipsa Source SS df MS Number of obs = 128 ---------+--------------------------- F( 5, 122) = 20.05 Model 844.53534 5 168.907069 Prob > F = 0.0000 Residual 1027.63908 122 8.42327113 R-squared = 0.4511 ---------+--------------------------- Adj R-squared = 0.4286 Total 1872.17442 127 14.7415309 Root MSE = 2.9023 --------------------------------------------------------------- inflacja Coef. Std. Err. t P> t ---------+----------------------------------------------------- stopa --. 4.460899 1.194171 3.74 0.000 L1. -5.479456 2.551726-2.15 0.034 L2..5970146 2.850079 0.21 0.834 L3. 4.454998 2.565207 1.74 0.085 L4. -4.647815 1.215513-3.82 0.000 _cons 14.64427 1.332817 10.99 0.000 ---------------------------------------------------------------

Krzywa Philipsa Testowanie hipotez Source SS df MS Number of obs = 128 ---------+--------------------------- F( 4, 123) = 25.25 Model 844.16574 4 211.041435 Prob > F = 0.0000 Residual 1028.00868 123 8.35779416 R-squared = 0.4509 ---------+--------------------------- Adj R-squared = 0.4330 Total 1872.17442 127 14.7415309 Root MSE = 2.891 --------------------------------------------------------------- inflacja Coef. Std. Err. t P> t ---------+----------------------------------------------------- stopa --. 4.348709 1.063177 4.09 0.000 L1. -5.069354 1.630214-3.11 0.002 L3. 4.866488 1.643236 2.96 0.004 L4. -4.760326 1.086158-4.38 0.000 _cons 14.64621 1.327594 11.03 0.000 ---------------------------------------------------------------

Obejmowanie O modelu A mówimy ze obejmuje model B, jeżeli to co można wyjaśnić za pomocą modelu B, może również być wyjaśnione za pomocą modelu A, ale zależność w drugą stronę nie jest prawdziwa

Definiujemy dwa modele takie że y = X A β A + ε A (1) y = X B β B + ε B (2)

Definiujemy dwa modele takie że X A X B y = X A β A + ε A (1) y = X B β B + ε B (2)

Definiujemy dwa modele takie że X A X B X A X B oraz X B X A y = X A β A + ε A (1) y = X B β B + ε B (2)

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε model (1) obejmuje model (2) gdy β B = 0

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε model (1) obejmuje model (2) gdy β B = 0 model (2) obejmuje model (1) gdy β A = 0

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε model (1) obejmuje model (2) gdy β B = 0 model (2) obejmuje model (1) gdy β A = 0 należy zweryfikować obie hipotezy. Możliwe wyniki:

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε model (1) obejmuje model (2) gdy β B = 0 model (2) obejmuje model (1) gdy β A = 0 należy zweryfikować obie hipotezy. Możliwe wyniki: (1) prawda (2) prawda nie da się ustalić

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε model (1) obejmuje model (2) gdy β B = 0 model (2) obejmuje model (1) gdy β A = 0 należy zweryfikować obie hipotezy. Możliwe wyniki: (1) prawda (2) prawda nie da się ustalić (1) prawda (2) fałsz model A obejmuje model B

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε model (1) obejmuje model (2) gdy β B = 0 model (2) obejmuje model (1) gdy β A = 0 należy zweryfikować obie hipotezy. Możliwe wyniki: (1) prawda (2) prawda nie da się ustalić (1) prawda (2) fałsz model A obejmuje model B (1) fałsz (2) prawda model B obejmuje model A

Można zbudować model ogólny y = X A β A + X B β B + W γ + ε model (1) obejmuje model (2) gdy β B = 0 model (2) obejmuje model (1) gdy β A = 0 należy zweryfikować obie hipotezy. Możliwe wyniki: (1) prawda (2) prawda nie da się ustalić (1) prawda (2) fałsz model A obejmuje model B (1) fałsz (2) prawda model B obejmuje model A (1) fałsz (2) fałsz brak obejmowania

Test J Testowanie hipotez Model ogólny może przyjąć postać y = (1 λ)x A β A + λx B β B + ε

Test J Testowanie hipotez Model ogólny może przyjąć postać y = (1 λ)x A β A + λx B β B + ε gdy λ = 0 to model A obejmuje model B

Test J Testowanie hipotez Model ogólny może przyjąć postać y = (1 λ)x A β A + λx B β B + ε gdy λ = 0 to model A obejmuje model B gdy λ = 1 to model B obejmuje model A

Test J Testowanie hipotez z uwagi na nieliniowość modelu nie można wykorzystać MNK

Test J Testowanie hipotez z uwagi na nieliniowość modelu nie można wykorzystać MNK rozwiązaniem jest zastosowanie procedury dwustopniowej

Test J Testowanie hipotez z uwagi na nieliniowość modelu nie można wykorzystać MNK rozwiązaniem jest zastosowanie procedury dwustopniowej 1 regresja y na X B, uzyskujemy yˆ B

Test J Testowanie hipotez z uwagi na nieliniowość modelu nie można wykorzystać MNK rozwiązaniem jest zastosowanie procedury dwustopniowej 1 regresja y na X B, uzyskujemy yˆ B 2 regresja y na X A oraz yˆ B

Test J Testowanie hipotez z uwagi na nieliniowość modelu nie można wykorzystać MNK rozwiązaniem jest zastosowanie procedury dwustopniowej 1 regresja y na X B, uzyskujemy yˆ B 2 regresja y na X A oraz yˆ B test obejmowania sprowadza się do zbadania istotności współczynnika przy zmiennej ŷ B

Test J Testowanie hipotez Procedura testowa opiera się na przybliżeniu

Test J Testowanie hipotez Procedura testowa opiera się na przybliżeniu y = (1 λ)x A β A + λx B β B + ε

Test J Testowanie hipotez Procedura testowa opiera się na przybliżeniu y = (1 λ)x A β A + λx B β B + ε (1 λ)x A β A + λx B b B + ε

Test J Testowanie hipotez Procedura testowa opiera się na przybliżeniu y = (1 λ)x A β A + λx B β B + ε (1 λ)x A β A + λx B b B + ε = (1 λ)x A β A + λyˆ B + ε

W przypadku modeli szacowanych MNW nie jest możliwe określenie współczynnika R 2

W przypadku modeli szacowanych MNW nie jest możliwe określenie współczynnika R 2 Do oceny jakości dopasowania modelu do danych empirycznych stosuje się tzw. kryteria informacyjne

Kryterium Informacyjne Akaike AIC = 2l(θ) N + 2k N

Kryterium Informacyjne Akaike AIC = 2l(θ) N + 2k N Bayesowskie Kryterium Informacyjne Schwarza BIC = 2l(θ) N + klog(n) N

Kryterium Informacyjne Akaike AIC = log( e e 2 ) + 2k N

Kryterium Informacyjne Akaike AIC = log( e e 2 ) + 2k N Bayesowskie Kryterium Informacyjne Schwarza BIC = log( e e 2 ) + klog(n) N

Model krzywej Philipsa

Model krzywej Philipsa Tabela: Krzywa Philipsa inflacja AIC BIC l L(0/4) 641.87 658.98-314.94 L(0/2) 690.42 701.89-341.21 L(0134) 639.92 654.18-314.96