Metody Ekonometryczne

Podobne dokumenty
Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Metody Ekonometryczne

Ekonometria. Zajęcia

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Metody Ekonometryczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Rozdział 8. Regresja. Definiowanie modelu

Metody Ekonometryczne

Stosowana Analiza Regresji

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych

Metoda najmniejszych kwadratów

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Statystyka matematyczna dla leśników

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Własności statystyczne regresji liniowej. Wykład 4

Ekonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie

1.1 Klasyczny Model Regresji Liniowej

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej. Modele nieliniowe Funkcja produkcji

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Natalia Neherbecka. 11 czerwca 2010

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

166 Wstęp do statystyki matematycznej

MODELE LINIOWE. Dr Wioleta Drobik

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stosowana Analiza Regresji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Statystyczna analiza danych 1

Metoda największej wiarogodności

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Testowanie hipotez statystycznych

Budowa modelu i testowanie hipotez

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Metody Ilościowe w Socjologii

PDF created with FinePrint pdffactory Pro trial version

3. Modele tendencji czasowej w prognozowaniu

Elementy statystyki STA - Wykład 5

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Wprowadzenie do analizy korelacji i regresji

Weryfikacja hipotez statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

1.8 Diagnostyka modelu

Wydział Matematyki. Testy zgodności. Wykład 03

Ekonometria egzamin 07/03/2018

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria - ćwiczenia 1

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Statystyka i Analiza Danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Statystyka Matematyczna Anna Janicka

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Transkrypt:

Metody Ekonometryczne Goodness of fit i wprowadzenie do wnioskowania statystycznego Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 1 / 34

Outline 1 2 3 Błąd I i II rodzaju Rozmiar i moc testu 4 Test t-studenta Test Walda 5 6 7 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 2 / 34

Dla jednorównaniowego modelu liniowego: y = Xβ + ε, (1) estymator MNK (OLS) przyjmuję postać: ˆβ OLS = ( X T X ) 1 X T y. (2) Estymator wariancji-kowariancji można zapisać jako: Var( ˆβ OLS ) = S 2 ε(x T X) 1, (3) gdzie wariancja składnika losowego można oszacować jako S 2 ε: S 2 ɛ = e T e n (k + 1) = SSE( ˆβ OLS ) df (4) gdzie SSE( ˆβ OLS ) to suma kwadratów reszt, a df to liczba stopni swobody. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 3 / 34

Twierdzenie Gaussa -Markowa Założenia: 1 rz(x) = k + 1 n 2 E(Xε) = 0 3 E(ε) = 0 4 Var(ε) = E(εε T ) = I σ 2 5 εi N (0, σ 2 ) Twierdzenie Gaussa - Markowa Estymator ˆβ uzyskany Klasyczną Metodą Najmniejszych Kwadratów jest estymatorem BLUE [best linear unbiased estimator], tj. zgodnym, nieobciążonym i najefektywniejszy w klasie liniowych estymatorów wektora β. nieobciążoność, czyli: E( ˆβ OLS ) = β najefektywniejszy, czyli posiadający najmniejszą wariancję w swojej klasie zgodny, czyli: plim n ˆβOLS n = β. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 4 / 34

Outline 1 2 3 Błąd I i II rodzaju Rozmiar i moc testu 4 Test t-studenta Test Walda 5 6 7 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 5 / 34

Miary dopasowania (goodness-of-fit) pozwalają ocenić stopień dopasowania wartości teoretycznych wynikających z oszacowań modelu ekonometrycznego do danych empirycznych. Miary dopasowania (goodness-of-fit) nie stanowią formalnego kryterium jakości modelu. Przykładowe miary dopasowania dla jednorównaniowego liniowego modelu ekonometrycznego: R 2, skorygowany R 2, kryteria informacyjne. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 6 / 34

I jest wynikiem dekompozycji łącznej obserwowanej wariancji/zmienności SST (total variance).: N SST = (y i ȳ) 2 = (y ȳ) T (y ȳ) (5) i=1 gdzie ȳ (ȳ) to średnia wartość (wektor z średnią wartością). Punktem wyjścia jest liniowy model: y = Xβ + ε, (6) oszacowania parametrów β pozwalają wyznaczyć wartości teoretyczne (^y) oraz reszty (^e): y = X ˆβ + ^e = ^y + ^e. (7) Wykorzystując powyższy fakt i definicje łącznej wariancji/zmienności (SST): SST = (^y + ^e ȳ) T (^y + ^e ȳ) = (^y ȳ) T (^y ȳ) + ^e T^e + 2 (^y ȳ) T ^e (8) (^y ȳ) T (^y ȳ) to łączna zmienność wartości teoretycznych (SSR), tj. wynikających z oszacowań oraz zmienności zmiennych objaśniających. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 7 / 34

II Jeżeli modeli liniowy zawiera wyraz wolny to wtedy (^y ȳ) T ^e = 0. ^e T^e to suma kwadratów reszt (SSE). Ostatecznie: SST }{{} Total = SSR }{{} + SSE Regression }{{} Errors. (9) stanowi zatem relację zmienności wyjaśnionej (SSE) do zmienności łącznej (SST) : R 2 = SSR N 2 SST = (ŷ ȳ) i=1 N, (10) (y ȳ)2 i=1 a z dekompozycji łącznej wariancji (SST) może zostać wyrażony prrzy pomocy zmienności reszt: R 2 = 1 SSE SST. (11) Charaterystyki R 2 : R 2 (0, 1) R 2 faworyzuje modele z większą liczbą zmiennych egzogenicznych konstrukcja R 2 opiera się o uwzględnienie wyrazu wolnego w modelu. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 8 / 34

W przypadku, gdy w specyfikacji modelu ekonometrycznego nie uwzględniono wyrazu wolnego, współczynnik R 2 może przyjmować wartości powyżej jedności. Rozwiązaniem tego problemu jest niescentrowany R 2 N: R 2 N = 1 eet yy T (12) e - wektor reszt. y - wektor obserwacji zmiennej endogenicznej. W porównaniu ze standardowym R 2 obserwowana zmienność nie jest zcentrowana wokół wartości średniej, tj. yy T. R 2 N < 0, 1 > Interpretacja: większa wartość RN 2 oznacza większa rola zmiennych egzogenicznych w wyjaśnianiu zmienności zmiennej objaśnianej. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 9 / 34

zawsze będzie faworyzował modele z większą liczbą zmiennych. W porównaniu z podstawowym współczynnikiem R 2, skorygowany współczynnik R 2 uwzględnia również liczbę stopni swobody: R 2 = R 2 k n (k + 1) (1 R2 ) (13) Skorygowany współczynnik R 2 przyjmuje zazwyczaj niższe wartości: R 2 R 2 (14) w szczególności możliwe jest przyjmowanie wartości poniżej 0. Skorygowany R 2 jest pozbawiony standardowej interpretacji. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 10 / 34

Kryterium Akaike a (AIC) jest miernikiem, który uwzględnia zarówno dopasowanie do obserwacji (funkcja wiarygodności) oraz liczbę stopni swobody: n AIC = ln 1 e 2 2(k + 1) i + (15) n n i=1 }{{}}{{} liczba stopni swobody funkcja wiarygodności gdzie n to liczba obserwacji, k + 1 to liczba oszacowanych parametrów oraz e i to reszta dla i-tej obserwacji. Bayesowskie kryterium Schwarza (BIC) jest miernikiem, który uwzględnia zarówno dopasowanie do obserwacji (funkcja wiarygodności) oraz liczbę stopni swobody: n BIC = ln 1 e 2 (k + 1) ln (n) i + (16) n n i=1 }{{}}{{} liczba stopni swobody funkcja wiarygodności gdzie oznaczenia jak w przypadku AIC. Kryteria AIC i BIC maleją wraz ze wzrostem funkcji wiarygności oraz rosną wraz ze wzrostem liczby parametrów. Kryteria AIC i BIC nie posiadają interpretacji i są wykorzytywane do porównania dopasowania modeli. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 11 / 34

Mierniki dopasowania modelu ekonometrycznego do danych Miernik R 2 Niescentrowany R 2 Skorygowany R 2 Kryterium AIC Kryterium BIC Opis Ogólny miernik, interpretacja, rośnie wraz z liczbą zmiennych model bez wyrazu wolnego uwzględnia korektę na liczbę zmiennych, porównanie modeli uwzględnia korektę na liczbę zmiennych, porównanie modeli uwzględnia korektę na liczbę zmiennych, porównanie modeli; BIC < AIC Powyższe mierniki kwantyfikują jedynie dopasowanie modelu do obserwowanych danych. Wspomniane dopasowanie do danych ma charekter informacyjny i nie stanowi głównego kryterium w wyborze modelu. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 12 / 34

Przykład: kwartet Anscombe a Kwartet Anscombe a to przykład czterech zbiorów danych z dwoma zmiennymi x i y. Średnia x: 9. Średnia y: 4.1. Wariancja y: 7.5, Wariancja x: 11. Współczynnik korelacji: 0.816 Równanie regresji z oszacowanymi parametrami: a R 2 wynosi 0.63. y = 3 +.5x, (17) Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 13 / 34

Przykład: kwartet Anscombe a y 4 5 6 7 8 9 10 11 Zbiór I 4 6 8 10 12 14 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Przykład: kwartet Anscombe a y 4 5 6 7 8 9 10 11 Zbiór I 4 6 8 10 12 14 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Przykład: kwartet Anscombe a Zbiór II 3 4 5 6 7 8 9 y 4 6 8 10 12 14 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Przykład: kwartet Anscombe a Zbiór II 3 4 5 6 7 8 9 y 4 6 8 10 12 14 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Przykład: kwartet Anscombe a Zbiór III y 6 8 10 12 4 6 8 10 12 14 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Przykład: kwartet Anscombe a Zbiór III y 6 8 10 12 4 6 8 10 12 14 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Przykład: kwartet Anscombe a Zbiór IV y 6 8 10 12 8 10 12 14 16 18 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Przykład: kwartet Anscombe a Zbiór IV y 6 8 10 12 8 10 12 14 16 18 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 14 / 34 x

Outline Błąd I i II rodzaju Rozmiar i moc testu 1 2 3 Błąd I i II rodzaju Rozmiar i moc testu 4 Test t-studenta Test Walda 5 6 7 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 15 / 34

Błąd I i II rodzaju Rozmiar i moc testu (statistical inference) pozwala na generalizację wyników estymacji pewnych cahrakterystyk uzsykanych na podstawie cąłej próby na całą populację. obejmuje: Estymację nieznanych parametrów. Estymacja parametryczna = bazuje na założeniu o rozkładzie prawdopodobieństwa. Estymacja nieparametryczna = brak założeń o rozkładzie prawdopodbieństwa. Estymacja semiparametryczna. Weryfikację hipotez statystycznych. można oprzeć m.in na: Podejściu częstościowym. Podejściu bayesowskim. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 16 / 34

Błąd I i II rodzaju a p-value Błąd I i II rodzaju Rozmiar i moc testu Zgodnie z zasadami wnioskowania statystycznego można wyróżnić dwa ryzyka wynikające z wykorzystania testów statystycznych, których konstrukcja opiera się na klarownie sformułowanych hipotezach: zerowej (H 0 ) oraz alternatywnej (H 1 ): Błąd pierwszego rodzaju to odrzucenie H 0, która w rzeczywistości jest prawdziwa. Błąd drugiego rodzaju to przyjęcie H 0, która w rzeczywistości jest fałszywa. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 17 / 34

Rozmiar i moc testu Błąd I i II rodzaju Rozmiar i moc testu Rozmiar testu (size of test) to prawdopodobieństwo (błędnego) odrzucenia hipotezy zerowej jeżeli jest ona prawdziwa. α = Pr (odrzucenie H 0 H 0) (18) Rozmiar testu to inaczej prawdopodobieńśtwo popełnienia błędu I rodzaju. Moc testu (power of test) to prawdopodobieństwo (poprawnego) odrzucenia hipotezy zerowej jeżeli prawdziwa jest hipoteza alternatywna. β = Pr (odrzucenie H 0 H 1) (19) Moc testu to inaczej dopełnienie prawdopodobieńśtwa popełnienia błędu II rodzaju. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 18 / 34

p-value Błąd I i II rodzaju Rozmiar i moc testu W pakietach ekonometryczno-statystycznych szeroko stosowane jest p-value (probability value), które mierzy prawdopobieństwo błędu pierwszego rodzaju. W praktyce ekonometrycznej nie rozważa się minimalizacji obu ryzyk i wnioskowanie statystyczne jest najczęściej przeprowadzane na podstawie analizy prawdopodobieństwa błędu pierwszego rodzaju. Poziom krytyczny oznacza arbitralnie wybrany poziom prawdopodobieństwa błędu I rodzaju, który można uznać za akceptowalny. Najczęściej jest równy: 0.01, 0.05 lub 0.1. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 19 / 34

Outline Test t-studenta Test Walda 1 2 3 Błąd I i II rodzaju Rozmiar i moc testu 4 Test t-studenta Test Walda 5 6 7 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 20 / 34

Test t-studenta Test t-studenta Test Walda Test t-studenta pozwala zweryfikować istotność oszacowania parametru dla każdej zmiennej objaśniającej (x j) osobno, tj.: Statystyka testowa: H 0 : β j = 0 H 1 : β j 0 (20) t j = ˆβ j S( ˆβ i) (21) gdzie ˆβ j to oszacowanie punktowe parametru β j, a S( ˆβ i) to błąd szacunku. Statystyka testowa testu t-studenta jest odwrotnością względnego błędu szacunku. Wartości krytyczne pochodzą z rozkładu t-studenta i można je uzyskać dla określonej liczby stopni swobody (df = n (k + 1)) oraz przyjętego poziomu krytycznego (α). Jeżeli t j > t df,α/2 - to mamy podstawy do odrzucenia H 0 na rzecz H 1. Jeżeli t j < t df,α/2 - to nie ma podstaw do odrzucenia H 0 na rzecz H 1. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 21 / 34

Test Walda Test t-studenta Test Walda Łączna istotność oszacowań parametrów może być weryfikowana przy pomocy testu Walda, tj.: Statystyka testowa: H 0 : β 1 = β 2 =... = β k = 0 (22) H 1 : j {1,...,k} β j 0 (23) F = R 2 /k (1 R 2 )/(n (k + 1)) (24) Statystyka testowa F ma rozkład F-Snedecora z r 1 = k oraz r 2 = n (k + 1) stopniami swobody. Jeżeli F > F r 1,r 2,α - to mamy podstawy do odrzucenia H 0 na rzecz H 1. Jeżeli F < F r 1,r 2,α -to nie ma podstaw do odrzucenia H 0 na rzecz H 1. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 22 / 34

Outline 1 2 3 Błąd I i II rodzaju Rozmiar i moc testu 4 Test t-studenta Test Walda 5 6 7 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 23 / 34

Test Walda umożliwia przede wszystkim szersze testowanie restrykcji liniowych. H 0 : R β = q (25) Macierz restrykcji R jest wymiarów r (k + 1), gdzie r to liczba restrykcji. Restrykcje są zapisywane wierszowo, a test Walda pozwala na weryfikację koniunkcji wszystkich restrykcji. Statystyka testowa: F = (SSE( ˆβ) SSE( ˆβ R ))/r SSE( ˆβ)/(n (k + 1)) ma rozkład F-Snedecora z r 1 = r oraz r 2 = n (k + 1). SSE( ˆβ R ) - jest sumą kwadratów reszt modelu z restrykcjami; SSE( ˆβ) - jest sumą kwadratów reszt modelu bez restrykcji; Przykłady wykorzystania testu Walda: Weryfikowanie restrykcji ekonomicznych. Test pominiętych zmiennych. (26) Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 24 / 34

Przykłady zapisu macierzowego w teście liniowych restrykcji Walda Przykład #1: test Walda na istotność zmiennych w modelu: 0 1 0... 0 0 0 1... 0 R =......... oraz q = 0 0 0... 1 Przykład #2: załóżmy, że mamy cztery zmienne egzogeniczne oraz 0 0. 0 1 β 1 = β 3 2 β 2 = ν 3 β 1 + β 4 = γ. Wtedy: R = [ 0 1 0 1 0 0 0 1 0 0 0 1 0 0 1 ] oraz q = [ 0 ν γ ] Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 25 / 34

MNK z restrykcjami liniowymi wyprowadzenie I Punktem wyjścia jest minimalizacja sumy kwadratów reszt jednak przy pewnych ograniczeniach: Funkcja Lagrange a: min SSE( ˆβ R ) = min (y Xβ) T (y Xβ) (27) p.w. Rβ = q. (28) L (β, λ) = (y Xβ) T (y Xβ) + 2λ T (Rβ q). (29) Warunki pierwszego rzędu na optymalizację (minimalizację): L β L λ = 2X T (y Xβ) + 2R T λ = 0, (30) = 2 (Rβ q) = 0. (31) Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 26 / 34

MNK z restrykcjami liniowymi wyprowadzenie II Po uproszczeniu otrzymujemy następujący (macierzowy) układ równań: [ ] [ ] [ ] X T X R T β X T y = (32) R 0 λ q. Zatem rozwiązanie tego układu równań będzie zawierać estymator RLS (restricted least squares): ˆβ R = ˆβ OLS ( X T X ) [ 1 R T R ( X T X ) 1 R T] 1 ( R ˆβOLS q ), (33) a towarzysząca wariancja wynosi: Var( ˆβ R ) = σ 2 ( X T X ) 1 ( X T X ) 1 R T [ R ( X T X ) ] 1 1 ( R T R X T X ) 1 (34) Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 27 / 34

Testowanie restykcji Statystyka F ma rozkład F-Snedecora z r 1 = r oraz r 2 = n (k+1) stopniami swobody. F = (SSE( ˆβ) SSE( ˆβ R ))/r SSE( ˆβ)/(n (35) (k + 1)) ma rozkład F-Snedecora z r 1 = r oraz r 2 = n (k + 1). SSE( ˆβ R ) - jest sumą kwadratów reszt modelu z restrykcjami; SSE( ˆβ) - jest sumą kwadratów reszt modelu bez restrykcji; Ogólniejsza statystyka W: ma rozkład χ 2 z r stopniami swobody. W = rf (36) Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 28 / 34

Outline 1 2 3 Błąd I i II rodzaju Rozmiar i moc testu 4 Test t-studenta Test Walda 5 6 7 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 29 / 34

deterministyczna to sytuacja, w której jedna ze zmiennych objąśniających może zostać przedstawiona jako kombinacja liniowa pozostałych regresorów. Wówczas niemożliwe jest uzyskanie estymatora β OLS. stochastyczna polega na wysokiej zależności statystycznej pomiędzy zmiennymi objaśniającymi. Problem współliniowości (stochastycznej) może powodować zwiększenie wariancji estymatora MNK (zmniejszenie efektywności). może zostać zidentyfikowana przy pomocy czynnika inflacji wariancji CIW (ang. Variance Inflation Factor). Dla każdej ze zmniennych objaśniających konstruowany jest model x j, w którym zmienną objaśnianą jest ona sama, a zmiennymi objaśniającymi pozostałe zmienne z wyjściowego zbioru regresorów, czyli: j J {j} x j = β 0 + β 1 x 1 +... + β J x J + ε (37) Dla każdego modelu jest obliczany współczynnik determinacji R 2, a następnie CIW j : 1 CIW j = 1 Rj 2 (38) Wartości CIW powyżej 10 sugerują problem współliniowości. Wtedy R 2 z regresji pomocniczej jest większe od 0.9. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 30 / 34

rozwiązanie W przypadku współliniowości kluczowa jest identyfikacja źródeł tego problemu, tj. czy wynika z jakości danych czy też specyfikacji modelu ekonometrycznego. Brak zmian. Usunięcie zmiennych współliniowych zmiennych objaśniającyh. Usunięcie zmiennych objaśniających z specyfikacji modelu może doprowadzić do obciążenia oszacowań parametrów uzyskanych MNK. Transformacja zmiennych objaśniających. Wykorzystanie regresji grzbietowej (ridge regression): ˆβ RIDGE = (X T X + λi ) 1 X T y (39) gdzie λ to skalar a I to macierz jednostkowa. Estymator regresji grzbietowej ˆβ RIDGE jest obciążony, ale posiada mniejszą wariancję (jest bardziej efektywny) niż ˆβ OLS. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 31 / 34

Outline 1 2 3 Błąd I i II rodzaju Rozmiar i moc testu 4 Test t-studenta Test Walda 5 6 7 Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 32 / 34

nie jest wymaganą właśnością składnika losowego, ale umożliwia korzystanie z testów statystycznych weryfikujących pozostałe własności składnika losowego. Badanie normalności składnika losowego: histogram reszt, testy statystyczne, np. test Jarque a-berry. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 33 / 34

Test Jarque a-berry jest najpopularniejszą metodą w weryfikacji normalności składnika losowego. Statystyka tego testu opiera się na kurtozie i skośności reszt: JB = n 6 (S2 + 1 4 (K 3)2 ) (40) gdzie S i K to odpowiednio estymatory skośności oraz kurtozy składnika losowego: 1 n (e i ē) 3 1 n (e i ē) 4 n n i=1 i=1 S = oraz K = 3 (41) n n ( 1 (e i ē) 2 ) 3 2 ( 1 ( ei ē) 2) 2 n n i=1 i=1 Hipotezą zerową jest normalność składnika losowego: H 0 : ε N (0, σ 2 ) Wartość statystyki testowej ma rozkład χ 2 z dwoma stopniami swobody. Jeżeli wartość JB jest większa od wartości krytycznej z rozkładu χ 2 to są podstawy do odrzucenia H 0. Odrzucenie hipotezy zerowej uniemożliwia korzystanie z testów statystycznych. Ale w przypadku dużej próby, własności asymptotyczne testów nadal są pożadane. Jakub Mućk Metody Ekonometyczne Wykład 2 Goodness of fit i wprowadzenie do wnioskowania statystycznego 34 / 34