Metody Ekonometryczne Metoda Najmniejszych Kwadratów Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Metody Ekonometyczne Wykład 1 1 / 45
Outline Literatura Zaliczenie przedmiotu 1 Sprawy organizacyjne Literatura Zaliczenie przedmiotu 2 Czym jest ekonometria? 3 Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa 4 5 Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Jakub Mućk Metody Ekonometyczne Wykład 1 2 / 45
Literatura Literatura Zaliczenie przedmiotu Literatura podstawowa Greene W.H., (2011), Econometric Analysis, Prentice Hall. Literatura uzupełniająca Hill R.C., Griffiths W. E. i Lim G.C, (2011), Principle of Econometrics, Willey. Wooldridge J. M., (2012), Introductory Econometrics: A Modern Approach, Cengage Learning. Oprogramowanie R. Jakub Mućk Metody Ekonometyczne Wykład 1 3 / 45
Literatura Zaliczenie przedmiotu Egzamin w sesji: 50%. Ćwiczenia: raport opisujący badanie ekonometryczne + (opcjonalne) prace domowe: 50%. Jakub Mućk Metody Ekonometyczne Wykład 1 4 / 45
Problematyka zajęć Literatura Zaliczenie przedmiotu 1 Metoda najmniejszych kwadratów. 2 Uogólniona metoda najmniejszych kwadratów. 3 Metoda zmiennych instrumentalnych. 4 Modele wielorównaniowe. Jakub Mućk Metody Ekonometyczne Wykład 1 5 / 45
Outline Czym jest ekonometria? 1 Sprawy organizacyjne Literatura Zaliczenie przedmiotu 2 Czym jest ekonometria? 3 Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa 4 5 Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Jakub Mućk Metody Ekonometyczne Wykład 1 6 / 45
Czym jest ekonometria? Czym jest ekonometria? Ekonometria to zbiór metod statystycznych i matematycznych pozwalających na empiryczną weryfikację teorii ekonomicznej. Inaczej Ekonometria pozwala na pomiar siły (istotności) i kierunku zjawisk i procesów ekonomicznych. Jakub Mućk Metody Ekonometyczne Wykład 1 7 / 45
Model ekonometryczny Czym jest ekonometria? Załóżmy, że zmienna y jest funkcją x 1, x 2,..., x k, t. że y = F (x 1, x 2,..., x k ) (1) Zauważmy, że równanie (1) określa funkcję deterministyczną. Wprowadźmy, element losowy, tj. ε: y = f (x 1, x 2,..., x k, ε) (2) Szczególnym przypadkiem (1) jest liniowa postać. Wtedy mowa o modelu regresji liniowej: gdzie: y zmienna objaśniana. y = β 0 + β 1x 1 + β 2x 2 +... + β k x k + ε (3) x 1,..., x k zmienne objaśnianające, (egzogeniczne). β 1,..., β k parametry strukturalne modelu. β 0 wyraz wolny. ε składnik losowy. Jakub Mućk Metody Ekonometyczne Wykład 1 8 / 45
Dane empiryczne Czym jest ekonometria? Dane eksperymentalne i nieeksperymentalne (experimental and nonexperimental data). Dane przekrojowe (cross-section data), szeregi czasowe (time series) oraz dane panelowe (panel data). Dane mikroekonomiczne oraz makroekonomiczne. Przypływy (flow) i stany (stock). Dane ilościowe (quantitative) i jakościowe (qualitative) Konsekwencje Rodzaj danych ma znaczenie w wyborze zarówno i) postaci funkcyjnej oraz ii) metody estymacji. Jakub Mućk Metody Ekonometyczne Wykład 1 9 / 45
Etapy prac badawczych Czym jest ekonometria? 1 Sformułowanie celu badawczego i/lub hipotez badawczych. 2 Wybór modelu ekonomicznego. 3 Kolekcjonowanie danych i wybór odpowiednich metod ekonometrycznych lub statystycznych. 4 Szacowanie nieznanych parametrów w celu odpowiedzi na kluczowe pytania badawcze lub realizacji celów badawczych. 5 Weryfikacja zasadności założeń wykorzystanych w procesie estymacji. Jakub Mućk Metody Ekonometyczne Wykład 1 10 / 45
Outline Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa 1 Sprawy organizacyjne Literatura Zaliczenie przedmiotu 2 Czym jest ekonometria? 3 Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa 4 5 Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Jakub Mućk Metody Ekonometyczne Wykład 1 11 / 45
Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa (random variable) jest zmienną, której wartości są nieznane dopóki nie jest obserowana. Dyskretna zmienna losowa przyjmuje wartości z ograniczonego i przeliczalnego zbioru potencjalnych wyników. Binarna zmienna losowa przyjmuje wyłącznie wartości 0 lub 1. Ciagła zmienna losowa przyjmuje dowolne wartości (lub z pewnego zakresu). Jakub Mućk Metody Ekonometyczne Wykład 1 12 / 45
Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa (random variable) jest zmienną, której wartości są nieznane dopóki nie jest obserowana. Dyskretna zmienna losowa przyjmuje wartości z ograniczonego i przeliczalnego zbioru potencjalnych wyników. Binarna zmienna losowa przyjmuje wyłącznie wartości 0 lub 1. Ciagła zmienna losowa przyjmuje dowolne wartości (lub z pewnego zakresu). Jakub Mućk Metody Ekonometyczne Wykład 1 12 / 45
Funckja gęstości Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Rozkład prawdopodbieństwa (probability density function, pdf) dla zmiennej losowej opsiuje potencjalne wyniki oraz towarzyszące im prawdopodobieństwa. Rozkład prawdopodbieństwa pdf dla dyskretnej zmiennej losowej X : f (x) = P(X = x), (4) i k f (xi) = 1. i Ponieważ dla ciągłej zmiennej losowe P(X = x) = 0 pdf wykorzystuje się funkcję gęstości, która jest określona dla pewnego zbioru. i f (x)dx = 1. b P(a X b) = f (x)dx, (5) a Jakub Mućk Metody Ekonometyczne Wykład 1 13 / 45
Dystrybuanta rozkładu prawdopodobieństwa Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Dystrybuanta rozkładu prawdopodobieństwa (cumulative distribution function, cdf) jest alternatywną miarą opisu potencjalnych wyników wraz z towarzyszącym im prawdopodobieństwami. Dla dowolnej stałe x dystrybuanta jest zdefiniowana następująco: F(x) = P(X x). (6) W przypadku dyskretnych zmiennych losowych, dystrybuanta cdf to po prostu suma pdf dla wszystkich x i (spełniających odpowiedni warunek). Dla ciągłej zmiennej losowej, F(x) jest powierzchnią pdf na lewo od punktu x. Dystrybuanta rozkładu prawdopodbieństwa jest przydatna w obliczaniu prawdopodobieństw. W szczególności, P(X > x) = 1 P(X x) = 1 F(x), (7) P(a < X b) = F(b) F(a). (8) Jakub Mućk Metody Ekonometyczne Wykład 1 14 / 45
Rozkład łączny, brzegowy oraz warunkowy I Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Rozkład łączny (joint probability density function zawiera informacje związaną z potencjalnymi wynikami (przynjamniej dwóch) zmiennych losowych oraz towarzyszącym im prawdopodobieństwom. Dla zmienncyh dyskretnych: f (x, y) = P(X = x, Y = y), (9) i dla zmiennych ciągłych: P(a X b, c X d) = b d a c f (x, y)dydx. (10) Rozkład brzegowy marginal distribution pozwala uzyskać informację o indywidualnym rozkładzie prawdopodbieństwa zmiennej losowej (ponizej dla X): f X (x) = P(X = x) = f (x, y). (11) y Jakub Mućk Metody Ekonometyczne Wykład 1 15 / 45
Rozkład łączny, brzegowy oraz warunkowy II Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Warunkowy rozkład prawdopodobieństwa (conditional distribution) jest rozkładem prawdopodbieństwa zmiennej Y w przypadku, gdy znana X jest znane: f (x, y) f (x y) = P(Y = y X = x) = f X (x). (12) Zmienne losowe są niezależne wtedy i tylko wtedy gdy rozkłąd łączny prawdopodobieństwa jest równy iloczynowi indywidualnych rozkładów prawdopodobieńśtwa pdfs. Przykładowo, dla dwóch zmiennych losowych: f (x, y) = f X (x)f Y (y). (13) Jakub Mućk Metody Ekonometyczne Wykład 1 16 / 45
Wartość oczekiwana I Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Wartość oczekiwana (expected value, expectation) zmiennej losowej X jest średnią ważoną (rozkładem prawdopodobieńtwa) wszystkich potencjalnych wyników X. Wartość oczekiwana dla zmiennej dyskretnej X: E (X) = N X if (x i), (14) i=1 gdzie f (x) jest rozkładem prawdopodobieństwax. Wartość oczekiwana jest również nazywana średnią z populacji (population mean) ( średnia z próby (sample average)). Wartość oczekiwana dla zmiennej ciągłej X: E (X) = Własności wartości oczekiwanej xf (x)dx. (15) Jakub Mućk Metody Ekonometyczne Wykład 1 17 / 45
Wartość oczekiwana II Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa 1 Dla dowolnej stałej c: 2 Dla dowolnych stałych a i b: E (c) = c. (16) E (ax + b) = ae (X) + b. (17) 3 Dla dowolnych stałych a 1,..., a k i zmiennych losowych X 1,... X k : ( k ) k E a i X i = a i E (X i ), (18) i i jeżeli a i = 1 dla wszystkich i wtedy wartość oczekiwana sumy jest sumą wartości oczekiwanych. 4 Dla funkcji tworzącej nową zmienną losową g( ): k E (g(x)) = g(x i )f x(x i ), (19) i i w przypadku ciągłęj zmiennej losowej: E (g(x)) = g(x i )f x(x i ), (20) Jakub Mućk Metody Ekonometyczne Wykład 1 18 / 45 i
Wartość oczekiwana III Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Warunkowa wartość oczekiwana (conditional expected value) jest wartością oczekiwaną X w przypadku gdy Y jest znane. Dla dyskretnych zmiennych losowych: E(X Y = y) = k x if (x i, y). (21) i=1 Jakub Mućk Metody Ekonometyczne Wykład 1 19 / 45
Wariancja & Kowariancja I Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Wariancja (variance) mierzy stopień zmienności (variability) zmiennej losowej: Var(X) = E [ (X µ) 2], (22) where E(X) = µ. Wariancja jest zazwyczaj zonaczana jako σ 2 (lub σ 2 X for X). Alternatywnie, wariancję zmiennej losowej można zapisać jako: Var(X) = E ( X 2 2Xµ + µ 2) = E(X 2 ) 2µE(X) µ 2 = E ( X 2) µ 2. Dla dowolnych stałych wartości a i b: Var(aX + b) = a 2 Var(X). (23) Odchylenie standardowe (standard deviation, sd)jest pierwiastkiem wariancji sd(x) = Var(X) (24) Jakub Mućk Metody Ekonometyczne Wykład 1 20 / 45
Wariancja & Kowariancja II Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Dla dowolnych stałych a i b: Var(aX + by ) = a 2 Var(X) + b 2 Var(Y ) + cov(x, Y ). (25) Kowariancja (covariance) mierzy zależność pomiedzy zmiennymi losowymi: cov (X, Y ) = E [(X µ X ) (Y µ Y )], (26) where E(Y ) = µ Y i E(X) = µ X. Kowariancja pomiędzy X i Y jest również oznaczana jako σ XY. Kowariancja może zostać alternatywnie zapisana jako: cov (X, Y ) = E [(X µ X ) (Y µ Y )] E [X (Y µ Y )] = E [(X µ X ) Y ] = E (XY ) µ X µ Y Gdy X i Y są niezależne to cov(x, Y ) = 0 i E(XY ) = E(X)E(Y ). Jakub Mućk Metody Ekonometyczne Wykład 1 21 / 45
Wariancja & Kowariancja III Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Na podstawie kowariancji trudno ocenić siłę zależności pomiędzy zmiennymi losowymi. Korelacja correlation (ρ) uwzględnia potencjalne różnice w wariancji zmiennych losowych: and ρ < 0, 1 >. ρ = Dlasze własności wariancji: cov(x, Y ) = σ XY, (27) var(x) var(y ) σ X σ Y Var (ax + by ) = a 2 Var (X) + b 2 Var (Y ) + 2abCov (X, Y ), (28) Var (ax by ) = a 2 Var (X) + b 2 Var (Y ) 2abCov (X, Y ). (29) Jakub Mućk Metody Ekonometyczne Wykład 1 22 / 45
Własności estymatora Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa Estymator ˆθ jest funkcją zmiennej losowej (zmiennych losowych) oraz próby (danych empirycznych) mającą na celu pomiar (empiryczny) parametru θ. Nieobciążoność (unbiasedness) estymatora: E (ˆθ) = θ lub Bias (ˆθ) = E (ˆθ) θ = 0, (30) gdzie Bias (ˆθ) to obciążenie estymatora. Wariancja estymatora ˆθ: Var (ˆθ ) = E [ (ˆθ E (ˆθ)) 2 ], (31) wariancja może służyć jako miara efektywności estymatora. Zgodność (consistency) estymatora: gdzie plim n to granica stochastyczna. Nieobciążoność nie implikuje zgodności i zgodność nie implikuje nieobciążoności. plim n ˆθn = θ, (32) Jakub Mućk Metody Ekonometyczne Wykład 1 23 / 45
Przykład Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa f(θ) 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 θ = θ^ 0 1 2 3 4 θ Jakub Mućk Metody Ekonometyczne Wykład 1 24 / 45
Przykład - obciążenie Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa f(θ) 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 θ^ θ 1 0 1 2 3 θ Jakub Mućk Metody Ekonometyczne Wykład 1 25 / 45
Przykład efektywność Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa f(θ) 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 θ^a = θ θ^b = θ 0 1 2 3 4 θ Jakub Mućk Metody Ekonometyczne Wykład 1 26 / 45
Przykład zgodność Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa f(θ) 0.0 0.2 0.4 0.6 0.8 θ^1 θ^2 θ^3 θ^n 0 1 2 3 4 5 6 θ Jakub Mućk Metody Ekonometyczne Wykład 1 27 / 45
Outline 1 Sprawy organizacyjne Literatura Zaliczenie przedmiotu 2 Czym jest ekonometria? 3 Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa 4 5 Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Jakub Mućk Metody Ekonometyczne Wykład 1 28 / 45
Punkt wyjścia rozkład warunkowy zmiennej Y względem zmiennej X. f(y x=a) f(y x) µ y a y Jakub Mućk Metody Ekonometyczne Wykład 1 29 / 45
Punkt wyjścia rozkład warunkowy zmiennej Y względem zmiennej X. f(y x=a) f(y x=b) f(y x) µ y a µ y b y Jakub Mućk Metody Ekonometyczne Wykład 1 29 / 45
E(y x) x E(y x) β 1 = E(y x) x Regresja prosta: E(y x) = β 0 + β 1 x x Jakub Mućk Metody Ekonometyczne Wykład 1 30 / 45
E(y x) β 1 x E(y x) β 1 = E(y x) x Regresja prosta: E(y x) = β 0 + β 1 x x Jakub Mućk Metody Ekonometyczne Wykład 1 30 / 45
Outline Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa 1 Sprawy organizacyjne Literatura Zaliczenie przedmiotu 2 Czym jest ekonometria? 3 Rozkład prawdopodbieństwa Własności rozkładu prawdopodbieństwa 4 5 Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Jakub Mućk Metody Ekonometyczne Wykład 1 31 / 45
Oznaczenia Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Zapis ogólny: Zapis macierzowy gdzie y = y 1 y 2. y n y = β 0 + β 1x 1 + β 2x 2 +... + β k x k + ε. (33) n 1 β =, X = β 0 β 1. β k y = Xβ + ε (34) 1 x 1,1 x 1,2... x 1,k 1 x 2,1 x 2,2... x 2,k..... 1 x n,1 x n,2... x n,k (k+1) 1, ε = ε 1 ε 2. ε n n 1 k liczba zmiennych objaśniających; n liczba obserwacji., n (k+1) Jakub Mućk Metody Ekonometyczne Wykład 1 32 / 45,
Oznaczenia (cd.) Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa β oznacza prawdziwą (nieznaną) wartość wektora parametru a ˆβ jego oszacowanie (szacunek), tj. wynik estymacji. y jest obserwowaną (empriczyną) wartością zmiennej objaśnanej, a ŷ wartością teoretyczną, a więc wynikąjącą z oszacowań, tj.: ŷ = X ˆβ. (35) ε to składnik losowy. Jego realizacje stanowi e, czyli tzw. reszty (składnik losowy): e = y ŷ = y X ˆβ. (36) Jakub Mućk Metody Ekonometyczne Wykład 1 33 / 45
Założenia estymatora MNK Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Dla następującego modelu liniowego: załóżmy, że y = Xβ + ε, (37) 1 Brak współliniowości: rz(x) = k + 1 n; macierz obserwacji X jest pełnego rzędu kolumnowego. 2 Zmienne xi są ściśle egzogeniczne, a więc są niezależne od składnika losowego, tj. E(Xε) = 0. 3 E(ε) = 0. 4 Sferyczna macierz wariancji-kowariancji składnika losowego: Var(ε) = E(εε T ) = I σ 2. 5 εi N (0, σ 2 ). Kluczowe są założenia (1)-(4). Założenie o normalności składnika losowego jest pomocnicze. Jakub Mućk Metody Ekonometyczne Wykład 1 34 / 45
wyprowadzenie I Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Załóżmy, że badane zjawisko można opisać modelem postaci [lub prawdziwy proces generujący zmienną y jest następujący]: y = Xβ + ε, (38) Nieznane parametry można uzyskać przy pomocy Metody Najmniejszych Kwadratów (OLS ordinary least squares). Idea tej metody polega na znalezieniu takich wartości nieznanego wektora parametrów β, który minimalizują sumę kwadratów reszt, czyli różnic pomiędzy wartościami obserwowanymi a teoretycznymi: gdzie e = y ŷ = y X ˆβ. ˆβ OLS = arg min e T e, (39) β Przyjmijmy sumę kwadratów reszt (SSE - error sum of squares) jako funkcję szukanego wektora parametrów β, którą chcemy minimalizować: SSE(β) = e T e = (y ŷ) T (y ŷ) = (y Xβ) T (y Xβ), (40) Jakub Mućk Metody Ekonometyczne Wykład 1 35 / 45
wyprowadzenie II Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Po przemnożeniu macierzy w (40), otrzymujemy: SSE(β) = yy T 2y T Xβ + β T X T Xβ, (41) Zróżniczkujmy wyrażenie (41) po β, wtedy otrzymamy: SSE(β) β = 2X T y + 2X T Xβ, (42) Przyrównując pierwszą pochodną, tj. (42), otrzymujemy układ równań X T y = X T Xβ, (43) Ostatecznie, wykorzystując założenie o pełnym rzędzie kolumnowym macierzy X : ˆβ OLS = ( X T X ) 1 X T y. (44) Jakub Mućk Metody Ekonometyczne Wykład 1 36 / 45
Dygresja regresja prosta Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Model regresji prostej (alternatywnej notacji): gdzie i oznacza indeks obserwacji. y i = β 0 + β 1x i + ε i, i = 1, 2,..., N, (45) dla parametrów równania (45) można wyrazić następująco: ˆβ OLS ˆβ OLS 0 = ȳ 1 x, (46) N ˆβ 1 OLS (x i i x) (y i ȳ) = N. (47) (x i i x) 2 Interpretacja? Jakub Mućk Metody Ekonometyczne Wykład 1 37 / 45
Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Estymator wariancji-kowariancji wektora oszacowań I Ogólny wzór dla estymatora macierzy wariancji-kowariancji oszacowań ( ˆβ OLS ): Var( ˆβ OLS ) = E [ ( ˆβOLS β ) ( ˆβOLS β ) T ]. (48) Zauważmy, że ˆβ OLS = ( X T X ) 1 X T y = ( X T X ) 1 X T (Xβ + ε) = β + ( X T X ) 1 X T ε, (49) wtedy [ (X Var( ˆβ OLS ) = E T X ) ( 1 (X X T ε T X ) ) ] 1 T X T ε [ (X = E T X ) 1 X T εε T X ( X T X ) ] 1 = ( X T X ) 1 X T E [ εε T] X ( X T X ) 1 Jakub Mućk Metody Ekonometyczne Wykład 1 38 / 45
Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Estymator wariancji-kowariancji wektora oszacowań II Następnie korzystając z założenie o sferyczności macierzy wariancjikowariancji składnika losowego, tj. D 2 (ε) = E(εε T ) = σ 2 I, można uprościć wzór na estymator wariancji kowariancji oszacowań do: Var( ˆβ OLS ) = σ 2 ( X T X ) 1. (50) W przypadku MNK, możemy wyznaczyć estymator macierzy wariancji-kowariancji dla parametrów ˆβ OLS korzystając z szacunku wariancji wariancji składnika losowego (S 2 ε): Var( ˆβ OLS ) = S 2 ε(x T X) 1, (51) gdzie S 2 ɛ = e T e n (k + 1) = SSE( ˆβ OLS ) df (52) gdzie SSE( ˆβ OLS ) to suma kwadratów reszt, a df to liczba stopni swobody. Jakub Mućk Metody Ekonometyczne Wykład 1 39 / 45
Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Estymator wariancji-kowariancji wektora oszacowań III Element diagonalne macierzy wariancji-kowariancji (oznaczmy jako ˆd ii), stanowią wariancję estymowanych parametrów. Zatem błąd szacunku dla i-tego parametru jest równy: S( ˆβ i) = d ii. (53) Względny błąd szacunku S( ˆβ i). (54) ˆβ i Jakub Mućk Metody Ekonometyczne Wykład 1 40 / 45
Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Założenia: 1 rz(x) = k + 1 n 2 E(Xε) = 0 3 E(ε) = 0 4 Var(ε) = E(εε T ) = I σ 2 5 εi N (0, σ 2 ) Twierdzenie Gaussa - Markowa Estymator ˆβ uzyskany Klasyczną Metodą Najmniejszych Kwadratów jest estymatorem BLUE [best linear unbiased estimator], tj. zgodnym, nieobciążonym i najefektywniejszy w klasie liniowych estymatorów wektora β. nieobciążoność, czyli: E( ˆβ OLS ) = β najefektywniejszy, czyli posiadający najmniejszą wariancję w swojej klasie zgodny, czyli: plim n ( ˆβ OLS ) = β. Jakub Mućk Metody Ekonometyczne Wykład 1 41 / 45
Nieobciążoność estymatora KMNK Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Niebciążoność estymatora: E ( ˆβOLS ) = β. (55) Korzystając z tożsamości y = Xβ + ε postać estymatora KMNK może zostać zapisana jako: ˆβ OLS = (X T X) 1 X T y = (X T X) 1 X T (Xβ + ε). (56) Korzystając z faktu, że (X T X) 1 X T X = I ˆβ OLS = β + (X T X) 1 X T ε. (57) Wprowadźmy wartość oczekiwaną: E ( ˆβOLS ) = E (β) + E [ (X T X) 1 X T ε ], (58) Wiedząc, że E (β) = β oraz wykorzystując nielosowość zmiennych objaśniających, tj. E (X) = X E ( ˆβOLS ) = β + (X T X) 1 X T E(ε), (59) a przy założeniu, że E(εX) = 0 otrzymujemy: E ( ˆβOLS ) = β. (60) Jakub Mućk Metody Ekonometyczne Wykład 1 42 / 45
Liniowość estymatora KMNK Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Na podstawie wszcześniejszych obliczeń: Założmy, że A = (X T X) 1 X T. Wtedy ˆβ OLS = β + (X T X) 1 X T ε. (61) ˆβ OLS = β + Aε, (62) a więc ˆβ OLS jest liniową funkcją składnika losowego. Zgodnie z założeniami, które przyjeliśmy ˆβ OLS jest zatem estymatorem liniowym. Jakub Mućk Metody Ekonometyczne Wykład 1 43 / 45
Efektywność estymatora MNK I Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Wprowadźmy, inny nieobciążony estymator liniowy parametru β, np. ˆB = Cy. Zatem E( ˆB) = E (CXβ + Cε) = β (63) Warto zauważyć, żę CX = I. Wariancja estymatora ˆB: Var( ˆB) = σ 2 CC T. (64) Porównując wariancję, wprowadźmy wyrażenie D = C ( X T X ) 1 X T. Wariancja estymatora ˆB: Var( ˆB) = σ 2 [ ( D + ( X T X ) 1 X T ) ( D + ( X T X ) ) ] 1 T X T, (65) DX = 0 ze względu na tożsamość CX = I = DX + ( X T X ) 1 ( X T X ). Zatem wariancję można zapisać: Var( ˆB) = σ 2 ( X T X ) 1 + σ 2 DD T = Var( ˆβ OLS ) + σ 2 DD T. (66) Jakub Mućk Metody Ekonometyczne Wykład 1 44 / 45
Zgodność estymatora MNK Oznaczenia Założenia estymatora MNK Wyprowadzenie estymatora MNK Twierdzenie Gaussa -Markowa Zgodność estymatora MNK: plim n ˆβOLS = β (67) Korzystając z wcześniejszej tożsamości (E ( ˆβOLS ) = β + (X T X) 1 X T E(ε)): plim n ˆβOLS = β + plim n (X T X) 1 X T E(ε). (68) Mnożymy wyrażenie przez jeden, tj. 1 = 1/n n: ( ) 1 1 1 plim ˆβOLS n = β + plim n n XT X n XT E(ε). (69) Korzystając z egzogeniczności: plim n 1 n XT E(ε) = 0, (70) Ponadto, zauwżmy, że o ile wyrażenie plim n (X T X) trudno ograniczyć to plim n (1/nX T X) można ograniczyć przez pewną wartość C. Wtedy: plim n ˆβOLS = β + C 0 = β. (71) Jakub Mućk Metody Ekonometyczne Wykład 1 45 / 45