Definicja danych panelowych Typy danych panelowych Modele dla danych panelowych. Dane panelowe. Część 1. Dane panelowe

Podobne dokumenty
Stanisław Cichocki. Natalia Nehrebecka

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Czasowy wymiar danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

1 Modele ADL - interpretacja współczynników

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Egzamin z ekonometrii - wersja ogólna

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Natalia Neherbecka. 11 czerwca 2010

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Metoda najmniejszych kwadratów

Testowanie hipotez statystycznych

Zmienne sztuczne i jakościowe

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Problem równoczesności w MNK

Modele wielorównaniowe (forma strukturalna)

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria Ćwiczenia 19/01/05

Losowe zmienne objaśniające. Rozszerzenia KMRL. Rozszerzenia KMRL

1.9 Czasowy wymiar danych

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stacjonarność Integracja. Integracja. Integracja

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Ekonometria egzamin 07/03/2018

6 Modele wyborów dyskretnych dla danych panelowych

Autokorelacja i heteroskedastyczność

Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08

Metody Ekonometryczne

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:

Egzamin z ekonometrii IiE

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Budowa modelu i testowanie hipotez

Egzamin z ekonometrii

Prawdopodobieństwo i statystyka

Ekonometria egzamin wersja ogólna 29/01/08

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Metoda najmniejszych kwadratów

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria dla IiE i MSEMat Z12

Prawdopodobieństwo i statystyka

METODY STATYSTYCZNE W BIOLOGII

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

1.1 Klasyczny Model Regresji Liniowej

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Ekonometria dla IiE i MSEMat Z7

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Statystyka i eksploracja danych

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

1.5 Problemy ze zbiorem danych

Natalia Nehrebecka. Wykład 1

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Diagnostyka w Pakiecie Stata

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Własności statystyczne regresji liniowej. Wykład 4

Modele warunkowej heteroscedastyczności

Egzamin z ekonometrii wersja ogolna

Metoda największej wiarogodności

Heteroskedastyczość w szeregach czasowyh

Stanisław Cichocki. Natalia Nehrebecka

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

1.8 Diagnostyka modelu

1.7 Ograniczenia nakładane na równanie regresji

2.2 Autokorelacja Wprowadzenie

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

1.3 Własności statystyczne estymatorów MNK

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Metody Ekonometryczne

Natalia Nehrebecka. 18 maja 2010

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Transkrypt:

Część 1

to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych

to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych Czyli obserwujemy te same obiekty w kolejnych momentach czasu

to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych Czyli obserwujemy te same obiekty w kolejnych momentach czasu

Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego

Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji

Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji Gdy n = 1, a T jest duże to zbór danych jest szeregiem czasowym

Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji Gdy n = 1, a T jest duże to zbór danych jest szeregiem czasowym Gdy T = 1, a n jest duże to zbór danych jest próbą przekrojową

Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji Gdy n = 1, a T jest duże to zbór danych jest szeregiem czasowym Gdy T = 1, a n jest duże to zbór danych jest próbą przekrojową O danych panelowych mówimy, gdy n > 1, oraz T > 1

Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony

Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka

Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka Zaletą danych panelowych jest większą ilość informacji o tych samych obiektach

Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka Zaletą danych panelowych jest większą ilość informacji o tych samych obiektach umożliwiają jednoczesne uwzględnienie zróżnicowania badanych obiektów, oraz ich ewolucji w czasie

Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka Zaletą danych panelowych jest większą ilość informacji o tych samych obiektach umożliwiają jednoczesne uwzględnienie zróżnicowania badanych obiektów, oraz ich ewolucji w czasie Często agregacja danych indywidualnych na poziomie mikro dostarcza inne informacji niż analiza na poziomie makro

Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji

Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich

Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich Z danych makro wiemy, że wybrano miasto B

Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich Z danych makro wiemy, że wybrano miasto B Na poziomie mikro wiemy, że w pierwszej rundzie głowy rozłożyły się następująco Miasto A B C D Głosy 21 15 10 6

Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich Z danych makro wiemy, że wybrano miasto B Na poziomie mikro wiemy, że w pierwszej rundzie głowy rozłożyły się następująco Miasto A B C D Głosy 21 15 10 6 wiedząc, że głosujący mieli a-priori zdefiniowane preferencje, znając zasady wyboru możemy odtworzyć mechanizm decyzyjny

Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych

Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych Czasochłonność badania

Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych Czasochłonność badania Niedoskonałość baz danych

Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych Czasochłonność badania Niedoskonałość baz danych Problemy odmowy uczestnictwa i wycofywania się (wypadania) jednostek z badania

Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia

Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia Czy wzrost jest efektem zwiększonego napływu osób do bezrobocia, czy zmniejszył się odpływ z bezrobocia czy może wzrósł czas trwania bezrobocia?

Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia Czy wzrost jest efektem zwiększonego napływu osób do bezrobocia, czy zmniejszył się odpływ z bezrobocia czy może wzrósł czas trwania bezrobocia? Na podstawie danych przekrojowych nie można udzielić odpowiedzi

Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia Czy wzrost jest efektem zwiększonego napływu osób do bezrobocia, czy zmniejszył się odpływ z bezrobocia czy może wzrósł czas trwania bezrobocia? Na podstawie danych przekrojowych nie można udzielić odpowiedzi Ale bezrobotni stanowią tylko około 5% populacji, więc będziemy wnioskować na podstawie niewielkiej liczby obserwacji

Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane

Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne

Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne Jeżeli okres rotacji panelu wynosi k, to w każdej fali jest 1 k N nowych obiektów

Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne Jeżeli okres rotacji panelu wynosi k, to w każdej fali jest 1 k N nowych obiektów Zastępują one obiekty, które przetrwały k okresów

Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne Jeżeli okres rotacji panelu wynosi k, to w każdej fali jest 1 k N nowych obiektów Zastępują one obiekty, które przetrwały k okresów Zaleta schematu rotacyjnego jest mniejsza liczba odmów uczestnictwa, oraz mniejsza liczba obiektów wypadających

Klasyczny schemat rotacyjny Panele rotacyjne Panele zbilansowane T/próba A B C D E F G H 1 X 2 X X 3 X X X 4 X X X 5 X X X 6 X X X 7 X X X 8 X X X

Schemat Panelu BBGD Panele rotacyjne Panele zbilansowane rok/próba 1 2 3 4 5 6 7 8 2001 X 2002 X X 2003 X X X 2004 X X X X 2005 X X X X 2006 X X X X 2007 X X X X 2008 X X X X

Panele rotacyjne Panele zbilansowane

Panele rotacyjne Panele zbilansowane Panel zbilansowany Panelem zbilansowanym nazywamy zbiór danych panelowych, w którym dla wszystkich N obiektów dysponujemy T obserwacjami

Panele rotacyjne Panele zbilansowane Panel zbilansowany Panelem zbilansowanym nazywamy zbiór danych panelowych, w którym dla wszystkich N obiektów dysponujemy T obserwacjami w praktyce panele zbilansowane spotykane są w badaniach makroekonomicznych

Panele rotacyjne Panele zbilansowane Panel zbilansowany Panelem zbilansowanym nazywamy zbiór danych panelowych, w którym dla wszystkich N obiektów dysponujemy T obserwacjami w praktyce panele zbilansowane spotykane są w badaniach makroekonomicznych trudno jest przy dużej liczbie badanych obiektów zapewnić zbilansowanie

Schemat panelu zbilansowanegp Panele rotacyjne Panele zbilansowane T/próba A B C D E F G H 1 X X X X X X X X 2 X X X X X X X X 3 X X X X X X X X 4 X X X X X X X X 5 X X X X X X X X 6 X X X X X X X X 7 X X X X X X X X 8 X X X X X X X X

Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera

Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera Albo charakter trwały np. zmiana miejsca zamieszkania

Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera Albo charakter trwały np. zmiana miejsca zamieszkania Trwałe wypadanie obiektów z badanie panelowego nazywamy wycieraniem się panelu

Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera Albo charakter trwały np. zmiana miejsca zamieszkania Trwałe wypadanie obiektów z badanie panelowego nazywamy wycieraniem się panelu Braki w obserwacjach mogą powodować obciążenie estymatorów, gdy proces powodujący powstawanie braków ma związek z charakterystykami obiektów

Przykład - wycieranie się BAEL Panele rotacyjne Panele zbilansowane ID: 4400004, 4400009,..., 4460243 n = 3318 DATE: 2002q1, 2002q2,..., 2003q2 T = 4 Delta(DATE) = 1 quarter Span(DATE) = 6 periods Distribution of T_i: min 5% 25% 50% 75% 95% max 1 1 2 4 4 4 4 Freq. Percent Cum. Pattern ---------------------------+--------- 1676 50.51 50.51 11..11 465 14.01 64.53 11... 375 11.30 75.83...11 153 4.61 80.44...1 152 4.58 85.02.1..11 134 4.04 89.06 11..1. 126 3.80 92.86 1... 82 2.47 95.33.1... 51 1.54 96.87...1. 33 0.99 97.86 11...1 24 0.72 98.58 1...11 18 0.54 99.13.1..1. 29 0.87 100.00 (other patterns) ---------------------------+--------- 3318 100.00 XX..XX

Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it

Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu

Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu Błąd losowy składa się z dwóch elementów

Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu Błąd losowy składa się z dwóch elementów błędu u i zawierającego stałe w czasie nieobserwowane charakterystyki

Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu Błąd losowy składa się z dwóch elementów błędu u i zawierającego stałe w czasie nieobserwowane charakterystyki błędu czysto losowego ε it

Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS

Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS W takim przypadku pomijamy informacje o strukturze próby, więc estymatory nie będą efektywne

Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS W takim przypadku pomijamy informacje o strukturze próby, więc estymatory nie będą efektywne Warunki nieobciążoności i zgodności estymatora są takie same jak w przypadku regresji dla danych przekrojowych dla dużej próby

Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS W takim przypadku pomijamy informacje o strukturze próby, więc estymatory nie będą efektywne Warunki nieobciążoności i zgodności estymatora są takie same jak w przypadku regresji dla danych przekrojowych dla dużej próby Cechą specyficzną jest zgodność estymatora przy N, gdy T jest skończone

Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it

Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it Wygodnie jest zapisać, go w postaci y it = X it β + v it v it = u i + ε it

Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it Wygodnie jest zapisać, go w postaci y it = X it β + v it v it = u i + ε it Z własności MNK wynika, że estymator będzie zgodny gdy it E(v it ) = 0 it cov(v it, x it ) = 0

Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it Wygodnie jest zapisać, go w postaci y it = X it β + v it v it = u i + ε it Z własności MNK wynika, że estymator będzie zgodny gdy it E(v it ) = 0 it cov(v it, x it ) = 0 Oraz odpowiednie kowariancje elementów składnika losowego są skończone

Model efektów nieobserwowanych POLS Własności estymatora MNK O błędzie czysto losowym zakładamy, że it E(ε it ) = 0 it cov(ε it, x it ) = 0

Model efektów nieobserwowanych POLS Własności estymatora MNK O błędzie czysto losowym zakładamy, że it E(ε it ) = 0 it cov(ε it, x it ) = 0 Przy spełnionych założeniach warunkiem koniecznym dla zgodności jest estymatora MNK jest brak korelacji pomiędzy efektem indywidualnym, a charakterystykami jednostek it E(u i ) = 0 it cov(u i, x it ) = 0

Model efektów nieobserwowanych POLS Własności estymatora MNK gdy dodatkowo E(ε it X ) = 0 E(u i X ) = 0

Model efektów nieobserwowanych POLS Własności estymatora MNK gdy dodatkowo E(ε it X ) = 0 E(u i X ) = 0 Estymator MNK będzie nieobciążony

Model efektów nieobserwowanych POLS Własności estymatora MNK gdy dodatkowo E(ε it X ) = 0 E(u i X ) = 0 Estymator MNK będzie nieobciążony Podsumowując, estymator MNK jest zgodny, jeżeli efekty indywidualne nie sa skorelowane ze zmiennymi objaśniającymi

Model efektów nieobserwowanych POLS Własności estymatora MNK Przy spełnionych założeniach estymator MNK zastosowany do pełnej próby jest estymatorem zgodnym

Model efektów nieobserwowanych POLS Własności estymatora MNK Przy spełnionych założeniach estymator MNK zastosowany do pełnej próby jest estymatorem zgodnym Na mocy twierdzenia Gaussa-Markowa estymator MNK jest efektywny, gdy błąd losowy jest honoscedastyczny i nieskorelowany

Model efektów nieobserwowanych POLS Własności estymatora MNK Przy spełnionych założeniach estymator MNK zastosowany do pełnej próby jest estymatorem zgodnym Na mocy twierdzenia Gaussa-Markowa estymator MNK jest efektywny, gdy błąd losowy jest honoscedastyczny i nieskorelowany Przyjmijmy, że var(ε X ) = σ 2 εi var(u X ) = σ 2 ui cov(u, ε X ) = 0

Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż

Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż Wariancja wynosi var(v it X ) = var(u it + ε it X )

Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż Wariancja wynosi var(v it X ) = var(u it + ε it X ) var(v it X ) = var(u i X ) + var(ε it X ) + 2cov(u i, ε it X )

Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż Wariancja wynosi var(v it X ) = var(u it + ε it X ) var(v it X ) = var(u i X ) + var(ε it X ) + 2cov(u i, ε it X ) var(v it X ) = σ 2 u + σ 2 ε

Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla różnych jednostek wynosi cov(v it, v js X ) = cov(u i + ε it, u j + ε js X ) =

Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla różnych jednostek wynosi cov(v it, v js X ) = cov(u i + ε it, u j + ε js X ) = = cov(u i, u j X )+cov(u i, ε js X )+cov(u j, ε it X )+cov(ε it, ε js X )

Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla różnych jednostek wynosi cov(v it, v js X ) = cov(u i + ε it, u j + ε js X ) = = cov(u i, u j X )+cov(u i, ε js X )+cov(u j, ε it X )+cov(ε it, ε js X ) cov(v it, v js X ) = 0

Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla tej samej jednostki w różnych momentach czasu cov(v it, v is X ) = cov(u i + ε it, u i + ε is X ) =

Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla tej samej jednostki w różnych momentach czasu cov(v it, v is X ) = cov(u i + ε it, u i + ε is X ) = = var(u i X ) + cov(u i, ε is X ) + cov(u i, ε it X ) + cov(ε it, ε is X )

Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla tej samej jednostki w różnych momentach czasu cov(v it, v is X ) = cov(u i + ε it, u i + ε is X ) = = var(u i X ) + cov(u i, ε is X ) + cov(u i, ε it X ) + cov(ε it, ε is X ) cov(v it, v is X ) = σ 2 u

Model efektów nieobserwowanych POLS Własności estymatora MNK Zatem macierz wariancji kowariancji łącznego błędu losowego nie jest diagnonalna σu 2 + σε 2 σu 2... σ 2 u σu 2 σu 2 + σε 2... σ 2 u.. σu 2 σu 2... σu 2 + σε 2

Model efektów nieobserwowanych POLS Własności estymatora MNK Zatem macierz wariancji kowariancji łącznego błędu losowego nie jest diagnonalna σu 2 + σε 2 σu 2... σ 2 u σu 2 σu 2 + σε 2... σ 2 u.. σu 2 σu 2... σu 2 + σε 2 więc estymator nie jest efektywny

Model efektów nieobserwowanych POLS Własności estymatora MNK Zatem macierz wariancji kowariancji łącznego błędu losowego nie jest diagnonalna σu 2 + σε 2 σu 2... σ 2 u σu 2 σu 2 + σε 2... σ 2 u.. σu 2 σu 2... σu 2 + σε 2 więc estymator nie jest efektywny ponadto, estymator MNK nie jest zgodny

Model efektów nieobserwowanych POLS Własności estymatora MNK Linear regression Number of obs = 9902 F( 14, 3308) = 76.45 Prob > F = 0.0000 R-squared = 0.3287 Root MSE =.41133 (Std. Err. adjusted for 3309 clusters in ID) ------------------------------------------------------------------------------ Robust lnplaca Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wiek.7552931.1064074 7.10 0.000.546662.9639242 wiek2 -.0252919.0040584-6.23 0.000 -.0332493 -.0173346 wiek3.0003679.0000661 5.57 0.000.0002383.0004974 wiek4-1.97e-06 3.88e-07-5.07 0.000-2.73e-06-1.21e-06 plec -.2333247.0151957-15.35 0.000 -.2631186 -.2035308 wyksz_2 -.2946406.0233551-12.62 0.000 -.3404324 -.2488488 wyksz_3 -.4652174.0239769-19.40 0.000 -.5122284 -.4182064 wyksz_4 -.6854075.0336485-20.37 0.000 -.7513814 -.6194336 ------------------------------------------------------------------------------

Model efektów nieobserwowanych POLS Własności estymatora MNK ------------------------------------------------------------------------------ Robust lnplaca Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- klm_2 -.078814.0356332-2.21 0.027 -.1486793 -.0089487 klm_3 -.1246839.0285586-4.37 0.000 -.1806782 -.0686895 klm_4 -.1700034.0295606-5.75 0.000 -.2279622 -.1120445 rok_2.0001422.0048269 0.03 0.976 -.0093218.0096062 rok_3.0128227.0072163 1.78 0.076 -.0013262.0269716 rok_4.0077686.007808 0.99 0.320 -.0075403.0230775 _cons -.7713203 1.006398-0.77 0.443-2.744546 1.201906 ------------------------------------------------------------------------------