Stanisław Cichocki. Natalia Nehrebecka

Podobne dokumenty
Stanisław Cichocki. Natalia Nehrebecka

Definicja danych panelowych Typy danych panelowych Modele dla danych panelowych. Dane panelowe. Część 1. Dane panelowe

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Natalia Neherbecka. 11 czerwca 2010

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Zawansowane modele wyborów dyskretnych

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Ekonometria egzamin 07/03/2018

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Metody Ekonometryczne

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Testowanie hipotez statystycznych

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Egzamin z ekonometrii - wersja ogólna

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Egzamin z ekonometrii wersja IiE, MSEMAT

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Metoda najmniejszych kwadratów

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Testowanie hipotez statystycznych

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Modele wielorównaniowe (forma strukturalna)

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Modele zapisane w przestrzeni stanów

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Spis treści 3 SPIS TREŚCI

Własności statystyczne regresji liniowej. Wykład 4

Ćwiczenia IV

6 Modele wyborów dyskretnych dla danych panelowych

Joanna Muszyńska. Modelowanie danych panelowych Panel data models

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Ekonometria Ćwiczenia 19/01/05

Metoda najmniejszych kwadratów

Stanisław Cihcocki. Natalia Nehrebecka

Prawdopodobieństwo i statystyka

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Weryfikacja hipotez statystycznych

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

1.9 Czasowy wymiar danych

1.1 Klasyczny Model Regresji Liniowej

Metoda największej wiarogodności

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Ekonometria Wykład 4 Prognozowanie, sezonowość. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Czasowy wymiar danych

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Statystyka i eksploracja danych

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Wprowadzenie do analizy korelacji i regresji

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Metody Ekonometryczne

Metody Ekonometryczne

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

Egzamin z ekonometrii wersja ogolna

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Stanisław Cichocki Natalia Neherbecka

Autokorelacja i heteroskedastyczność

Stanisław Cichocki. Natalia Nehrebecka

Analiza składowych głównych. Wprowadzenie

Transkrypt:

Stanisław Cichocki Natalia Nehrebecka 1

2

3

1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych b) Model efektów losowych c) Model efektów stałych d) Modele z dwukierunkowym komponentem błędu 3. Testy a) Test istotności efektów stałych i losowych b) Test Hausmana 4

1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych b) Model efektów losowych c) Model efektów stałych d) Modele z dwukierunkowym komponentem błędu 3. Testy a) Test istotności efektów stałych i losowych b) Test Hausmana 5

Dane statystyczne dzieli się na trzy główne grupy: Szeregi czasowe Dane przekrojowe Dane panelowe Dzielone są na dwie kategorie: Dane połączone (pooled data) Dane panelowe (właściwe) Panel / longitudinal data 6

Dane połączone (pooled data) Dane z kilku okresów czasu dotyczące różnych prób przekrojowych Dane połączone to taki rodzaj danych, w którym nie rozróżniamy kolejnych jednostek badania. Korzyści: zwiększenie liczby stopni swobody z N na NT (N liczba obserwacji, T liczba okresów) 7

8

Dane panelowe właściwe Dane panelowe mają cechy zarówno próby przekrojowej, jak i szeregu czasowego. Zawierają one szereg obserwacji dla danej próby przekrojowej. Każda obserwacja przypisana jest jednej konkretnie jednostce badania za pomocą zmiennej, która identyfikuje tę jednostkę. Jednostki badania mogą być różnych rozmiarów: np. kraj, firma, rodzina, poszczególne osoby. W danych panelowych występuje także zmienna wskazująca na okres, w którym dana obserwacja była zebrana (kwartał, rok, itd.). 9

10

. xtset country year panel variable: country (strongly balanced) time variable: year, 1990 to 1999 delta: 1 unit 11

xtdes country: 1, 2,..., 7 n = 7 year: 1990, 1991,..., 1999 T = 10 Delta(year) = 1 unit Span(year) = 10 periods (country*year uniquely identifies each observation) Distribution of T_i: min 5% 25% 50% 75% 95% max 10 10 10 10 10 10 10 Freq. Percent Cum. Pattern ---------------------------+------------ 7 100.00 100.00 1111111111 ---------------------------+------------ 7 100.00 XXXXXXXXXX 12

. xtset idcode year panel variable: idcode (unbalanced) time variable: year, 68 to 88, but with gaps delta: 1 unit 13

xtdes idcode: 1, 2,..., 5159 n = 4709 year: 68, 69,..., 88 T = 15 Delta(year) = 1 unit Span(year) = 21 periods (idcode*year uniquely identifies each observation) Distribution of T_i: min 5% 25% 50% 75% 95% max 1 1 3 5 9 13 15 Freq. Percent Cum. Pattern ---------------------------+----------------------- 136 2.89 2.89 1... 114 2.42 5.31...1 89 1.89 7.20...1.11 87 1.85 9.05...11 86 1.83 10.87 111111.1.11.1.11.1.11 61 1.30 12.17...11.1.11 56 1.19 13.36 11... 54 1.15 14.50...1.1.11 54 1.15 15.65...1.11.1.11.1.11 3972 84.35 100.00 (other patterns) ---------------------------+----------------------- 4709 100.00 XXXXXX.X.XX.X.XX.X.XX 14

1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych b) Model efektów losowych c) Model efektów stałych d) Modele z dwukierunkowym komponentem błędu 3. Testy a) Test istotności efektów stałych i losowych b) Test Hausmana 15

. xtset country year panel variable: country (strongly balanced) time variable: year, 1990 to 1999 delta: 1 unit 16

17

18

Kontrolowanie heterogeniczności jednostek badania Heterogeneity across countries 19

Kontrolowanie heterogeniczności jednostek badania Heterogeneity across years 20

Kontrolowanie heterogeniczności jednostek badania Dane panelowe mają większą moc informacyjną, większą różnorodność, mniejszą współliniowość między zmiennymi, więcej stopni swobody oraz większą efektywność. Dane panelowe są bardziej odpowiednie do badania dynamiki dostosowań. Dane panelowe bardziej nadają się do identyfikowania i mierzenia efektów, które w oczywisty sposób nie są możliwe do analizy za pomocą prób przekrojowych i szeregów czasowych. 21

Projekt kwestionariusza oraz proces zbierania danych Niewystarczająca liczba jednostek, którymi badacz jest zainteresowany. Brak odpowiedzi brak współpracy respondenta lub błędy ankietera. Częstość przeprowadzania wywiadów. Błędy pomiarowe Problemy związane z selekcją jednostek Brak odpowiedzi związany z odmową przystąpienia do badania, nieobecnością respondenta w domu, itd. Wycieranie panelu (attrition) jest to trwałe wypadanie jednostek objętych badaniem z takich powodów jak: śmierć, przeprowadzka, dłuższy wyjazd (np. na studia). 22

23

1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych b) Model efektów losowych c) Model efektów stałych d) Modele z dwukierunkowym komponentem błędu 3. Testy a) Test istotności efektów stałych i losowych b) Test Hausmana 24

Liniowy model efektów nieobserwowalnych dla danych panelowych składających się z N jednostek i T okresów możemy zapisać następująco: i - indeks obserwacji, t - indeks czasu, y it - zmienna objaśniana dla i-tej jednostki w czasie t, x it - wektor obserwacji zmiennych objaśniających dla i-tej jednostki w czasie t, β - wektor parametrów, u i - efekt indywidualny dla i-tej jednostki, ε it - błąd czysto losowy dla i-tej jednostki w czasie t, υ it y it = x it β + u i + ε it υ it - łączny błąd losowy dla i-tej jednostki w czasie t Poznane przez nas modele będą różnić się koncepcją traktowania efektu indywidualnego 25

Model z jednokierunkowym komponentem błędu (one way error component model) υ it = u i + ε it u i - efekt indywidualny dla i-tej jednostki, ε it - błąd czysto losowy dla i-tej jednostki w czasie t υ it - łączny błąd losowy dla i-tej jednostki w czasie t Model z dwukierunkowym komponentem błędu (two way error component model) υ it = u i + λ t + ε it λ t - efekt czasowy 26

1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych b) Model efektów losowych c) Model efektów stałych d) Modele z dwukierunkowym komponentem błędu 3. Testy a) Test istotności efektów stałych i losowych b) Test Hausmana 27

Regresja typu pooled (Pooled Ordinary Least Square), to regresja na danych, które nie rozróżniają jednostek badania i okresów czasu. Zapominamy, iż dane mają wymiar przekrojowo-czasowy i estymujemy wszystkie obserwacje łącznie za pomocą metody najmniejszych kwadratów. Regresja ta nie wykorzystuje struktury danych panelowych nie bierze pod uwagę heterogeniczności jednostek badania. Wykorzystując metodę pooled regresion zakłada się, iż wszystkie obserwacje pochodzą z jednego okresu czasu, w wyniku czego w równaniu panelowym pojawia się łączny błąd losowy υ it )odpowiadający sumie ε it oraz u i ) y it = x it β + υ it, υ it = u i + ε it 28

29

Aby otrzymany estymator był estymatorem zgodnym, gdy: E v it = 0, Cov v it, x it = 0 zakładamy, że błąd czysto losowy ε it ma wartość oczekiwaną równą zero i jest nieskorelowany ze zmiennymi objaśniającymi: E ε it = 0, Cov ε it, x it = 0 musi być spełniony warunek braku korelacji pomiędzy efektami indywidualnymi a zmiennymi objaśniającymi: E u i = 0, Cov u i, x it = 0 30

Estymator MNK jest estymatorem nieobciążonym, jeśli E ε it X = 0 E u i X = 0 31

Otrzymany estymator MNK (przy powyższych założeniach) będzie estymatorem zgodnym, lecz nieefektywnym. Na podstawie twierdzenia Gaussa-Markowa estymator MNK jest efektywny, jeśli błąd losowy jest homoskedastyczny i nieskorelowany. Sformułowano założenia o tym że: Var u X) = σ 2 u I Var ε X) = σ 2 ε I Cov u, ε X = 0 ε = ε 11 ε 1T ε N1 ε NT ; u = u 1 u N Czy założenie te implikują homoskedastyczność i brak autokorelacji łącznego błędu losowego v it? 32

Przy tych założeniach wariancja błędu łącznego wynosi: Dla uproszczenie zapisu pomijamy warunkowanie względem X Var υ it = Var u i + ε it = Var u i + Var ε it + 2Cov u i, ε it = σ 2 u + σ 2 ε Dla t s, kowariancja między υ it i υ is jest równa Cov(υ it, υ is ) = σ u 2 Dla i j, kowariancja między υ it i υ jt jest równa Cov(υ it, υ jt ) = 0 W rezultacie macierz wariancji-kowariancji błędu losowego nie jest sferyczna! 33

Przy spełnieniu założeń E u i = 0, Cov u i, x it = 0 oraz w związku z występowaniem korelacji pomiędzy łącznymi błędami losowymi można stwierdzić, że oszacowany estymator parametrów modelu pooled regresion będzie zgodny, lecz nieefektywny. Powinno się w tym wypadku użyć estymatora warstwowego. W związku z tym wnioskowanie statystyczne przeprowadza się na podstawie estymacji, w której wykorzystano macierz odporną wariancji-kowariancji. 34

1. Czym różni się panel od próby przekrojowo-czasowej? 2. Zapisać liniowy model efektów nieobserwowalnych i zinterpretować jego elementy. 35

Dziękuję za uwagę 36