Część 1
to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych
to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych Czyli obserwujemy te same obiekty w kolejnych momentach czasu
to dane, które jednocześnie posiadają cechy danych przekrojowych i szeregów czasowych Czyli obserwujemy te same obiekty w kolejnych momentach czasu
Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego
Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji
Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji Gdy n = 1, a T jest duże to zbór danych jest szeregiem czasowym
Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji Gdy n = 1, a T jest duże to zbór danych jest szeregiem czasowym Gdy T = 1, a n jest duże to zbór danych jest próbą przekrojową
Obserwacje dotyczące jednego okresu czasu t nazywamy falą badania panelowego Jeżeli każda fala zawiera N obserwacji, po panel zawiera n T obserwacji Gdy n = 1, a T jest duże to zbór danych jest szeregiem czasowym Gdy T = 1, a n jest duże to zbór danych jest próbą przekrojową O danych panelowych mówimy, gdy n > 1, oraz T > 1
Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony
Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka
Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka Zaletą danych panelowych jest większą ilość informacji o tych samych obiektach
Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka Zaletą danych panelowych jest większą ilość informacji o tych samych obiektach umożliwiają jednoczesne uwzględnienie zróżnicowania badanych obiektów, oraz ich ewolucji w czasie
Właściwości estymatorów dla danych panelowych wyprowadza się przy założeniu, że jeden w wymiarów jest nieskończony W praktyce, zazwyczaj liczba obiektów n jest duża, a liczba okresów T niewielka Zaletą danych panelowych jest większą ilość informacji o tych samych obiektach umożliwiają jednoczesne uwzględnienie zróżnicowania badanych obiektów, oraz ich ewolucji w czasie Często agregacja danych indywidualnych na poziomie mikro dostarcza inne informacji niż analiza na poziomie makro
Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji
Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich
Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich Z danych makro wiemy, że wybrano miasto B
Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich Z danych makro wiemy, że wybrano miasto B Na poziomie mikro wiemy, że w pierwszej rundzie głowy rozłożyły się następująco Miasto A B C D Głosy 21 15 10 6
Przykład - agregacja preferencji TWP pozwalają analizować proces podejmowania decyzji MKOL wybiera gospodarza igrzysk olimpijskich Z danych makro wiemy, że wybrano miasto B Na poziomie mikro wiemy, że w pierwszej rundzie głowy rozłożyły się następująco Miasto A B C D Głosy 21 15 10 6 wiedząc, że głosujący mieli a-priori zdefiniowane preferencje, znając zasady wyboru możemy odtworzyć mechanizm decyzyjny
Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych
Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych Czasochłonność badania
Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych Czasochłonność badania Niedoskonałość baz danych
Ograniczenia wykorzystania danych panelowych Wysokie koszty pozyskania danych Czasochłonność badania Niedoskonałość baz danych Problemy odmowy uczestnictwa i wycofywania się (wypadania) jednostek z badania
Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia
Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia Czy wzrost jest efektem zwiększonego napływu osób do bezrobocia, czy zmniejszył się odpływ z bezrobocia czy może wzrósł czas trwania bezrobocia?
Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia Czy wzrost jest efektem zwiększonego napływu osób do bezrobocia, czy zmniejszył się odpływ z bezrobocia czy może wzrósł czas trwania bezrobocia? Na podstawie danych przekrojowych nie można udzielić odpowiedzi
Przykład - Zalety danych panelowych Na podstawie danych BAEL2008Q4 wiemy, że wzrosła stopa bezrobocia Czy wzrost jest efektem zwiększonego napływu osób do bezrobocia, czy zmniejszył się odpływ z bezrobocia czy może wzrósł czas trwania bezrobocia? Na podstawie danych przekrojowych nie można udzielić odpowiedzi Ale bezrobotni stanowią tylko około 5% populacji, więc będziemy wnioskować na podstawie niewielkiej liczby obserwacji
Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane
Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne
Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne Jeżeli okres rotacji panelu wynosi k, to w każdej fali jest 1 k N nowych obiektów
Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne Jeżeli okres rotacji panelu wynosi k, to w każdej fali jest 1 k N nowych obiektów Zastępują one obiekty, które przetrwały k okresów
Panele rotacyjne Panele zbilansowane Klasyczny schemat losowania panelowego, tj. losowanie tzw. panelu zbilansowanego, jest rzadko stosowane Dużo częściej wykorzystywane są tzw. panele rotacyjne Jeżeli okres rotacji panelu wynosi k, to w każdej fali jest 1 k N nowych obiektów Zastępują one obiekty, które przetrwały k okresów Zaleta schematu rotacyjnego jest mniejsza liczba odmów uczestnictwa, oraz mniejsza liczba obiektów wypadających
Klasyczny schemat rotacyjny Panele rotacyjne Panele zbilansowane T/próba A B C D E F G H 1 X 2 X X 3 X X X 4 X X X 5 X X X 6 X X X 7 X X X 8 X X X
Schemat Panelu BBGD Panele rotacyjne Panele zbilansowane rok/próba 1 2 3 4 5 6 7 8 2001 X 2002 X X 2003 X X X 2004 X X X X 2005 X X X X 2006 X X X X 2007 X X X X 2008 X X X X
Panele rotacyjne Panele zbilansowane
Panele rotacyjne Panele zbilansowane Panel zbilansowany Panelem zbilansowanym nazywamy zbiór danych panelowych, w którym dla wszystkich N obiektów dysponujemy T obserwacjami
Panele rotacyjne Panele zbilansowane Panel zbilansowany Panelem zbilansowanym nazywamy zbiór danych panelowych, w którym dla wszystkich N obiektów dysponujemy T obserwacjami w praktyce panele zbilansowane spotykane są w badaniach makroekonomicznych
Panele rotacyjne Panele zbilansowane Panel zbilansowany Panelem zbilansowanym nazywamy zbiór danych panelowych, w którym dla wszystkich N obiektów dysponujemy T obserwacjami w praktyce panele zbilansowane spotykane są w badaniach makroekonomicznych trudno jest przy dużej liczbie badanych obiektów zapewnić zbilansowanie
Schemat panelu zbilansowanegp Panele rotacyjne Panele zbilansowane T/próba A B C D E F G H 1 X X X X X X X X 2 X X X X X X X X 3 X X X X X X X X 4 X X X X X X X X 5 X X X X X X X X 6 X X X X X X X X 7 X X X X X X X X 8 X X X X X X X X
Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera
Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera Albo charakter trwały np. zmiana miejsca zamieszkania
Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera Albo charakter trwały np. zmiana miejsca zamieszkania Trwałe wypadanie obiektów z badanie panelowego nazywamy wycieraniem się panelu
Panele rotacyjne Panele zbilansowane Brak wszystkich jednostek podczas badania może mieć charakter przypadkowy (losowy), np.nieobecność w domu podczas wizyty ankietera Albo charakter trwały np. zmiana miejsca zamieszkania Trwałe wypadanie obiektów z badanie panelowego nazywamy wycieraniem się panelu Braki w obserwacjach mogą powodować obciążenie estymatorów, gdy proces powodujący powstawanie braków ma związek z charakterystykami obiektów
Przykład - wycieranie się BAEL Panele rotacyjne Panele zbilansowane ID: 4400004, 4400009,..., 4460243 n = 3318 DATE: 2002q1, 2002q2,..., 2003q2 T = 4 Delta(DATE) = 1 quarter Span(DATE) = 6 periods Distribution of T_i: min 5% 25% 50% 75% 95% max 1 1 2 4 4 4 4 Freq. Percent Cum. Pattern ---------------------------+--------- 1676 50.51 50.51 11..11 465 14.01 64.53 11... 375 11.30 75.83...11 153 4.61 80.44...1 152 4.58 85.02.1..11 134 4.04 89.06 11..1. 126 3.80 92.86 1... 82 2.47 95.33.1... 51 1.54 96.87...1. 33 0.99 97.86 11...1 24 0.72 98.58 1...11 18 0.54 99.13.1..1. 29 0.87 100.00 (other patterns) ---------------------------+--------- 3318 100.00 XX..XX
Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it
Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu
Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu Błąd losowy składa się z dwóch elementów
Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu Błąd losowy składa się z dwóch elementów błędu u i zawierającego stałe w czasie nieobserwowane charakterystyki
Model efektów nieobserwowanych POLS Własności estymatora MNK Podstawowym modelem jest liniowy model efektów nieobserwowanych y it = X it β + u i + ε it Obserwacje są podwójnie indeksowane: i oznacza obiekt, t okres czasu Błąd losowy składa się z dwóch elementów błędu u i zawierającego stałe w czasie nieobserwowane charakterystyki błędu czysto losowego ε it
Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS
Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS W takim przypadku pomijamy informacje o strukturze próby, więc estymatory nie będą efektywne
Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS W takim przypadku pomijamy informacje o strukturze próby, więc estymatory nie będą efektywne Warunki nieobciążoności i zgodności estymatora są takie same jak w przypadku regresji dla danych przekrojowych dla dużej próby
Model efektów nieobserwowanych POLS Własności estymatora MNK Oszacowania parametrów można uzyskać przeprowadzając regresję na całej próbie Pooled OLS W takim przypadku pomijamy informacje o strukturze próby, więc estymatory nie będą efektywne Warunki nieobciążoności i zgodności estymatora są takie same jak w przypadku regresji dla danych przekrojowych dla dużej próby Cechą specyficzną jest zgodność estymatora przy N, gdy T jest skończone
Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it
Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it Wygodnie jest zapisać, go w postaci y it = X it β + v it v it = u i + ε it
Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it Wygodnie jest zapisać, go w postaci y it = X it β + v it v it = u i + ε it Z własności MNK wynika, że estymator będzie zgodny gdy it E(v it ) = 0 it cov(v it, x it ) = 0
Model efektów nieobserwowanych POLS Własności estymatora MNK Aby oszacować parametry modelu y it = X it β + u i + ε it Wygodnie jest zapisać, go w postaci y it = X it β + v it v it = u i + ε it Z własności MNK wynika, że estymator będzie zgodny gdy it E(v it ) = 0 it cov(v it, x it ) = 0 Oraz odpowiednie kowariancje elementów składnika losowego są skończone
Model efektów nieobserwowanych POLS Własności estymatora MNK O błędzie czysto losowym zakładamy, że it E(ε it ) = 0 it cov(ε it, x it ) = 0
Model efektów nieobserwowanych POLS Własności estymatora MNK O błędzie czysto losowym zakładamy, że it E(ε it ) = 0 it cov(ε it, x it ) = 0 Przy spełnionych założeniach warunkiem koniecznym dla zgodności jest estymatora MNK jest brak korelacji pomiędzy efektem indywidualnym, a charakterystykami jednostek it E(u i ) = 0 it cov(u i, x it ) = 0
Model efektów nieobserwowanych POLS Własności estymatora MNK gdy dodatkowo E(ε it X ) = 0 E(u i X ) = 0
Model efektów nieobserwowanych POLS Własności estymatora MNK gdy dodatkowo E(ε it X ) = 0 E(u i X ) = 0 Estymator MNK będzie nieobciążony
Model efektów nieobserwowanych POLS Własności estymatora MNK gdy dodatkowo E(ε it X ) = 0 E(u i X ) = 0 Estymator MNK będzie nieobciążony Podsumowując, estymator MNK jest zgodny, jeżeli efekty indywidualne nie sa skorelowane ze zmiennymi objaśniającymi
Model efektów nieobserwowanych POLS Własności estymatora MNK Przy spełnionych założeniach estymator MNK zastosowany do pełnej próby jest estymatorem zgodnym
Model efektów nieobserwowanych POLS Własności estymatora MNK Przy spełnionych założeniach estymator MNK zastosowany do pełnej próby jest estymatorem zgodnym Na mocy twierdzenia Gaussa-Markowa estymator MNK jest efektywny, gdy błąd losowy jest honoscedastyczny i nieskorelowany
Model efektów nieobserwowanych POLS Własności estymatora MNK Przy spełnionych założeniach estymator MNK zastosowany do pełnej próby jest estymatorem zgodnym Na mocy twierdzenia Gaussa-Markowa estymator MNK jest efektywny, gdy błąd losowy jest honoscedastyczny i nieskorelowany Przyjmijmy, że var(ε X ) = σ 2 εi var(u X ) = σ 2 ui cov(u, ε X ) = 0
Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż
Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż Wariancja wynosi var(v it X ) = var(u it + ε it X )
Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż Wariancja wynosi var(v it X ) = var(u it + ε it X ) var(v it X ) = var(u i X ) + var(ε it X ) + 2cov(u i, ε it X )
Model efektów nieobserwowanych POLS Własności estymatora MNK Problemem jest fakt, iż te założenia nie implikują homoscedastyczności i braku autokorelacji łącznego składnika losowego, gdyż Wariancja wynosi var(v it X ) = var(u it + ε it X ) var(v it X ) = var(u i X ) + var(ε it X ) + 2cov(u i, ε it X ) var(v it X ) = σ 2 u + σ 2 ε
Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla różnych jednostek wynosi cov(v it, v js X ) = cov(u i + ε it, u j + ε js X ) =
Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla różnych jednostek wynosi cov(v it, v js X ) = cov(u i + ε it, u j + ε js X ) = = cov(u i, u j X )+cov(u i, ε js X )+cov(u j, ε it X )+cov(ε it, ε js X )
Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla różnych jednostek wynosi cov(v it, v js X ) = cov(u i + ε it, u j + ε js X ) = = cov(u i, u j X )+cov(u i, ε js X )+cov(u j, ε it X )+cov(ε it, ε js X ) cov(v it, v js X ) = 0
Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla tej samej jednostki w różnych momentach czasu cov(v it, v is X ) = cov(u i + ε it, u i + ε is X ) =
Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla tej samej jednostki w różnych momentach czasu cov(v it, v is X ) = cov(u i + ε it, u i + ε is X ) = = var(u i X ) + cov(u i, ε is X ) + cov(u i, ε it X ) + cov(ε it, ε is X )
Model efektów nieobserwowanych POLS Własności estymatora MNK Kowariancja dla tej samej jednostki w różnych momentach czasu cov(v it, v is X ) = cov(u i + ε it, u i + ε is X ) = = var(u i X ) + cov(u i, ε is X ) + cov(u i, ε it X ) + cov(ε it, ε is X ) cov(v it, v is X ) = σ 2 u
Model efektów nieobserwowanych POLS Własności estymatora MNK Zatem macierz wariancji kowariancji łącznego błędu losowego nie jest diagnonalna σu 2 + σε 2 σu 2... σ 2 u σu 2 σu 2 + σε 2... σ 2 u.. σu 2 σu 2... σu 2 + σε 2
Model efektów nieobserwowanych POLS Własności estymatora MNK Zatem macierz wariancji kowariancji łącznego błędu losowego nie jest diagnonalna σu 2 + σε 2 σu 2... σ 2 u σu 2 σu 2 + σε 2... σ 2 u.. σu 2 σu 2... σu 2 + σε 2 więc estymator nie jest efektywny
Model efektów nieobserwowanych POLS Własności estymatora MNK Zatem macierz wariancji kowariancji łącznego błędu losowego nie jest diagnonalna σu 2 + σε 2 σu 2... σ 2 u σu 2 σu 2 + σε 2... σ 2 u.. σu 2 σu 2... σu 2 + σε 2 więc estymator nie jest efektywny ponadto, estymator MNK nie jest zgodny
Model efektów nieobserwowanych POLS Własności estymatora MNK Linear regression Number of obs = 9902 F( 14, 3308) = 76.45 Prob > F = 0.0000 R-squared = 0.3287 Root MSE =.41133 (Std. Err. adjusted for 3309 clusters in ID) ------------------------------------------------------------------------------ Robust lnplaca Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wiek.7552931.1064074 7.10 0.000.546662.9639242 wiek2 -.0252919.0040584-6.23 0.000 -.0332493 -.0173346 wiek3.0003679.0000661 5.57 0.000.0002383.0004974 wiek4-1.97e-06 3.88e-07-5.07 0.000-2.73e-06-1.21e-06 plec -.2333247.0151957-15.35 0.000 -.2631186 -.2035308 wyksz_2 -.2946406.0233551-12.62 0.000 -.3404324 -.2488488 wyksz_3 -.4652174.0239769-19.40 0.000 -.5122284 -.4182064 wyksz_4 -.6854075.0336485-20.37 0.000 -.7513814 -.6194336 ------------------------------------------------------------------------------
Model efektów nieobserwowanych POLS Własności estymatora MNK ------------------------------------------------------------------------------ Robust lnplaca Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- klm_2 -.078814.0356332-2.21 0.027 -.1486793 -.0089487 klm_3 -.1246839.0285586-4.37 0.000 -.1806782 -.0686895 klm_4 -.1700034.0295606-5.75 0.000 -.2279622 -.1120445 rok_2.0001422.0048269 0.03 0.976 -.0093218.0096062 rok_3.0128227.0072163 1.78 0.076 -.0013262.0269716 rok_4.0077686.007808 0.99 0.320 -.0075403.0230775 _cons -.7713203 1.006398-0.77 0.443-2.744546 1.201906 ------------------------------------------------------------------------------