Zmienne sztuczne i jakościowe

Podobne dokumenty
Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Metoda najmniejszych kwadratów

Testowanie hipotez statystycznych

1.6 Zmienne jakościowe i dyskretne w modelu regresji

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Egzamin z ekonometrii - wersja ogólna

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Budowa modelu i testowanie hipotez

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Ekonometria dla IiE i MSEMat Z12

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria dla IiE i MSEMat Z7

Egzamin z ekonometrii wersja IiE, MSEMAT

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Czasowy wymiar danych

Ekonometria Ćwiczenia 19/01/05

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

1 Modele ADL - interpretacja współczynników

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Problem równoczesności w MNK

Egzamin z ekonometrii wersja IiE, MSEMAT

Zmienne Binarne w Pakiecie Stata

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 07/03/2018

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Heteroskedastyczość w szeregach czasowyh

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Natalia Nehrebecka. Wykład 1

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Modele wielorównaniowe (forma strukturalna)

Ekonometria egzamin wersja ogólna 17/06/08

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

1.9 Czasowy wymiar danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Analiza Szeregów Czasowych. Egzamin

Egzamin z ekonometrii wersja ogolna

Definicja danych panelowych Typy danych panelowych Modele dla danych panelowych. Dane panelowe. Część 1. Dane panelowe

1.7 Ograniczenia nakładane na równanie regresji

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Autokorelacja i heteroskedastyczność

Diagnostyka w Pakiecie Stata

Estymacja modeli ARDL przy u»yciu Staty

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie!

Modele warunkowej heteroscedastyczności

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin wersja ogólna 29/01/08

Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08

Diagnostyka w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

O sezonowości mówimy wtedy, gdy zmienna zmienia się w pewnym cyklu zwykle zwiazanym z cyklem rocznym

1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Autoregresyjne modele o rozłożonych opóźnieniach - Autoregressive Distributed Lags models

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Egzamin z Ekonometrii

1.5 Problemy ze zbiorem danych

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin semestr drugi 14/06/09

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

1.8 Diagnostyka modelu

Natalia Nehrebecka. 18 maja 2010

1. Obserwacje nietypowe

Egzamin z ekonometrii - wersja ogólna

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

2 Rozszerzenia MNK. 2.1 Heteroscedastyczność

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:

Egzamin z ekonometrii - wersja IiE, MSEMAT

Stanisław Cichocki Natalia Nehrebecka. Wykład 4

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

MODEL EKONOMETRYCZNY. Marcin Michalski, Konrad Rotuski, gr. 303, WNE UW

Szacowanie modeli dla nielosowej selekcji w pakiecie STATA

ANALIZA DANYCH W STATA 8.0

Dr Łukasz Goczek. Uniwersytet Warszawski

2.3 Modele nieliniowe

Jednowskaźnikowy model Sharpe`a

Analiza czynników wpływających na poziom wykształcenia.

Stanisław Cichocki. Natalia Nehrebecka

Wyjaśnianie zmian i różnic w nierówności

Transkrypt:

Zmienne o ograniczonym zbiorze wartości Przykład 1. zarobki = β 0 + β 1 liczba godzin pracy + β 2 wykształcenie + ε Przykład 2. zarobki = β 0 + β 1 liczba godzin pracy + β 2 klm + ε

zarobki = β 0 + β 1 kobieta + β 2 wiek + β 3 wiek2 + β 4 wykształcenie + ε Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 4, 16157) = 1315.98 Model 627.66926 4 156.917315 Prob > F = 0.0000 Residual 1926.56599 16157.119240329 R-squared = 0.2457 -------------+------------------------------ Adj R-squared = 0.2455 Total 2554.23525 16161.158049332 Root MSE =.34531 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta -.2837931.0055471-51.16 0.000 -.2946661 -.2729201 wiek.0277737.0019875 13.97 0.000.023878.0316693 wiek2 -.000267.0000255-10.45 0.000 -.0003171 -.0002169 wyksztalce~e -.0909007.0017752-51.21 0.000 -.0943803 -.0874211 _cons 5.727381.0384254 149.05 0.000 5.652063 5.802699

Sposób kodowania wyksztalcenie Freq. Percent Cum. -------------------+----------------------------------- wyzsze 1 1,947 12.05 12.05 policealne 2 735 4.55 16.59 srednie_ogolne 3 4,305 26.64 43.23 srednie_zawodowe 4 1,214 7.51 50.74 srednie_niepelne 5 5,733 35.47 86.21 zawodowe 6 2,209 13.67 99.88 podstawowe 7 19 0.12 100.00 -------------------+----------------------------------- Total 16,162 100.00 wyksztalcenie j = 1 wyksztalcenie = j 0 w pp.

Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 9, 16152) = 626.18 Model 660.681047 9 73.4090052 Prob > F = 0.0000 Residual 1893.5542 16152.11723342 R-squared = 0.2587 -------------+------------------------------ Adj R-squared = 0.2582 Total 2554.23525 16161.158049332 Root MSE =.34239 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta -.2810472.0057012-49.30 0.000 -.2922222 -.2698722 wiek.027991.0019732 14.19 0.000.0241232.0318588 wiek2 -.0002725.0000254-10.73 0.000 -.0003223 -.0002227 wyksztal~2 -.2687475.0149665-17.96 0.000 -.2980836 -.2394115 wyksztal~3 -.2706048.0093954-28.80 0.000 -.2890209 -.2521887 wyksztal~4 -.2394147.0126095-18.99 0.000 -.2641307 -.2146987 wyksztal~5 -.4051296.0091924-44.07 0.000 -.4231476 -.3871115 wyksztal~6 -.5260538.0106914-49.20 0.000 -.5470101 -.5050975 wyksztal~7 -.680285.0790781-8.60 0.000 -.8352868 -.5252832 _cons 5.689387.0380066 149.69 0.000 5.614889 5.763884

Keynesowska funkcja konsumpcji Funkcja konsumpcji, dane kwartalne o agregatach C t = β 0 + β 1 Y t + ε t Wykorzystanie zmiennych sztucznych C t = β 0 + β 1 Y t + δ 1 D t1 + δ 2 D t2 + δ 3 D t3 + δ 4 D t4 + ε t

Pułapka zmiennych zero-jedynkowych C 1 C 2 C 3 C 4.. C n = 1 y t1 1 0 0 0 1 y t2 0 1 0 0 1 y t3 0 0 1 0 1 y t4 0 0 0 1.................. 1 y tn 0 0 0 1 β 0 β 1 δ 1 δ 2 δ 3 δ 4 + ε 1 ε 2 ε 3 ε 4. ε n

zarobki = β 0 + β 1 wiek + β 2 wiek2 + β 3 plec*wykształcenie + ε interakcje między zmiennymi ciągłymi lub quasi-ciągłymi interakcje między zmiennymi ciągłymi a dyskretnymi interakcje między zmiennymi dyskretnymi

Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 15, 16146) = 377.13 Model 662.719312 15 44.1812875 Prob > F = 0.0000 Residual 1891.51594 16146.117150746 R-squared = 0.2595 -------------+------------------------------ Adj R-squared = 0.2588 Total 2554.23525 16161.158049332 Root MSE =.34227 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wiek.0276387.0019755 13.99 0.000.0237664.0315109 wiek2 -.0002681.0000254-10.54 0.000 -.000318 -.0002183 kobieta -.2674294.0155812-17.16 0.000 -.2979702 -.2368886 wyksztal~2 -.2967759.0327084-9.07 0.000 -.3608879 -.2326639 wyksztal~3 -.258508.0136991-18.87 0.000 -.2853599 -.2316562 wyksztal~4 -.2695161.0238587-11.30 0.000 -.3162818 -.2227504 wyksztal~5 -.3910449.0127155-30.75 0.000 -.4159686 -.3661211 wyksztal~6 -.531889.0149374-35.61 0.000 -.561168 -.50261 wyksztal~7 -.7267949.1089183-6.67 0.000 -.9402868 -.5133029 plecxwyk_~2.0289232.037043 0.78 0.435 -.0436852.1015316 plecxwyk_~3 -.0229288.0187421-1.22 0.221 -.0596654.0138078 plecxwyk_~4.034246.0283665 1.21 0.227 -.0213554.0898475 plecxwyk_~5 -.0366502.0184464-1.99 0.047 -.0728072 -.0004933 plecxwyk_~6.01667.0214288 0.78 0.437 -.0253328.0586728 plecxwyk_~7.0987699.1580409 0.62 0.532 -.2110078.4085476 _cons 5.688806.0386854 147.05 0.000 5.612978 5.764634

Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 11, 16150) = 516.66 Model 664.873882 11 60.4430802 Prob > F = 0.0000 Residual 1889.36137 16150.11698832 R-squared = 0.2603 -------------+------------------------------ Adj R-squared = 0.2598 Total 2554.23525 16161.158049332 Root MSE =.34204 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta.0566297.0747916 0.76 0.449 -.0899702.2032296 wiek.0356899.0025674 13.90 0.000.0306576.0407222 plecxwiek -.0203736.0040126-5.08 0.000 -.0282387 -.0125085 wiek2 -.000379.0000327-11.60 0.000 -.0004431 -.000315 plecxwiek2.0002837.0000518 5.47 0.000.0001821.0003853 wyksztal~2 -.2679979.0149537-17.92 0.000 -.2973087 -.238687 wyksztal~3 -.2712623.0093864-28.90 0.000 -.2896607 -.252864 wyksztal~4 -.2411568.0126017-19.14 0.000 -.2658576 -.2164561 wyksztal~5 -.4076306.0091925-44.34 0.000 -.425649 -.3896122 wyksztal~6 -.5282071.0106884-49.42 0.000 -.5491575 -.5072567 wyksztal~7 -.6890076.0790135-8.72 0.000 -.8438828 -.5341323 _cons 5.562997.0491779 113.12 0.000 5.466603 5.659391

Cechą wyróżniającą zmienne jakościowe jest brak uporządkowania wartości cechy Za poziom odniesienia zazwyczaj przyjmuje się wartość (kategorię) najczęściej występującą Przykład. Zróżnicowanie regionalne zarobków

Source SS df MS Number of obs = 16,162 -------------+---------------------------------- F(12, 16149) = 480.31 Model 671.83898 12 55.9865816 Prob > F = 0.0000 Residual 1882.39627 16,149.116564262 R-squared = 0.2630 -------------+---------------------------------- Adj R-squared = 0.2625 Total 2554.23525 16,161.158049332 Root MSE =.34142 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- _Iplec_2 -.2807138.0056851-49.38 0.000 -.2918572 -.2695705 wiek.0281552.0019678 14.31 0.000.0242981.0320123 wiek2 -.0002755.0000253-10.87 0.000 -.0003251 -.0002258 _Iwyksztal_2 -.2662849.0149293-17.84 0.000 -.295548 -.2370218 _Iwyksztal_3 -.2689081.0093715-28.69 0.000 -.2872773 -.2505388 _Iwyksztal_4 -.2399415.0125772-19.08 0.000 -.2645942 -.2152887 _Iwyksztal_5 -.4033963.0091743-43.97 0.000 -.421379 -.3854136 _Iwyksztal_6 -.5231374.0106686-49.04 0.000 -.544049 -.5022258 _Iwyksztal_7 -.6668923.0788648-8.46 0.000 -.8214761 -.5123085 _Iregion_2 -.0251766.0070433-3.57 0.000 -.0389822 -.0113709 _Iregion_3 -.0644329.0079261-8.13 0.000 -.0799689 -.0488968 _Iregion_4 -.064958.008225-7.90 0.000 -.0810799 -.0488361 _cons 5.720731.0381161 150.09 0.000 5.646019 5.795443

zarobki = β 0 + β 1 wiek + wykształcenie + ε zarobki = β 0 + β 1 wiek + β 2 E + ε

Kodowanie standardowe Model ogólny zarobki = β 0 + β 1 wiek + δ w W + δ s S + ε Modele dla poszczególnych poziomów wykształcenia wyższe: E[zarobki wiek, W ] = β 0 + β 1 wiek + δ w średnie: E[zarobki wiek, S] = β 0 + β 1 wiek + δ s podstawowe: E[zarobki wiek, P] = β 0 + β 1 wiek

wyższe: E[zarobki wiek, W ] = β 0 + β 1 wiek + δ w + δ s średnie: E[zarobki wiek, S] = β 0 + β 1 wiek + δ s podstawowe: E[zarobki wiek, P] = β 0 + β 1 wiek

Porównanie dwóch metod kodowania Number of obs = 25794 R-squared = 0.1967 F( 8, 25785) = 789.17 Adj R-squared = 0.1964 Prob > F = 0.0000 Root MSE = 216.12 ---------------------------------------------------------------------------- zarobki Coef. Std. Err. P> t Coef. Std. Err. P> t -------------+-------------------------------------------------------------- plec 64.78646 2.780403 0.000 64.78646 2.780403 0.000 staz 7.713932.340798 0.000 7.713932.340798 0.000 staz2 -.192435.007008 0.000 -.192435.007008 0.000 duze miasto 78.40807 3.201374 0.000 78.40807 3.201374 0.000 wyksztal_wyz 250.2458 5.429926 0.000 92.88095 8.530816 0.000 wyksztal_pol 157.3648 8.019582 0.000 31.82745 7.728078 0.000 wyksztal_sre 125.5374 4.024915 0.000 51.31021 3.479491 0.000 wyksztal_zaw 74.22715 3.922634 0.000 74.22715 3.922634 0.000 _cons 50.6661 4.896975 0.000 50.6661 4.896975 0.000 ----------------------------------------------------------------------------