Zmienne o ograniczonym zbiorze wartości Przykład 1. zarobki = β 0 + β 1 liczba godzin pracy + β 2 wykształcenie + ε Przykład 2. zarobki = β 0 + β 1 liczba godzin pracy + β 2 klm + ε
zarobki = β 0 + β 1 kobieta + β 2 wiek + β 3 wiek2 + β 4 wykształcenie + ε Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 4, 16157) = 1315.98 Model 627.66926 4 156.917315 Prob > F = 0.0000 Residual 1926.56599 16157.119240329 R-squared = 0.2457 -------------+------------------------------ Adj R-squared = 0.2455 Total 2554.23525 16161.158049332 Root MSE =.34531 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta -.2837931.0055471-51.16 0.000 -.2946661 -.2729201 wiek.0277737.0019875 13.97 0.000.023878.0316693 wiek2 -.000267.0000255-10.45 0.000 -.0003171 -.0002169 wyksztalce~e -.0909007.0017752-51.21 0.000 -.0943803 -.0874211 _cons 5.727381.0384254 149.05 0.000 5.652063 5.802699
Sposób kodowania wyksztalcenie Freq. Percent Cum. -------------------+----------------------------------- wyzsze 1 1,947 12.05 12.05 policealne 2 735 4.55 16.59 srednie_ogolne 3 4,305 26.64 43.23 srednie_zawodowe 4 1,214 7.51 50.74 srednie_niepelne 5 5,733 35.47 86.21 zawodowe 6 2,209 13.67 99.88 podstawowe 7 19 0.12 100.00 -------------------+----------------------------------- Total 16,162 100.00 wyksztalcenie j = 1 wyksztalcenie = j 0 w pp.
Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 9, 16152) = 626.18 Model 660.681047 9 73.4090052 Prob > F = 0.0000 Residual 1893.5542 16152.11723342 R-squared = 0.2587 -------------+------------------------------ Adj R-squared = 0.2582 Total 2554.23525 16161.158049332 Root MSE =.34239 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta -.2810472.0057012-49.30 0.000 -.2922222 -.2698722 wiek.027991.0019732 14.19 0.000.0241232.0318588 wiek2 -.0002725.0000254-10.73 0.000 -.0003223 -.0002227 wyksztal~2 -.2687475.0149665-17.96 0.000 -.2980836 -.2394115 wyksztal~3 -.2706048.0093954-28.80 0.000 -.2890209 -.2521887 wyksztal~4 -.2394147.0126095-18.99 0.000 -.2641307 -.2146987 wyksztal~5 -.4051296.0091924-44.07 0.000 -.4231476 -.3871115 wyksztal~6 -.5260538.0106914-49.20 0.000 -.5470101 -.5050975 wyksztal~7 -.680285.0790781-8.60 0.000 -.8352868 -.5252832 _cons 5.689387.0380066 149.69 0.000 5.614889 5.763884
Keynesowska funkcja konsumpcji Funkcja konsumpcji, dane kwartalne o agregatach C t = β 0 + β 1 Y t + ε t Wykorzystanie zmiennych sztucznych C t = β 0 + β 1 Y t + δ 1 D t1 + δ 2 D t2 + δ 3 D t3 + δ 4 D t4 + ε t
Pułapka zmiennych zero-jedynkowych C 1 C 2 C 3 C 4.. C n = 1 y t1 1 0 0 0 1 y t2 0 1 0 0 1 y t3 0 0 1 0 1 y t4 0 0 0 1.................. 1 y tn 0 0 0 1 β 0 β 1 δ 1 δ 2 δ 3 δ 4 + ε 1 ε 2 ε 3 ε 4. ε n
zarobki = β 0 + β 1 wiek + β 2 wiek2 + β 3 plec*wykształcenie + ε interakcje między zmiennymi ciągłymi lub quasi-ciągłymi interakcje między zmiennymi ciągłymi a dyskretnymi interakcje między zmiennymi dyskretnymi
Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 15, 16146) = 377.13 Model 662.719312 15 44.1812875 Prob > F = 0.0000 Residual 1891.51594 16146.117150746 R-squared = 0.2595 -------------+------------------------------ Adj R-squared = 0.2588 Total 2554.23525 16161.158049332 Root MSE =.34227 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wiek.0276387.0019755 13.99 0.000.0237664.0315109 wiek2 -.0002681.0000254-10.54 0.000 -.000318 -.0002183 kobieta -.2674294.0155812-17.16 0.000 -.2979702 -.2368886 wyksztal~2 -.2967759.0327084-9.07 0.000 -.3608879 -.2326639 wyksztal~3 -.258508.0136991-18.87 0.000 -.2853599 -.2316562 wyksztal~4 -.2695161.0238587-11.30 0.000 -.3162818 -.2227504 wyksztal~5 -.3910449.0127155-30.75 0.000 -.4159686 -.3661211 wyksztal~6 -.531889.0149374-35.61 0.000 -.561168 -.50261 wyksztal~7 -.7267949.1089183-6.67 0.000 -.9402868 -.5133029 plecxwyk_~2.0289232.037043 0.78 0.435 -.0436852.1015316 plecxwyk_~3 -.0229288.0187421-1.22 0.221 -.0596654.0138078 plecxwyk_~4.034246.0283665 1.21 0.227 -.0213554.0898475 plecxwyk_~5 -.0366502.0184464-1.99 0.047 -.0728072 -.0004933 plecxwyk_~6.01667.0214288 0.78 0.437 -.0253328.0586728 plecxwyk_~7.0987699.1580409 0.62 0.532 -.2110078.4085476 _cons 5.688806.0386854 147.05 0.000 5.612978 5.764634
Source SS df MS Number of obs = 16162 -------------+------------------------------ F( 11, 16150) = 516.66 Model 664.873882 11 60.4430802 Prob > F = 0.0000 Residual 1889.36137 16150.11698832 R-squared = 0.2603 -------------+------------------------------ Adj R-squared = 0.2598 Total 2554.23525 16161.158049332 Root MSE =.34204 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta.0566297.0747916 0.76 0.449 -.0899702.2032296 wiek.0356899.0025674 13.90 0.000.0306576.0407222 plecxwiek -.0203736.0040126-5.08 0.000 -.0282387 -.0125085 wiek2 -.000379.0000327-11.60 0.000 -.0004431 -.000315 plecxwiek2.0002837.0000518 5.47 0.000.0001821.0003853 wyksztal~2 -.2679979.0149537-17.92 0.000 -.2973087 -.238687 wyksztal~3 -.2712623.0093864-28.90 0.000 -.2896607 -.252864 wyksztal~4 -.2411568.0126017-19.14 0.000 -.2658576 -.2164561 wyksztal~5 -.4076306.0091925-44.34 0.000 -.425649 -.3896122 wyksztal~6 -.5282071.0106884-49.42 0.000 -.5491575 -.5072567 wyksztal~7 -.6890076.0790135-8.72 0.000 -.8438828 -.5341323 _cons 5.562997.0491779 113.12 0.000 5.466603 5.659391
Cechą wyróżniającą zmienne jakościowe jest brak uporządkowania wartości cechy Za poziom odniesienia zazwyczaj przyjmuje się wartość (kategorię) najczęściej występującą Przykład. Zróżnicowanie regionalne zarobków
Source SS df MS Number of obs = 16,162 -------------+---------------------------------- F(12, 16149) = 480.31 Model 671.83898 12 55.9865816 Prob > F = 0.0000 Residual 1882.39627 16,149.116564262 R-squared = 0.2630 -------------+---------------------------------- Adj R-squared = 0.2625 Total 2554.23525 16,161.158049332 Root MSE =.34142 lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- _Iplec_2 -.2807138.0056851-49.38 0.000 -.2918572 -.2695705 wiek.0281552.0019678 14.31 0.000.0242981.0320123 wiek2 -.0002755.0000253-10.87 0.000 -.0003251 -.0002258 _Iwyksztal_2 -.2662849.0149293-17.84 0.000 -.295548 -.2370218 _Iwyksztal_3 -.2689081.0093715-28.69 0.000 -.2872773 -.2505388 _Iwyksztal_4 -.2399415.0125772-19.08 0.000 -.2645942 -.2152887 _Iwyksztal_5 -.4033963.0091743-43.97 0.000 -.421379 -.3854136 _Iwyksztal_6 -.5231374.0106686-49.04 0.000 -.544049 -.5022258 _Iwyksztal_7 -.6668923.0788648-8.46 0.000 -.8214761 -.5123085 _Iregion_2 -.0251766.0070433-3.57 0.000 -.0389822 -.0113709 _Iregion_3 -.0644329.0079261-8.13 0.000 -.0799689 -.0488968 _Iregion_4 -.064958.008225-7.90 0.000 -.0810799 -.0488361 _cons 5.720731.0381161 150.09 0.000 5.646019 5.795443
zarobki = β 0 + β 1 wiek + wykształcenie + ε zarobki = β 0 + β 1 wiek + β 2 E + ε
Kodowanie standardowe Model ogólny zarobki = β 0 + β 1 wiek + δ w W + δ s S + ε Modele dla poszczególnych poziomów wykształcenia wyższe: E[zarobki wiek, W ] = β 0 + β 1 wiek + δ w średnie: E[zarobki wiek, S] = β 0 + β 1 wiek + δ s podstawowe: E[zarobki wiek, P] = β 0 + β 1 wiek
wyższe: E[zarobki wiek, W ] = β 0 + β 1 wiek + δ w + δ s średnie: E[zarobki wiek, S] = β 0 + β 1 wiek + δ s podstawowe: E[zarobki wiek, P] = β 0 + β 1 wiek
Porównanie dwóch metod kodowania Number of obs = 25794 R-squared = 0.1967 F( 8, 25785) = 789.17 Adj R-squared = 0.1964 Prob > F = 0.0000 Root MSE = 216.12 ---------------------------------------------------------------------------- zarobki Coef. Std. Err. P> t Coef. Std. Err. P> t -------------+-------------------------------------------------------------- plec 64.78646 2.780403 0.000 64.78646 2.780403 0.000 staz 7.713932.340798 0.000 7.713932.340798 0.000 staz2 -.192435.007008 0.000 -.192435.007008 0.000 duze miasto 78.40807 3.201374 0.000 78.40807 3.201374 0.000 wyksztal_wyz 250.2458 5.429926 0.000 92.88095 8.530816 0.000 wyksztal_pol 157.3648 8.019582 0.000 31.82745 7.728078 0.000 wyksztal_sre 125.5374 4.024915 0.000 51.31021 3.479491 0.000 wyksztal_zaw 74.22715 3.922634 0.000 74.22715 3.922634 0.000 _cons 50.6661 4.896975 0.000 50.6661 4.896975 0.000 ----------------------------------------------------------------------------