Stansław Cchock Natala Nehrebecka Wykład 7
. Zmenne dyskretne Kontrasty: efekty progowe, kontrasty w odchylenach Interakcje. Przyblżane model nelnowych
Stosowane do zmennych dyskretnych o uporządkowanych kategorach (rosnąco lub malejąco). Przy standardowym rozkodowanu zmennej dyskretnej na zmenne zerojedynkowe, kategore wprowadzone do modelu nterpretuje sę względem kategor w modelu neuwzględnonej (bazowej). Newadomo natomast jak zmena sę pozom analzowanego zjawska przy przejścu z jednej kategor wprowadzonej do modelu do drugej. Na taką nterpretację pozwalają efekty progowe. 3
Sposób zdefnowana zmennych zerojedynkowych zależy od tego, czy uporządkowane zmennej dyskretnej jest rosnące, czy malejące. W przypadku porządku rosnącego zmenne zerojedynkowe zdefnowane są następująco: + D s, = dla dla W przypadku porządku malejącego zmenne zerojedynkowe zdefnowane są następująco: D s, = dla dla z z z z < > s s s s Dla s =,...,S Dla s =,...,S- 4
masto Freq. Percent Cum. -----------------------------+----------------------------------- - wes 33 9.8 9.8 - masto do 5tyś 94 7.9 47.74 3 - masto od 5tyś do 5tyś 356 3.87 8.6 4 - masto powyżej 5tyś 9.39. --------------------------+--------------------------------------- Total,83. generate masto_male = (masto > ) generate masto_sredne = (masto > ) generate masto_duze = (masto > 3) 5
. generate masto_male = (masto > ). generate masto_sredne = (masto > ). generate masto_duze = (masto > 3). regres dochod wek wek_ masto_male masto_sredne masto_duze Source SS df MS Number of obs = 83 -------------+------------------------------ F( 5, 77) = 7. Model 38763.5 5 47745.7 Prob > F =. Resdual 736853 77 67874.7 R-squared =.39 -------------+------------------------------ Adj R-squared =.74 Total 7474835 8 6983.84 Root MSE = 89.68 ------------------------------------------------------------------------------ dochod Coef. Std. Err. t P> t [95% Conf. Interval] --------------+---------------------------------------------------------------- wek 37.8833 6.33.37.8 6.468336 69.987 wek_ -.4486477.3958 -..8 -.8488356 -.484597 masto_male 58.87 74.57..34.986 34.469 masto_sredne 7.785 73.6483.47.4-35.8533 5.7 masto_duze 79.577 7.45687..66-6.6399 9.786 _cons -9.838 33.739 -.39.693-75.787 476.596 -------------------------------------------------------------------------------- 6
Jeśl jednym z celów badana jest zdentyfkowane pozomów zmennej dyskretnej, których wpływ wyróżna sę znacząco od wpływu pozostałych pozomów, wtedy celowe jest użyce tak zwanych kontrastów w odchylenach. 7
W modelu będzemy uzależnać dochód od weku, płc oraz zmennej województwo (6 pozomów): Dolnośląske Kujawsko-pomorske 3 Lubelske 4 Lubuske 5 Łódzke 6 Małopolske 7 Mazowecke 8 Opolske 9 Podkarpacke Podlaske Pomorske Śląske 3 Śwętokrzyske 4 Warmńsko-mazurske 5 Welkopolske 6 Zachodnopomorske 8
Krok : tworzymy 6 zmennych zerojedynkowych odpowadających zmennej województwo: dla dla woj D s, = Dla s =,...,6 woj = j j Krok : Następne defnujemy zmenne: D s, = Ds, D, dla s =,..,6 9
Krok 3: Zapsujemy regresje: placa = β + D + ε wek + β plec + + D, +... 6 6, W jak sposób można nterpretować parametry przy zmennych D s,. Dla każdej obserwacj zachodz: D, +... + D6, = placa placa = β wek = β wek + β plec + β plec + ( D, +... + D 6, + (... 6 ) D ) + ( D,, D, + ( + ) D ) +... +, 6 ( D 6, D, +... + ( + 6) D 6 ) + ε 6, + ε
Przekształclśmy model do modelu bez stałej. Sumujemy parametry przy zmennych zerojedynkowych dotyczących województwa: 6 s = s s = 6 = 6 = 6 s Czyl stała w modelu jest średną z parametrów dla poszczególnych zmennych dotyczących województwa.
Pozostaje nadane nterpretacj parametrom przy zmennych D s, : Czyl parametry można nterpretować jako odchylena parametrów dla poszczególnych pozomów województwa od średnej z tych parametrów. Trzeba jeszcze wyznaczyć odchylene od średnej dla pozomu bazowego : 6 6 6 6 = + = = + = S 6 6...... = =
Płaca mejsce zameszkana: kontrasty w odchylenach =... 6 =, dla Dolnośląskego woj. 3
W standardowym modelu lnowym zakładamy, że wpływ poszczególnych zmennych nezależnych na oczekwaną wartość zmennej nezależnej jest addytywny. W ramach modelu lnowego można także uwzględnć efekt krzyżowego wzmacnana sę efektów poszczególnych zmennych. Efekt ten zachodz, gdy sła oddzaływana jednej zmennej nezależnej jest uwarunkowana welkoścą nnych zmennych nezależnych. Ten efekt można uwzględnć, wstawając do modelu loczyny zmennych (nterakcje). 4
Interakcje mędzy zmennym zerojedynkowym berzemy pod uwagę, jeśl wpływ poszczególnych zmennych ne jest addytywny. Sytuacja taka może wystąpć, jeśl pewne kombnacje charakterystyk jakoścowych wpływają na zmenną zależną bardzej lub mnej, nż wynkałoby z wpływu poszczególnych zmennych. Np. Zmenna zależna: dochód Zmenne nezależna płeć, wykształcene, nterakcja: płećxwykształcene Do modelu wprowadzamy nterakcje, poneważ spodzewamy sę, ż wpływ zmennej oznaczającej wykształcene zależy od płc. 5
dochod - zmenna zależna, wek, wek_ oraz nterakcje medzy wykształcenem płcą - zmenne nezależne : regress dochod wek wek_.plec.wyksztalcene Source SS df MS Number of obs = 83 -------------+------------------------------ F( 7, 75) = 8.83 Model 86487.6 7 6643. Prob > F =. Resdual 6658398 75 69379.458 R-squared =.9 -------------+------------------------------ Adj R-squared =.34 Total 7474835 8 6983.84 Root MSE = 787. ------------------------------------------------------------------------------ dochod Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wek 36.3838 5.39846.36.8 6.68745 66.5976 wek_ -.44935.96 -.6.39 -.789957 -.993 _Iplec_ -44.444 43.465 -..34-45.98 37.99 _Iwyksztal~ 74.73 5.538.6.9 67.9446 48.6 _Iwyksztal~3 4.998 37.7 7.59. 77.846 3.49 _IpleXwyk_~ -43.4455 53.4394 -.93.35-444.5 57.69 _IpleXwyk_~3-68.34 97.7395-3.45. -7.34-94.348 _cons -.65 3.6773 -.4.687-7.435 468.884 ------------------------------------------------------------------------------ 6
Wprowadzene do modelu nterakcj pomędzy zmennym dyskretnym cągłym ma sens, jeśl wpływ pewnej zmennej nezależnej cągłej na zmenną zależną zależy od pozomów zmennej dyskretnej. 7
nterakcje mędzy zmenną masto a wekem : regress dochod.masto_wek Source SS df MS Number of obs = 83 -------------+------------------------------ F( 7, 75) = 4.5 Model 6878.5 7 33835.5 Prob > F =. Resdual 76857 75 675546.843 R-squared =.85 -------------+------------------------------ Adj R-squared =. Total 7474835 8 6983.84 Root MSE = 8.9 ------------------------------------------------------------------------------ dochod Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- _Imasto 8.3465 96.454..94-553.99 69.984 _Imasto 3 53.4383 49.6..83-435.83 54.46 _Imasto 4 35.6545 83.669.48.633-4.835 69.44 wek -.487689 4.56959 -..95-9.45549 8.4784 _ImaXwek_ 3.5889 7.634.47.637 -.338 8.5684 _ImaXwek_3 5.69888 6.355967.9.37-6.7766 8.739 _ImaXwek_4 5.39686 7.63888.76.445-8.46485 9.5686 _cons 64.79 75.98 3.65. 96.445 987.9 ------------------------------------------------------------------------------ 8
. Zmenne dyskretne Kontrasty: efekty progowe, kontrasty w odchylenach Interakcje. Przyblżane model nelnowych Modele welomanowe Model schodkowy Model krzywej łamanej
Nelnowa zależność mędzy y a można przyblżyć za pomocą modelu lnowego stosując model:. Model welomanowy y = β + β + β +... + β + k K ε Przy wększej lczbe zmennych objaśnających wstawa sę do modelu ch kwadraty loczyny
. regress dochod wek wek_ plec sredne wyzsze Source SS df MS Number of obs = 83 -------------+------------------------------ F( 5, 77) =.98 Model 748793.8 5 449758.8 Prob > F =. Resdual 6754334 77 674.378 R-squared =.964 -------------+------------------------------ Adj R-squared =.9 Total 7474835 8 6983.84 Root MSE = 79.9 ------------------------------------------------------------------------------ dochod Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wek 36.63 5.4838.33. 5.68494 66.44 wek_ -.399884.973767 -.3.43 -.78777 -.5977 plec -338.67 48.5867-7.. -43.7588-43.3755 sredne 8.5538 77.769.68.7 56.48 36.657 wyzsze 78.86 99.55596 7.. 5.946 93.638 _cons -6.64989 98.388 -.9.99-6.5 558.77 ---------------------------------------------------------------------
Średn pozom dochodu w zależnośc od weku 4 6 8 3 4 5 6 7
Nelnowa zależność mędzy y a można przyblżyć za pomocą modelu lnowego stosując model:. Model schodkowy W tym przypadku defnujemy zmenne zerojedynkowe zwązane z przedzałam przeprowadzamy regresję na tych zmennych zamast na. Wyestymowany model można zlustrować rysunkem: 3
4
generate wek_ = (wek > 5 & wek <= 35) generate wek_3 = (wek > 35 & wek <= 45) generate wek_4 = (wek > 45 & wek <= 55) generate wek_5 = (wek > 55) regress dochod wek_? Source SS df MS Number of obs = 83 -------------+------------------------------ F( 4, 78) =.33 Model 643953.56 4 6988.39 Prob > F =.544 Resdual 74778 78 687455.64 R-squared =.86 -------------+------------------------------ Adj R-squared =.49 Total 7474835 8 6983.84 Root MSE = 89.3 ------------------------------------------------------------------------------ dochod Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wek_ 6.6784 88.74.44.5-46.547 99.88 wek_3 39.7376 84.875.83.5 73.35 46.637 wek_4 6.697 9.3836.6.4 7.388 386.6 wek_5 75.593 4.568.4.5 -.486 453.873 _cons 639.55 73.57334 8.69. 494.699 783.483 ------------------------------------------------------------------------------ 5
Nelnowa zależność mędzy y a można przyblżyć za pomocą modelu lnowego stosując model: 3. Model krzywej łamanej Zależność nelnowa przyblżona jest w tym przypadku krzywą, którą można zlustrować rysunkem: 6 Model krzywej łamanej > + + + + < + + + + + = = ) ( ) ( ) ( s s s s j j j j dla dla dla y ε β β β α ε β β α ε β α
regress dochod wek wek_45 plec sredne wyzsze Source SS df MS Number of obs = 83 -------------+------------------------------ F( 5, 77) =.9 Model 788988.6 5 4377976. Prob > F =. Resdual 6755955 77 6789.93 R-squared =.96 -------------+------------------------------ Adj R-squared =.9 Total 7474835 8 6983.84 Root MSE = 79. ------------------------------------------------------------------------------ dochod Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- wek 9.89845 3.4496.87.4 3.443 6.6655 wek_45-9.669 9.7658 -.96.5-38.356 -.677 plec -338.999 48.7437-7.. -433.744-44.694 sredne.58 77.6635.7.7 58.669 363.447 wyzsze 7.6863 99.466 7.7. 57.57 97.8556 _cons 376.475 45.4995.59. 9.9858 66.9698 ------------------------------------------------------------------------------ 7
Średn pozom dochodu w zależnośc od weku 4 6 8 3 4 5 6 7 8
Dzękuję za uwagę 9