0. Oszacowanie kilku prostych regresji, interpretacja oszacować parametrów

Podobne dokumenty
Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Opis danych znajdujących się w zbiorze

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

IID = 2. i i i i. x nx nx nx

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Natalia Nehrebecka. Zajęcia 3

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

65120/ / / /200

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Weryfikacja hipotez dla wielu populacji

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Ekonometria ćwiczenia Kolokwium 1 semestr 20/12/08. / 5 pkt. / 5 pkt. / 5 pkt. / 5 pkt. /20 pkt. Regulamin i informacje dodatkowe

Egzamin z ekonometrii wersja IiE, MSEMAT

Zmienne sztuczne i jakościowe

Metoda najmniejszych kwadratów

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Dobór zmiennych objaśniających

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Natalia Nehrebecka. Wykład 2

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Ekonometria Ćwiczenia 19/01/05

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Trzecie laboratoria komputerowe ze Staty Testy

Zmienne Binarne w Pakiecie Stata

Egzamin z ekonometrii wersja IiE, MSEMAT

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

dy dx stąd w przybliżeniu: y

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Egzamin z ekonometrii wersja IiE, MSEMAT

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Egzamin z ekonometrii - wersja ogólna

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

brak podstaw do odrzucenia hipotezy zerowej.

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

I. Elementy analizy matematycznej

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

Egzamin z ekonometrii wersja ogolna

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Budowa modelu i testowanie hipotez

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Natalia Nehrebecka. Dariusz Szymański

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

1 Modele ADL - interpretacja współczynników

Ćwiczenia 7 Drugie zajęcia w pracowni komputerowej.

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Prawdopodobieństwo i statystyka r.

Mikroekonometria 7. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

Krzywa wieża w Pizie. SAS Data Step. Przykład (2) Wykład 13 Regresja liniowa

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Funkcje i charakterystyki zmiennych losowych

Model ASAD. ceny i płace mogą ulegać zmianom (w odróżnieniu od poprzednio omawianych modeli)

Procedura normalizacji

EKONOMETRIA I Spotkanie 1, dn

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej


Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Statystyka Inżynierska

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Parametry zmiennej losowej

Metody predykcji analiza regresji

Regresja liniowa i nieliniowa

Transkrypt:

0. Oszacowane klku prostych regresj, nterpretacja oszacować parametrów Zacznemy od oszacowana metodą najmnejszych kwadratów następującego modelu: dochod = β0 + βwekwek + ε Najperw zastanowmy sę w jak sposób będzemy nterpretować oszacowana parametrów: E( dochod ) = β0 + βwekwek + E( ε ) = β0 + βwekwek E ( dochod ) wek = β wek 0 Oszacowane parametru przy zmennej wek oznacza zatem o le wzrośce średno dochód, jeżel wek wzrośne o 1 rok. Do szacowana model lnowych przy użycu metody najmnejszych kwadratów w Stace używamy komendy regress. Ponżej jej składna: regress zmenna_zależna lsta_zmennych_nezależnych. regress dochod wek /*dochod - zmenna zależna, wek - zmenna nezależna */ -------------+------------------------------ F( 1, 1081) =.9 Model 01014.5 1 01014.5 Prob > F = 0.0879 Resdual 74546911 1081 689610.657 R-squared = 0.007 -------------+------------------------------ Adj R-squared = 0.0018 Total 747481135 108 69083.84 Root MSE = 830.43 wek 4.85901.509161 1.71 0.088 -.6374771 9.0979 _cons 646.313 99.47315 6.50 0.000 451.049 841.4137 Oszacowana parametrów na wydruku są zaznaczone na nebesko. Możemy węc zapsać oszacowany model: dochod ˆ = 646, 3 + 4, 9wek Wzrost weku o jeden rok przekłada sę na wzrost zarobków zaledwe o 4.9 zł. TSS (Total), ESS (Model) RSS (Resdual) są zaznaczone w tabel na czerwono, natomast R (R-square) R (Adj R-square) na zelono. Spróbujemy trochę rozbudować nasz model, dodajemy zmenną oznaczającą płeć: 0 dla mężczyzn plec = 1 dla kobet E( dochod ) = β0 + βwekwek + β plec plec + E( ε ) = β0 + βwekwek + β plec plec 0 Interpretacja parametru przy zmennej wek ne zmen sę, ale w jak sposób znterpretować oszacowane parametru przy zmennej plec? β0 + βwek wek E( dochod ) = β0 + βwekwek + β plec plec = β0 + β wek + β wek plec dla mężczyzn dla kobet 1

A węc oszacowane parametru przy zmennej plec będze pokazywało o le średno węcej lub mnej będą zarabały kobety w porównanu z mężczyznam, przy założenu weku na tym samym pozome. Ponżej oszacowana modelu:. regress dochod wek plec /*dochod - zmenna zależna, wek, plec - zmenne nezależne */ -------------+------------------------------ F(, 1080) = 3.95 Model 31739891.4 15869945.7 Prob > F = 0.0000 Resdual 71574144 1080 6673.374 R-squared = 0.045 -------------+------------------------------ Adj R-squared = 0.0407 Total 747481135 108 69083.84 Root MSE = 814.08 wek 5.95934.464379.15 0.03.460415 10.13145 plec -33.1539 49.59336-6.70 0.000-49.4641-34.8436 _cons 768.091 99.008 7.74 0.000 573.561 96.8573 Oszacowany model możemy zapsać: dochod ˆ = 768, 1+ 5,3wek 33,15 plec Wzrost weku o jeden rok przekłada sę średno na wzrost dochodu o 5,3 zł, kobety zarabają średno o 33.15 zł mnej nż mężczyźn (obe nterpretacje przy założenu pozostałych zmennych na tym samym pozome). W następnym kroku dodajemy do modelu zmenną oznaczającą wykształcene. Wykształcene przyjmuje tylko trzy pozomy (1 - podstawowe, - średne, 3 - wyższe). Jeżel w takej postac wprowadzmy tę zmenną do modelu, to nterpretacja oszacowana parametru przy tej zmennej będze analogczna jak przy zmennej wek. Przejśce z wykształcena podstawowego na średne ze średnego na wyższe będze mało taką samą premę. W rzeczywstośc pewne tak ne jest, prema za uzyskane wykształcena wyższego jest wyższa nż za średnego. Ponżej porównane średnch pozomów dochodu w podpróbach wyodrębnonych ze względu na wykształcene:. bys wyksztalcene: summarze dochod ----- -> wyksztalcene = podstawowe Varable Obs Mean Std. Dev. Mn Max -------------+-------------------------------------------------------- dochod 1 577.3607 307.87 100 000 ----- -> wyksztalcene = średne Varable Obs Mean Std. Dev. Mn Max -------------+-------------------------------------------------------- dochod 88 769.6715 814.758 50 0000 ----- -> wyksztalcene = wyższe Varable Obs Mean Std. Dev. Mn Max -------------+-------------------------------------------------------- dochod 133 179.18 1065.43 100 7000

Różnca mędzy średnm pozomem dochodu osób ze średnm a podstawowym wykształcenem wynos około 00 zł, natomast mędzy wyższym a średnm około 500 zł. Założene, że dochód rośne w sposób lnowy wraz z pozomem wykształcena jest węc neprawdzwa. Dlatego rozkodujemy zmenną wykształcene na trzy zmenne zerojedynkowe: 1 dla osób z wyksztacenem podstawowym podstawowe = 0 w. p. p 1 dla osób z wyksztacenem srednm sredne = 0 w. p. p 1 dla osób z wyksztacenem wyższym wyzsze = 0 w. p. p Jednakże do modelu wprowadzmy tylko dwe spośród tych zmennych. Jeżel wprowadzlbyśmy trzy oraz pozostawlbyśmy w modelu stałą, to ne dałoby sę odwrócć macerzy X X. E( dochod ) = β + β wek + β plec + β sredne + β wyzsze = 0 wek plec sredn wyższe β0 + βwek wek + β plec plec dla wyksztalcena podstawowego = β0 + βwek wek + β plec plec + βsredne dla wyksztalcena srednego β0 + βwek wek + β plec plec + βwyższe dla wyksztalcena wyższego Czyl oszacowane parametru przy zmennej sredne można nterpretować jako różncę w średnch zarobkach osób z wykształcenem średnm podstawowym. Podobne z oszacowanem parametru przy zmennej wyzsze różnca w średnch zarobkach osób z wykształcenem wyższym podstawowym (obe nterpretacje przy założenu, że pozostałe zmenne na tym samym pozome).. regress dochod wek plec sredne wyzsze /*dochod - zmenna zależna, wek, plec, sredne, wyzsze - zmenne nezależne */ -------------+------------------------------ F( 4, 1078) = 7.6 Model 69474590.4 4 17368647.6 Prob > F = 0.0000 Resdual 678006545 1078 68948.557 R-squared = 0.099 -------------+------------------------------ Adj R-squared = 0.0896 Total 747481135 108 69083.84 Root MSE = 793.06 wek 5.079415.4856.09 0.037.3141704 9.844659 plec -336.5881 48.359-6.97 0.000-431.4051-41.771 sredne 0.009 77.6303.83 0.005 67.67591 37.399 wyzsze 70.3531 99.5064 7.4 0.000 55.077 915.69 _cons 51.9914 15.3477 4.16 0.000 76.038 767.9446 Oszacowany model możemy zapsać: dochod ˆ = 51,99 + 5, 07wek 336,59 plec + 0β + 70,35β sredne wyzsze Wzrost weku o jeden rok przekłada sę średno na wzrost dochodu o 5,07 zł, kobety zarabają średno o 336.59 zł mnej nż mężczyźn, osoby z wykształcenem średnm oraz wyższym zarabają odpowedno o 0 zł 70,35 zł węcej nż te z podstawowym (nterpretacje przy założenu pozostałych zmennych na tym samym pozome). 3

Spróbujemy uwzględnć w naszym modelu nelnową zależność mędzy wekem a dochodem. Najprostsze wyjśce to podnesene weku do kwadratu.. generate wek_ = wek^ /*wek_ - wek podnesony do kwadratu*/. regress dochod wek wek_ plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_, plec, sredne, wyzsze - zmenne nezależne */ -------------+------------------------------ F( 5, 1077) =.98 Model 7048793.8 5 14409758.8 Prob > F = 0.0000 Resdual 67543341 1077 6714.378 R-squared = 0.0964 -------------+------------------------------ Adj R-squared = 0.09 Total 747481135 108 69083.84 Root MSE = 791.9 wek 36.06131 15.4838.33 0.00 5.680494 66.441 wek_ -.399884.1973767 -.03 0.043 -.7871707 -.015977 plec -338.0671 48.5867-7.01 0.000-43.7588-43.3755 sredne 08.5538 77.7619.68 0.007 56.0418 361.0657 wyzsze 708.86 99.55596 7.11 0.000 51.9406 903.6318 _cons -6.64989 98.388-0.09 0.99-61.015 558.717 Ze względu na fakt, że: = β + β E ( dochod ) wek wek wek wek _ ne da sę w tak prosty sposób znterpretować oszacowań parametrów przy zmennych dotyczących weku. Zależność mędzy wartoścą oczekwaną dochodu a wekem ne jest już lnowa! Możemy oblczyć werzchołek parabol: βwek 36.06131 xw = = *( 0.399884) 45.09 β wek _ Ponadto ramona parabol są skerowane do dołu (bo β wek _ < 0 ), węc w punkce 45.09 jest przyjmowane maksmum. Czyl dochody osób ponżej 45 roku życa rosną, ale coraz wolnej, powyżej 45 lat dochód zaczyna spadać. Możemy wyznaczyć na podstawe oszacowań modelu pozom dochodu dla osób o wybranych charakterystykach: wek płeć wykształcene dochód 5 mężczyzna wyższe 1333,4 45 mężczyzna wyższe 1494,63 60 mężczyzna wyższe 1405,73 (Np. dochód dla dwudzestopęcoletnego mężczyzn z wykształcenem wyższym: -6,64989 + 36,06131*5-0,399884*5 +708,86 1333.4 ). Ponżej jeszcze wykres przedstawający zależność średnego pozomu dochodu od weku z nałożoną parabolą o równanu y = -6,64989 + 36,06131wek - 0,399884 wek. 4

Średn pozom dochodu w zależnośc od weku 00 400 600 800 1000 100 0 30 40 50 60 70 (Kod Staty, który posłużył do wygenerowana tego wykresu omówmy na ćwczenach). Teraz spróbujemy uwzględnć nelnową zależność mędzy dochodem a wekem za pomocą dwóch funkcj lnowych sklejonych w punkce 45 (werzchołek parabol wyznaczony w poprzednm punkce). Zależność mędzy wartoścą oczekwaną dochodu a wekem możemy zapsać w następujący sposób: δ 0 + δ1wek dla weku < 45 E( dochod ) = δ + δ3wek dla weku 45 Następne defnujemy zmenną zerojedynkową: 0 dla weku < 45 d = 1 dla weku 45 Wówczas postać modelu możemy zapsać jako: β 1 + β wek dla weku < 45 δ0 δ1 E( dochod ) = β1 + βwek + β3d + β4dwek = ( β1 + β3) + ( β + β4) wek dla weku 45 δ δ3 Pozostaje narzucć ogranczena na parametry β1,..., β 4, aby zapewnć sobe cągłość w punkce 45. Mus zachodzć: β + β *45 = ( β + β ) + ( β + β )*45 β = 45β 1 1 3 4 3 4 Wstawamy uzyskane ogranczene do naszego równana: E( dochod ) = β1 + βwek 45 β4d + β4dwek = β1 + βwek + β4 d( wek 45) = β + β wek + β wek _ 45 1 4 wek _ 45 Łatwo zauważyć, że jeśl prawdzwa jest hpoteza H0 : β 4 = 0, to model redukuje sę do standardowego modelu lnowego (dochód zależy wówczas w sposób lnowy od weku). Już 5

ne długo nauczymy sę testować take hpotezy. Aby móc oszacować model ze sklejanym funkcjam lnowym, musmy zdefnować nową zmenną: 0 dla weku < 45 wek _ 45 = d( wek 45) = wek 45 dla weku 45. generate wek_45 = 0 /*Tworzymy zmenną o nazwe wek_45; na raze zmenna przyjmuje tylko wartość 0*/. replace wek_45 = wek - 45 f wek >= 45 /*Zamenamy wartość zmennej wek na (wek - 45) dla osób, które mają przynajmnej 45 lat*/. regress dochod wek wek_45 plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_45, plec, sredne, wyzsze - zmenne nezależne */ -------------+------------------------------ F( 5, 1077) =.9 Model 71889880.6 5 14377976.1 Prob > F = 0.0000 Resdual 67559155 1077 6789.93 R-squared = 0.096 -------------+------------------------------ Adj R-squared = 0.090 Total 747481135 108 69083.84 Root MSE = 79.0 wek 9.89845 3.44960.87 0.004 3.14143 16.66155 wek_45-19.06609 9.71658-1.96 0.050-38.13156 -.0006177 plec -338.9919 48.7437-7.0 0.000-433.7144-44.694 sredne 11.058 77.6635.7 0.007 58.6691 363.447 wyzsze 71.6863 99.4661 7.17 0.000 517.517 907.8556 _cons 376.475 145.4995.59 0.010 90.98058 661.9698 Na podstawe oszacowanych parametrów, zależność mędzy dochodem a wekem możemy zapsać: ˆ b1 + bwek dla weku < 45 dochod = = ( b1 45 b4 ) + ( b + b4 ) wek dla weku 45 376,475 + 9,89845wek dla weku < 45 = (376,475 45*(-19,06609)) + (9,89845-19,06609) wek dla weku 45 376,475 + 9,89845wek dla weku < 45 = 134,449 9,17345wek dla weku 45 Jak można znterpretować uzyskane wynk? Dla osób ponżej 45 roku dochód rośne średno o 9,89 zł przy wzrośce weku o jeden rok, natomast dla osób powyżej 45 roku maleje w tempe 9,17 zł na rok. Interpretacja oszacowań przy pozostałych zmennych analogczna do wcześnej oszacowanych model. I znów wykres przedstawający zależność średnego pozomu od weku, tym razem z nałożonym dwoma funkcjam lnowym sklejonym w punkce 45. 6

Średn pozom dochodu w zależnośc od weku 00 400 600 800 1000 100 0 30 40 50 60 70 Przyjrzyjmy sę jeszcze raz wykresow, który prezentuje zależność mędzy średnm pozomem dochodu a wekem. Średn pozom dochodu w zależnośc od weku (mean) dochod 00 400 600 800 1000 100 0 30 40 50 60 70 wek w latach Może zamast dwóch sklejonych funkcj lnowych, lepej użyć trzech? Zależność mędzy wartoścą oczekwaną dochodu a wekem możemy zapsać w następujący sposób: δ 0 + δ1wek dla weku < 30 E( dochod ) = δ + δ3wek dla weku 30 weku < 45 δ 4 + δ5wek dla weku 45 Następne defnujemy dwe zmenne zero-jedynkowe: 7

0 dla weku < 30 d1 = 1 dla weku 30 0 dla weku < 45 d = 1 dla weku 45 Wówczas postać modelu możemy zapsać jako: E( dochod ) = β + β wek + β d + β d wek + β d + β d wek = 1 3 1 4 1 5 6 β 1 β wek dla weku 30 + < δ0 δ1 = ( β1 + β3) + ( β + β4) wek dla weku 30 weku < 45 δ δ3 ( β1 + β3 + β5) + ( β + β4 + β6) wek dla weku 45 δ4 δ5 Pozostaje narzucć ogranczena na parametry β1,..., β 6, aby zapewnć sobe cągłość w punktach 30 45. Warunek na cągłość w 30: β1 + β *30 = ( β1 + β3) + ( β + β4)*30 β3 = 30β4 Warunek na cągłość w 45: β1 + β3 + ( β + β4)*45 = ( β1 + β3 + β5) + ( β + β4 + β6)*45 β5 = 45β6 Wstawamy uzyskane ogranczene do naszego równana: E( dochod ) = β + β wek 30β d + β d wek 45β d + β d wek = 1 4 1 4 1 6 6 = β1 + βwek + β4 d1( wek 30) + β6 d( wek 45) = wek _ 30 wek _ 45 = β + β wek + β wek _ 30 + β wek _ 45 1 4 6 Łatwo zauważyć, że jeśl prawdzwa jest hpoteza H0 : β4 = β6 = 0, to model redukuje sę do standardowego modelu lnowego (dochód zależy wówczas w sposób lnowy od weku). Aby móc oszacować model ze sklejanym funkcjam lnowym, musmy zdefnować nowe zmenne: 0 dla weku < 30 wek _ 30 = d1( wek 30) = wek 30 dla weku 30 0 dla weku < 45 wek _ 45 = d( wek 45) = (Tą zmenną stworzylśmy już wek 45 dla weku 45 przy estymacj poprzednego modelu.). generate wek_30 = 0 /*Tworzymy zmenną o nazwe wek_30; na raze zmenna przyjmuje tylko wartość 0*/. replace wek_30 = wek - 30 f wek >= 30 /*Zamenamy wartość zmennej wek na (wek - 30) dla osób, które mają przynajmnej 30 lat*/. regress dochod wek wek_30 wek_45 plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_30, wek_45, plec, sredne, wyzsze - zmenne nezależne */ 8

-------------+------------------------------ F( 6, 1076) = 19.09 Model 7191579.3 6 1198549.9 Prob > F = 0.0000 Resdual 675568556 1076 67851.818 R-squared = 0.096 -------------+------------------------------ Adj R-squared = 0.091 Total 747481135 108 69083.84 Root MSE = 79.37 wek 11.899 11.07069 1.07 0.83-9.89658 33.61551 wek_30 -.87738 15.136-0.19 0.849-3.5693 6.81485 wek_45-17.7131 1.0151-1.47 0.141-41.30958 5.866954 plec -338.7973 48.30683-7.01 0.000-433.5836-44.011 sredne 10.535 77.7491.71 0.007 57.96641 363.0806 wyzsze 711.39 99.74388 7.13 0.000 515.6755 907.1046 _cons 35.5816 304.6859 1.07 0.85-7.643 93.475 Na podstawe oszacowanych parametrów zależność mędzy dochodem a wekem możemy zapsać: b1 + bwek dla weku < 30 ˆ dochod = ( b1 30 b4 ) + ( b + b4 ) wek dla weku [30, 45) = ( b1 30b4 45 b6 ) + ( b + b4 + b6 ) wek dla weku 35,5816 + 11,899wek dla weku < 30 = (35,5816 30*(,87738)) + (11,899,87738) wek dla weku [30, 45) (35.5816 30*(,87738) 45*( 17,7131))+(11,899,87738 17,7131) wek dla weku 45 35,5816 + 11,899wek dla weku < 30 = 411,89874 +9,01568 wek dla weku [30, 45) 109,3577 8,70568wek dla weku 45 Interpretacja wynków: dla osób ponżej 30 roku dochód rośne średno o 11,89 zł przy wzrośce weku o jeden rok, natomast dla osób w przedzale wekowym [30, 45) w tempe 9,0 zł na rok. Dla osób powyżej 45 roku dochód maleje o 8,71 zł przy wzrośce weku o 1 rok. Na konec wykres: Średn pozom dochodu w zależnośc od weku 00 400 600 800 1000 100 0 30 40 50 60 70 9

Można równeż założyć, że zależność mędzy dochodem a wekem wśród osób ponżej 45 roku życa jest kwadratowa, natomast dla osób powyżej 45 roku życa lnowa. Średn pozom dochodu w zależnośc od weku (mean) dochod 00 400 600 800 1000 100 0 30 40 50 60 70 wek w latach Zależność mędzy wartoścą oczekwaną dochodu a wekem zapsujemy w następujący sposób: δ 0 + δ1wek + δwek dla weku < 45 E( dochod ) = δ3 + δ4wek dla weku 45 Następne defnujemy zmenną zerojedynkową: 1 dla weku < 45 d = 0 dla weku 45 Wówczas postać modelu możemy zapsać jako: E( dochod ) = β + β wek + β d + β dwek + β dwek = 1 3 4 5 β1 + β3 + ( β + β4) wek + β 5 wek dla weku < 45 δ δ 0 δ1 = β 1 + β wek dla weku 45 δ3 δ4 Pozostaje narzucć ogranczena na parametry β1,..., β 5, aby zapewnć sobe cągłość w punkce 45. Mus zachodzć: ( β + β ) + ( β + β )*45 + β 45 = β + β *45 β = 45β 45 β 1 3 4 5 1 3 4 5 Wstawamy uzyskane ogranczene do naszego równana: E( dochod ) = β + β wek + ( 45β 45 β ) d + β dwek + β dwek = 1 4 5 4 5 1 wek 4 d( wek 45) 5 d( wek 45 ) = β + β + β + β = wek _ 45 wek 45 β + β wek + β wek _ 45 + β wek 45 1 4 5 Łatwo zauważyć, że jeśl prawdzwa jest hpoteza H0 : β4 = β5 = 0, to model redukuje sę do standardowego modelu lnowego (dochód zależy wówczas w sposób lnowy od weku). Aby 10

móc oszacować model ze sklejanym funkcjam lnowym, musmy zdefnować nowe zmenne: wek 45 dla weku < 45 wek _ 45 = d( wek 45) = 0 dla weku 45 wek 45 dla weku < 45 wek 45 = d( wek 45 ) = 0 dla weku 45. drop wek_45 /*usunęce z pamęc Staty zmennej wek_45*/. generate wek_45 = 0 /*Tworzymy zmenną o nazwe wek_45; na raze zmenna przyjmuje tylko wartość 0*/. replace wek_45 = wek - 45 f wek < 45 /*Zamenamy wartość zmennej wek_45 na (wek - 45) dla osób ponżej 45 lat*/. generate wek 45 = 0 /*Tworzymy zmenną o nazwe wek 45; na raze zmenna przyjmuje tylko wartość 0*/. replace wek 45 = wek^ - 45^ f wek < 45 /*Zamenamy wartość zmennej wek 45 na (wek^ - 45^) dla osób ponżej 45 lat*/. regress dochod wek wek_45 wek 45 plec sredne wyzsze /*dochod - zmenna zależna, wek, wek_45, wek 45, plec, sredne, wyzsze - zmenne nezależne */ -------------+------------------------------ F( 6, 1076) = 19.11 Model 71974761.1 6 11995793.5 Prob > F = 0.0000 Resdual 675506374 1076 67794.08 R-squared = 0.0963 -------------+------------------------------ Adj R-squared = 0.0913 Total 747481135 108 69083.84 Root MSE = 79.33 wek -7.909101 8.396863-0.94 0.346-4.38518 8.56698 wek_45 9.3564 9.61591 0.99 0.3-8.75885 87.4641 wek 45 -.174977.46914-0.37 0.713-1.093.748004 plec -338.699 48.30033-7.01 0.000-433.477-43.957 sredne 09.6498 77.78903.70 0.007 57.01445 36.85 wyzsze 710.749 99.719 7.1 0.000 514.6035 905.9464 _cons 1166.541 46.956.74 0.006 330.0758 003.006 Na podstawe oszacowanych parametrów zależność mędzy dochodem a wekem możemy zapsać: ˆ ( b1 45b4 45 b5 ) + ( b + b4 ) wek + b5wek dla weku < 45 dochod = = b1 + bwek dla weku 45 = 1166,541 7,909101wek (1166,541 45*9,3564 45 *( 0,174977)) + ( 7,909101+9,3564) wek 0,174977wek dla weku < 45 dla weku 45 + < = 1166,541 7,909101wek dla weku 45 194,98004 1,443539wek 0,174977wek dla weku 45 (*) Narysujemy jeszcze wykres zależnośc średnego pozomu dochodu w zależnośc od weku z nałożoną krzywą (*). 11

Średn pozom dochodu w zależnośc od weku 00 400 600 800 1000 100 0 30 40 50 60 70 Przejdzemy do analzy wpływu wykształcena płc na dochód. W analzowanych do tej pory przez nas modelach zakładalśmy, że wpływ tych zmennych na dochód był addytywny. Postaramy sę sprawdzć, czy wpływ wykształcena na dochód ne zależy od płc (może mężczyźn z wyższym wykształcenem dostają wyższą premę nż kobety?). W tym celu do modelu wprowadzmy loczyny zmennych płeć wykształcene: E( dochod ) = β1 + βplec + β3sredne + β4wyzsze + β5plec * sredne + β6plec* wyzsze Zakładamy, że zmenna plec zakodowana jest w następujący sposób: 0 dla mężczyzn plec = 1 dla kobet Możemy węc wartość oczekwaną dochodu zapsać w następujący sposób: E( dochod ) = β1 dla mężczyzn z wykształcenem podstawowym E( dochod ) = β1 + β dla kobet z wykształcenem podstawowym E( dochod ) = β1 + β3 dla mężczyzn z wykształcenem średnm E( dochod ) = β1 + β + β3 + β5 dla kobet z wykształcenem średnm E( dochod ) = β1 + β4 dla mężczyzn z wykształcenem wyższym E( dochod ) = β1 + β + β4 + β6 dla kobet z wykształcenem wyższym A z tego bezpośredno wynka nterpretacja parametrów, np: β - o le mnej lub węcej zarabają kobety z wykształcenem podstawowym w porównanu z mężczyznam z wykształcenem podstawowym. β + β5 - o le mnej lub węcej zarabają kobety z wykształcenem średnm w porównanu z mężczyznam z wykształcenem średnm. β - prema dla mężczyzn za uzyskane wykształcena średnego. 3 β + β - prema dla kobety za uzyskane wykształcena średnego. 3 5 β 5 - różnca w prem mędzy kobetam a mężczyznam za uzyskane wykształcena średnego.. x: regress dochod wek wek_.plec*.wyksztalcene /*dochod - zmenna zależna, wek, wek_ oraz nterakcje medzy wykształcenem płcą - zmenne nezależne; prefx x: służy do rozkodowywana zmennych dyskretnych na zero-jedynkowe oraz wprowadzana do modelu nterakcj.plec _Iplec_0-1 (naturally coded; _Iplec_0 omtted).wyksztalcene _Iwyksztalc_1-3 (naturally coded; _Iwyksztalc_1 omtted).plec*.wyks~e _IpleXwyk_#_# (coded as above) 1

-------------+------------------------------ F( 7, 1075) = 18.83 Model 8164817.6 7 11664031.1 Prob > F = 0.0000 Resdual 66583918 1075 619379.458 R-squared = 0.109 -------------+------------------------------ Adj R-squared = 0.1034 Total 747481135 108 69083.84 Root MSE = 787.01 wek 36.38318 15.39846.36 0.018 6.168745 66.5976 wek_ -.404935.196 -.06 0.039 -.789957 -.0199131 _Iplec_1-144.4044 143.4615-1.01 0.314-45.9008 137.0919 _Iwyksztal~ 74.703 105.1538.61 0.009 67.94046 480.600 _Iwyksztal~3 1040.998 137.1701 7.59 0.000 771.8461 1310.149 _IpleXwyk_~ -143.4455 153.4394-0.93 0.350-444.501 157.69 _IpleXwyk_~3-68.341 197.7395-3.45 0.001-1070.34-94.3418 _cons -11.165 300.6773-0.40 0.687-711.1435 468.8184 Ops oznaczeń Staty: _Iplec_1 płeć _Iwyksztal~ wykształcene średne _Iwyksztal~3 wykształcene wyższe _IpleXwyk_~ płeć x (wykształcene średne) _IpleXwyk_~3 - płeć x (wykształcene wyższe) Oszacowany model możemy zapsać: dochod ˆ = 11,165 144,4044 plec + 74,703sredne + 1040,998wyzsze 143,4455 plec * sredne 68,341 plec * wyzsze + 36,38318wek 0.404935 wek Przykładowa nterpretacja: Wzrost dochodu po uzyskanu wykształcena średnego dla mężczyzn wynos 74,7 zł. W przypadku kobet wzrost dochodu po uzyskanu wykształcena średnego jest o 143,45 zł mnejszy nż dla mężczyzn. Różnca w dochodach kobet mężczyzn o wykształcenu średnm wynos: 144,40 143,45= 87,85 na korzyść mężczyzn. Różnca w dochodach kobet mężczyzn o wykształcenu wyższym wynos: 144,40 68,34= 86,74 na korzyść mężczyzn. Na konec zajmemy sę nterakcjam mędzy zmennym cągłym dyskretnym. Wprowadzane tego typu nterakcj do modelu ma sens, jeżel wpływ pewnej nezależnej zmennej cągłej na zmenną zależną zależy od pozomów przyjmowanych przez dyskretną zmenną. Rozpatrzymy nterakcje mędzy mejscem zameszkana a wekem. Zmenna oznaczająca mejsce zameszkana to masto_1 jest ona zakodowana w następujący sposób: 1 respondent meszka na ws respondent meszka w meśce do 5 tyś. (małe masto) 3 respondent meszka w meśce od 5 tyś. do 50 tyś. (średne masto) 4 respondent meszka w meśce powyżej 50 tyś. (duże masto) Postać modelu: E( dochod ) = β + β male _ masto + β sredne _ masto + β duze _ masto + β wek + 0 1 3 4 + β wek * male _ masto + β wek * sredne _ masto + β wek * duze _ masto Możemy węc wartość oczekwaną dochodu zapsać w następujący sposób: E( dochod ) = β + β wek - osoby meszkające na ws 5 6 7 0 4 0 1 4 5 E( dochod ) = β + β + ( β + β ) wek - osoby meszkające w meśce do 5 tyś. 13

E( dochod ) = β + β + ( β + β ) wek - osoby meszkające w meśce od 5 tyś. do 50 tyś. 0 4 6 E( dochod ) = β0 + β3 + ( β4 + β7 ) wek - osoby meszkające w meśce powyżej 50 tyś. Interpretacja parametrów: β4 - o le wzrośne lub spadne dochód przy wzrośce weku o jeden rok dla osób meszkających na ws. β4 + β5 - o le wzrośne lub spadne dochód przy wzrośce weku o jeden rok dla osób meszkających w małym meśce. β4 + β6 - o le wzrośne lub spadne dochód przy wzrośce weku o jeden rok dla osób meszkających w średnm meśce. β4 + β7 - le wzrośne lub spadne dochód przy wzrośce weku o jeden rok dla osób meszkających w dużym meśce. Interpretacja β1, β, β 3 standardowa, tzn. paramatry pokazują o le mnej lub węcej w porównanu z osobam meszkającym na ws zarabają odpowedno osoby meszkające w małym, średnm dużym meśce.. x: regress dochod.masto_1*wek /*.masto*wek - nterakcje mędzy zmenną masto a wekem*/.masto_1 _Imasto_1_1-4 (naturally coded; _Imasto_1_1 omtted).masto_1*wek _ImaXwek_# (coded as above) -------------+------------------------------ F( 7, 1075) = 4.50 Model 16878.5 7 303835.5 Prob > F = 0.0001 Resdual 761857 1075 675546.843 R-squared = 0.085 -------------+------------------------------ Adj R-squared = 0.01 Total 747481135 108 69083.84 Root MSE = 81.9 _Imasto_1_ 8.34615 96.454 0.10 0.94-553.919 609.984 _Imasto_1_3 53.41383 49.06 0.1 0.830-435.183 54.046 _Imasto_1_4 135.6545 83.6069 0.48 0.633-40.8315 69.1404 wek -.4870689 4.569159-0.11 0.915-9.45549 8.47841 _ImaXwek_ 3.588019 7.60314 0.47 0.637-11.3308 18.50684 _ImaXwek_3 5.69888 6.355967 0.90 0.370-6.7766 18.17039 _ImaXwek_4 5.39686 7.063888 0.76 0.445-8.46485 19.5686 _cons 641.719 175.981 3.65 0.000 96.4145 987.09 Przykładowa nterpretacja: 0, 4870689 - wzrost weku o jeden rok u osoby meszkającej na ws powoduje spadek dochodu o 0,49 zł 0,4870689+5,39686 =4,909171- wzrost weku o jeden rok u osoby meszkającej w dużym meśce powoduje wzrost dochodu o 4,91 zł I. Forma funkcyjna Przypomnjmy sobe defncję elastycznośc (zakładamy, że y jest funkcją x) : y x y x y x = = - procentowa zmana y, przy zmane x o 1% e y, x y / x x y x y oraz semestycznośc: y 1 1 se, / x y = = y - zmana x o jedną jednostkę powoduje zmanę y o 100* se y, x % y x y x y x y Rozpatrzmy następującą postać naszego modelu (zmenna plec wartość 1 dla kobet, 0 dla mężczyzn): 14

ln( dochod ) = β + β ln( wek ) + β plec + β sredne + β wyzsze + ε 0 wek plec sredn wyższe Jak teraz można znterpretować oszacowana parametrów? e wek ( ) 1 wek = = = = β ( dochod ) wek ( dochod ) ln( dochod ) ln( ) ln( dochod ) dochod, wek ( wek ) dochod ( wek ) dochod ln( wek ) Jeżel zmenna zależna jest zlogarytmowana, to oszacowane parametru przy zlogarytmowanej zmennej nezależnej nterpretujemy jako elastyczność. se = = = = β ( dochod ) 1 ( dochod ) ln( dochod ) ln( dochod ) dochod, plec ( plec) dochod ( plec) ( dochod ) ( plec) Jeżel zmenna zależna jest zlogarytmowana, to oszacowana parametru przy nezlogarytmowanej zmennej nezależnej nterpretujemy jako semelastycznośc.. regres ln_dochod ln_wek plec sredne wyzsze -------------+------------------------------ F( 4, 1078) = 56.9 Model 64.47631 4 16.1190577 Prob > F = 0.0000 Resdual 305.30941 1078.831375 R-squared = 0.1744 -------------+------------------------------ Adj R-squared = 0.1713 Total 369.77917 108.3417554 Root MSE =.5318 ln_ ln_wek.048507.0587076 3.49 0.001.0896565.300449 plec -.35367.03485-10.03 0.000 -.388998 -.61735 sredne.73967.0519976 5.7 0.000.1719348.3759906 wyzsze.7139047.0667515 10.69 0.000.5897.844883 _cons 5.63668.1813 5.35 0.000 5.188418 6.058919 Parametr przy zmennej ln_wek nterpretujemy jako elastyczność dochodu względem weku, czyl: wzrost weku o 1% powoduje wzrost dochodu o 0,% (nterpretacja mało naturalna, gdyż zmenna wek jest pseudocągła ). Parametry przy pozostałych zmennych nterpretujemy jako semelastycznośc: kobety w porównanu z mężczyznam zarabają o 3,54% mnej, osoby z wykształcenem średnm oraz wyższym zarabają węcej w porównanu z wykształcenem podstawowym odpowedno o 7,4% 71,39%. Przechodzmy do zlustrowana wprowadzena do modelu tzw. efektów progowych. Defnujemy następujące zmenne: masto_male 1, jeżel osoba meszka w meśce (dowolnej welkośc); 0 w pozostałych przypadkach; masto_sredne 1, jeżel osoba meszka w meśce przynajmne 5 tyś.; 0 w pozostałych przypadkach; duze_masto 1, jeżel osoba meszka w meśce przynajmnej 50 tyś.; 0 w pozostałych przypadkach. Rozpatrujemy następującą regresję: E( dochod ) = β + β wek + β wek + β masto _ male + β masto _ sredne + β 0 wek wek _ m_ m m _ s masto _ duze = m_ d plec wek 15

β0 + βwek wek + βwek _ wek wes β0 + βwek wek + βwek _ wek + βm _ m masto do 5 tys = β0 + βwek wek + βwek _ wek + βm _ m + βm _ s masto do 50 tys β + β wek + β wek + β + β + β masto powyżej 50 tys 0 wek wek _ m _ m m _ d m _ d Na przykład, parametr β nterpretujemy jako różncę w średnch dochodach osób m _ m meszkających w meśce do 5 tyś. a osób meszkających na ws.. regres dochod wek wek_ masto_male masto_sredne masto_duze -------------+------------------------------ F( 5, 1077) = 7.11 Model 387603.5 5 477450.71 Prob > F = 0.0000 Resdual 7360853 1077 671874.17 R-squared = 0.0319 -------------+------------------------------ Adj R-squared = 0.074 Total 747481135 108 69083.84 Root MSE = 819.68 wek 37.8833 16.01033.37 0.018 6.468336 69.987 wek_ -.4486477.039518 -.0 0.08 -.8488356 -.0484597 masto_male 158.807 74.5007.1 0.034 1.0986 304.469 masto_sre~e 107.7085 73.16483 1.47 0.141-35.85331 51.70 masto_duze 79.57117 71.45687 1.11 0.66-60.6399 19.7816 _cons -119.8138 303.7319-0.39 0.693-715.7871 476.1596 Interpretacja parametrów: Osoby meszkające w meśce do 5 tyś. zarabają średno o 158,8 zł węcej w porównanu z osobam meszkającym na ws. Osoby meszkające w meśce do 50 tyś zarabają średno o 107,71 zł węcej w porównanu z osobam meszkającym w meśce do 5 tyś. Osoby meszkające w meśce powyżej 50 tyś. zarabają średno o 79.57 zł węcej nż osoby meszkające w meśce do 50 tyś. Przeprowadzmy jeszcze regresję, w której rozkodowanu na zmenne zero-jedynkowe (pozom bazowy osoby meszkające na ws) zostane poddana następująca zmenna oznaczająca mejsce zameszkana respondenta: 1 wes masto do 5 tys masto _1 = 3 masto do 50 tys 4 masto powyżej 50 tys. x:regres dochod wek wek_.masto_1.masto_1 _Imasto_1_1-4 (naturally coded; _Imasto_1_1 omtted) 16

-------------+------------------------------ F( 5, 1077) = 7.11 Model 387603.5 5 477450.71 Prob > F = 0.0000 Resdual 7360853 1077 671874.17 R-squared = 0.0319 -------------+------------------------------ Adj R-squared = 0.074 Total 747481135 108 69083.84 Root MSE = 819.68 wek 37.8833 16.01033.37 0.018 6.468336 69.987 wek_ -.4486477.039518 -.0 0.08 -.8488356 -.0484597 _Imasto_1_ 158.807 74.5007.1 0.034 1.0986 304.469 _Imasto_1_3 65.989 63.10008 4. 0.000 14.176 389.80 _Imasto_1_4 345.5604 73.00193 4.73 0.000 0.318 488.805 _cons -119.8138 303.7319-0.39 0.693-715.7871 476.1596 Interpretacja parametrów: Osoby meszkające w meśce do 5 tyś. zarabają średno o 158.8 zł węcej w porównanu z osobam meszkającym na ws. Osoby meszkające w meśce do 50 tyś. zarabają średno węcej o 65, 99 zł w porównanu z osobam meszkającym na ws. Jeżel odejmemy oszacowana parametrów przy zmennych zero-jedynkowych, które wyróżnają respondentów meszkających w meśce do 50 tyś meśce do 5 tyś, to otrzymamy średną różncę w dochodach mędzy tym dwoma typam mejscowośc: 65,989-158,807=107,7085. Proszę porównać uzyskany wynk z modelem z efektam progowym. Nauczymy sę jeszcze wprowadzać do modelu tzw. kontrasty w odchylenach. W modelu będzemy uzależnać dochód od weku, weku podnesonego do kwadratu oraz zmennej masto (8 pozomów): 1 respondent meszka na ws respondent meszka w meśce do 10 tyś. 3 respondent meszka w meśce od 10 tyś. do 5 tyś. 4 respondent meszka w meśce od 5 tyś. do 50 tyś. 5 respondent meszka w meśce od 50 tyś. do 100 tyś. 6 respondent meszka w meśce od 100 tyś. do 50 tyś. 7 respondent meszka w meśce od 50 tyś. do 500 tyś. 8 respondent meszka w meśce powyżej 500 tyś. Najperw tworzymy 8 zmennych zerojedynkowych odpowadających zmennej masto: 1 dla masto = j m _ j = dla j = 1,,...,8 0 dla masto j Następne defnujemy zmenne: M _ j = m _ j m _1 dla j =,3,...,8 Łatwo zauważyć, że: 1 dla masto = 1 M _ j = 0 dla masto 1 oraz masto j 1 dla masto = j Zapsujemy regresję: E( dochod ) = β wek + β wek + γ + γ M _ +... + γ M _ 8 wek wek _ 0 8 Zastanówmy sę w jak sposób można nterpretować parametry przy zmennych M_j. Zauważamy, że dla każdej obserwacj zachodz: m _1 + m _ +... + m _ 8 = 1 17

oraz wykorzystujemy defncję zmennych M_j: E( dochod ) = β wek + β wek + γ ( m _1 + m _ +... + m _ 8 ) + γ ( m _ m _1 ) +... + 0 8 α8 wek wek _ 0 γ 8 ( m _ 8 m _1 ) = βwekwek + βwek _ wek + ( γ 0 γ... γ 8) m _1 + ( γ 0 + γ ) m _ +... + ( γ + γ ) m _8 α α 1 Przekształclśmy nasz model do modelu bez stałej. Sumujemy parametry przy zmennych zerojedynkowych dotyczących mejsca zameszkana: 8 8 α 1 = 8 = = α 1 γ 0 γ = 0 8 Czyl stała w naszym model jest średną z parametrów dla poszczególnych zmennych dotyczących mejsca zameszkana (proszę zauważyć, że za każdym razem przypsujemy tę samą wagę równą 1/8, chocaż próbk wyodrębnone ze względu na mejsce zameszkana ne są równolczne). Pozostaje nam nadane nterpretacj parametrom przy zmennych M_j: Czyl parametry j α = γ + γ γ = α γ 0 0 α = γ + γ γ = α γ 8 0 8 8 8 0 γ można nterpretować jako odchylena parametrów dla poszczególnych pozomów mejsca zameszkana od średnej z tych parametrów. Trzeba jeszcze wyznaczyć odchylene od średnej dla pozomu bazowego (u nas osoby meszkające na ws): α1 = γ 0 γ... γ 8 α1 γ 0 = γ... γ 8 Kedy warto używać w modelu kontrastów w odchylenach? Jeżel mamy w modelu zmenną jakoścową (duża lczba kategor) chcemy wychwycć te kategore, których wpływ na zmenną zależną jest najslnejszy. Kontrasty w odchylenach lepej stosować w przypadku zmennych nomnalnych (jedyne można określć, czy dwe kategore są równe czy sę różną; ne ma relacj porządku; np. zawód, województwo) nż porządkowych (można określć relację porządku; np. wykształcene). W przypadku zmennych porządkowych lepej (mom zdanem) stosować efekty progowe lub standardowe rozkodowywane na zmenne zerojedynkowe. Cały nasz przykład przeczy węc akaptow powyżej (zmenna masto jest zmenną porządkową). Poneważ w zborze danych ne ma zmennej nomnalnej o wększej nż dwa lczbe pozomów, dla celów dydaktycznych posłużyłem sę zmenną porządkową, która mała najwększą lczbę pozomów. Ponżej wynk oszacowań:. regress dochod wek wek_ M_-M_8 /*M_-M_8 - wszystke zmenne znajdujące sę w zborze danych mędzy M_ a M_8 włączne*/ -------------+------------------------------ F( 9, 1073) = 4.53 Model 7349075.7 9 3038786.19 Prob > F = 0.0000 Resdual 7013059 1073 671138.918 R-squared = 0.0366 -------------+------------------------------ Adj R-squared = 0.085 Total 747481135 108 69083.84 Root MSE = 819.3 wek 37.69533 16.04931.35 0.019 6.03739 69.18691 wek_ -.450063.045908 -.0 0.08 -.8516498 -.048768 M_ -140.93 9.75791-1.5 0.19-3.9307 41.0844 M_3-3.778 68.407-0.48 0.63-166.9447 101.4901 M_4 191.1179 85.08406.5 0.05 4.1679 358.068 M_5-39.73116 68.81041-0.58 0.564-174.7494 95.8706 18

M_6 6.45608 64.09488 0.41 0.680-99.30943 15.16 M_7 69.33958 80.95078 0.86 0.39-89.5001 8.1794 M_8 153.974 70.1744.19 0.08 16.7988 91.6685 _cons 116.9958 303.9513 0.38 0.700-479.4105 713.40 Zanm przejdzemy do nterpretacj, to wyznaczymy jeszcze odchylene od średnej dla osób meszkających na ws: γ... γ = ( 140,93 3,778+191,1179 39,73116+6,45608+69,33958+153,974)= 8 = 7.5061 Czyl najbardzej na mnus na płace oddzałuje meszkane na ws, natomast na plus w meśce mędzy 5 tyś. a 50 tyś. (a ne jak sę można było spodzewać w mastach najwększych, czyl powyżej 500 tyś.). Na konec rozważań na temat formy funkcyjnej zostane zaprezentowany model schodkowy. Zmenną wek, którą do tej pory traktowalśmy jak zmenną cągłą, rozkodujemy na zmenne zerojedynkowe: 1 dla weku 5 w _1 = 0 w. p. p 1 dla weku (5; 35] w _ = 0 w. p. p 1 dla weku (35; 45] w _ 3 = 0 w. p. p 1 dla weku (45; 55] w _ 4 = 0 w. p. p 1 dla weku > 55 w _ 5 = 0 w. p. p Postać modelu: E( dochod ) = β + β w _ + β w _ 3 + β w _ 4 + β w _ 5 = 1 3 4 5 β1 dla weku 5 β1 + β dla weku (5; 35] β1 + β3 dla weku (35; 45] β1 + β4 dla weku (45; 55] β1 + β5 dla weku > 55 Parametr β 1 możemy nterpretować jako średn pozom dochodu wśród osób ponżej 5 roku życa. Parametr β pokazuje o le średno węcej zarabają osoby w weku (5; 35], nż osoby ponżej 5 roku życa, parametr β 3 pokazuje o le średno węcej zarabają osoby w weku (35;45], nż osoby ponżej 5 roku życa, td.. Zaprezentowana powyżej forma funkcyjna modelu zakłada, że dochód ne zmena sę wewnątrz wyodrębnonych grup zmena sę w sposób skokowy pomędzy grupam. Na grunce teor ekonom trudno będze uzasadnć poprawność przyjętej formy funkcyjnej. Ponżej oszacowana:. regress dochod w_? /*"?" - zastępuje dowolny znak*/ 19

-------------+------------------------------ F( 4, 1078) =.33 Model 6403953.56 4 1600988.39 Prob > F = 0.0544 Resdual 74107718 1078 687455.64 R-squared = 0.0086 -------------+------------------------------ Adj R-squared = 0.0049 Total 747481135 108 69083.84 Root MSE = 89.13 w_ 16.6784 88.7104 1.44 0.15-46.5407 99.881 w_3 39.7376 84.81751.83 0.005 73.31151 406.1637 w_4 06.697 91.38316.6 0.04 7.388 386.006 w_5 175.5193 141.5618 1.4 0.15-10.486 453.873 _cons 639.0551 73.57334 8.69 0.000 494.6919 783.4183 Interpretacja parametrów: Osoby ponżej 5 roku życa zarabają średno 639,06 zł, osoby w weku (5; 35] zarabają średno o 39,74 zł węcej nż osoby ponżej 5 roku życa, td.. II. Testowane stotnośc zmennych, test na łączną stotność równana regresj, testowane hpotez łącznych Chcemy przetestować następującą hpotezę: H0 : βk = 0 vs. H1 : βk 0. Przy założenu, bk normalnośc zaburzena losowego statystyka testowa t = ˆ σ ( bk ) ma rozkład t-studenta o n K stopnach swobody. Przetestujemy stotność zmennych w modelu, w którym dochód uzależnamy od weku, weku podnesonego do kwadratu, płc, mejsca zameszkana (8 pozomów), wykształcena (3 pozomy), posadana własnej frmy oraz tego, czy zajmuje sę stanowsko kerowncze (3 pozomy). Ponżej oszacowana modelu:. x: regress dochod wek wek_ plec.masto.wyksztalcene wlasccel.keruje.masto _Imasto_1-8 (naturally coded; _Imasto_1 omtted).wyksztalcene _Iwyksztalc_1-3 (naturally coded; _Iwyksztalc_1 omtted).keruje _Ikeruje_1-3 (naturally coded; _Ikeruje_1 omtted) -------------+------------------------------ F( 15, 1067) = 17.9 Model 150436697 15 1009113.1 Prob > F = 0.0000 Resdual 597044439 1067 559554.3 R-squared = 0.013 -------------+------------------------------ Adj R-squared = 0.1900 Total 747481135 108 69083.84 Root MSE = 748.03 Oszacowana Oszacowana Statystyka p-value Przedzał ufnośc parametrów błędów testowa dla parametrów na standardowych pozome ufnośc 0,95 wek 4.4433 14.7454 1.66 0.098-4.489958 53.3766 wek_ -.3154905.187908-1.68 0.093 -.68401.0531 plec -6.7845 46.67488-5.63 0.000-354.3695-171.1995 _Imasto_ 14.0054 103.183 1.38 0.169-60.45966 344.4705 _Imasto_3 153.7331 81.13839 1.89 0.058-5.475779 31.94 _Imasto_4 397.9565 97.11639 4.10 0.000 07.3957 588.517 _Imasto_5 178.0643 80.83386.0 0.08 19.4598 336.6757 _Imasto_6 53.9841 77.0504 3.30 0.001 10.7934 405.1748 _Imasto_7 63.345 9.7850.84 0.005 81.8316 445.4068 _Imasto_8 360.6358 83.535 4.3 0.000 196.79 54.545 _Iwyksztal~ 74.88474 76.7659 0.98 0.39-75.66738 5.4369 0

_Iwyksztal~3 401.197 10.583 3.91 0.000 00.0397 60.3996 wlasccel 401.98 59.3749 6.76 0.000 84.8864 517.71 _Ikeruje_ 197.8718 61.9404 3.19 0.001 76.339 319.4106 _Ikeruje_3 67.3974 85.4647 7.87 0.000 504.7745 840.004 _cons 39.78778 83.5818 0.14 0.888-516.6535 596.9 Aby unknąć odczytywana wartośc krytycznych z tablc, testować hpotezy będzemy w oparcu o p-value. Zasada jest następująca, jeżel p-value > α (α - przyjęty pozom stotnośc), to brak podstaw do odrzucena hpotezy zerowej, jeśl p-value α, to odrzucamy hpotezę zerową. Na pozome stotnośc 0,05 setnych ne stotne są następujące zmenne (p-value > 0,05): wek, wek_, masto_ masto_3, wykształcene_ oraz stała. Przechodzmy do testu na łączną stotność równana regresj (hpoteza zerowa zakłada, że wszystke zmenne są w modelu nestotne). Omówmy najperw tablcę analzy warancj : źródło suma lczba stopn średna suma zmennośc kwadratów swobody kwadratów Source SS df MS ---------------+------------------------------ Model (ESS) 150436697 15 1009113.1 Resdual (RSS) 597044439 1067 559554.3 ---------------+------------------------------ Total (TSS) 747481135 108 69083.84 N-K K-1 N-1 ESS df = RSS df = 150436697 15 597044439 1067 Statystyka testowa w teśce na łączną stotność równana regresj: ESS /( K 1) F = ~ F ( K 1, N K ). RSS /( N K) Podstawając odpowedne wartośc z tablcy analzy warancj otrzymujemy: 150436697 F =. 15 597044439 1067 Na szczęśce ne musmy lczyć wartośc tego wyrażena. Stata automatyczne przeprowadza test na łączną stotność równana regresj (fragment zaznaczony na zelono na wydruku): F( 15, 1067) = 17.9 Statystyka testowa Prob > F = 0.0000 p-value Poneważ p-value jest mnejsze od przyjętego pozomu stotnośc (0,05), węc odrzucamy hpotezę zerową o nestotnośc równana regresj. Rozpatrzymy model, w którym dochód uzależnamy od weku, płc wykształcena: dochod = β + β wek + β plec + β sredne + β wyzsze + ε = 1 3 4 5 dochod = β1 + βwek + β3 plec wyksztalcene podstawowe (*) dochod = β1 + βwek + β3 plec + β4 wyksztalcene sredne dochod = β1 + βwek + β3 plec + β5 wyksztalcene wyższe Chcemy przetestować następującą hpotezę: dochód zależy od pozomu wykształcena w sposób lnowy ( prema za uzyskane wykształcena średnego wyższego jest taka sama) 1

oraz, że dochód rośne wraz z wekem w stałym tempe wynoszącym 1 zł. Aby zapsać model, który spełna podane ogranczene, defnujemy nową zmenną dotyczącą wykształcena (edu): 1 podstawowe średne 3 wyższe Model możemy zapsać w następujący sposób: dochod = α + 1wek + α plec + α edu + ε 1 3 4 α1 + 1wek + α3 plec + α4 wyksztalcene podstawowe (**) α1 + 1wek + α3 plec + α 4 wyksztalcene sredne α1 + 1wek + α3 plec + 3α 4 wyksztalcene wyższe Spróbujemy przedstawć model (**) jako model (*) z odpowednm ogranczenam. Oczywśce: β = 1. Model (**) zakłada, że różnca w średnch zarobkach osób z wykształcenem średnm podstawowym oraz wyższym średnm jest taka sama, czyl: β = β β β β = 0. Czyl zestaw ogranczeń jest następujący: 4 5 4 4 5 β = 1 H0 :. β4 β5 = 0 Ten sam zestaw ogranczeń, ale w zapse macerzowym: β1 β 0 0 1 0 0 1 β3 0 0 0 1 = 0 β4 β 5 Hpotezy łączne testujemy w oparcu o statystykę testową: ( e ReR e e) / g F = ~ F( g, N K), e e /( N K) gdze e ReR e e to odpowedno suma kwadratów reszt dla modelu z ogranczenam bez ogranczeń, g oznacza lczbę ogranczeń, K to lość szacowanych parametrów w modelu bez ogranczeń, natomast N oznacza lczbę obserwacj. Aby węc przetestować rozpatrywaną hpotezę musmy wyznaczyć sumę kwadratów reszt dla modelu bez ogranczeń modelu z ogranczenam. Ponżej oszacowana modelu bez ogranczeń (suma kwadratów reszt zaznaczona na zelono):. regress dochod wek plec sredne wyzsze -------------+------------------------------ F( 4, 1078) = 7.6 Model 69474590.4 4 17368647.6 Prob > F = 0.0000 Resdual 678006545 1078 68948.557 R-squared = 0.099 -------------+------------------------------ Adj R-squared = 0.0896 Total 747481135 108 69083.84 Root MSE = 793.06 wek 5.079415.4856.09 0.037.3141704 9.844659 plec -336.5881 48.359-6.97 0.000-431.4051-41.771 sredne 0.009 77.6303.83 0.005 67.67591 37.399 wyzsze 70.3531 99.5064 7.4 0.000 55.077 915.69 _cons 51.9914 15.3477 4.16 0.000 76.038 767.9446

Przechodzmy do modelu z ogranczenam: dochod = α1 + 1wek + α3 plec + α4edu + ε dochod 1wek = α1 + α3 plec + α4edu + ε Wynk oszacowań ponżej (suma kwadratów reszt zaznaczona na zelono):. regress y plec edu -------------+------------------------------ F(, 1080) = 5.17 Model 6644470.7 33135.3 Prob > F = 0.0000 Resdual 68574693 1080 634946.938 R-squared = 0.0881 -------------+------------------------------ Adj R-squared = 0.0864 Total 751987163 108 694997.378 Root MSE = 796.84 y Coef. Std. Err. t P> t [95% Conf. Interval] plec -345.441 48.4567-7.13 0.000-440.51-50.361 edu 370.083 49.91561 7.41 0.000 7.1406 468.057 _cons -6.3688 105.5359 -.14 0.03-433.4474-19.9015 Wyznaczamy wartość statystyk testowej: ( e ReR e e) / g (68574693 678006545)/ F = = 6,15. e e /( N K) 678006545/(1083 5) Wartość krytyczną odczytujemy z tablc: F* = F (,1078) = 3,004. 0,95 Poneważ wartość statystyk testowej jest wększa od wartośc krytycznej, węc hpotezę zerową odrzucamy. Czyl testowane ogranczene jest neprawdzwe. W Stace tego typu hpotezy można testować dużo mnejszym nakładem pracy. Najperw szacujemy model bez ogranczeń:. regress dochod wek plec sredne wyzsze -------------+------------------------------ F( 4, 1078) = 7.6 Model 69474590.4 4 17368647.6 Prob > F = 0.0000 Resdual 678006545 1078 68948.557 R-squared = 0.099 -------------+------------------------------ Adj R-squared = 0.0896 Total 747481135 108 69083.84 Root MSE = 793.06 wek 5.079415.4856.09 0.037.3141704 9.844659 plec -336.5881 48.359-6.97 0.000-431.4051-41.771 sredne 0.009 77.6303.83 0.005 67.67591 37.399 wyzsze 70.3531 99.5064 7.4 0.000 55.077 915.69 _cons 51.9914 15.3477 4.16 0.000 76.038 767.9446 Następne za pomocą komendy TEST podajemy lnowe ogranczena, które chcemy przetestować:. test (wek = 1) (*sredne = wyzsze) /*Nałożene ogranczeń*/ ( 1) wek = 1 y 3

( ) sredne - wyzsze = 0 F(, 1078) = 6.15 Prob > F = 0.00 Stata podaje wartość statystyk testowej oraz p-value. Oczywśce wynk ten sam, jak w przypadku testowana na pechotę. Wracamy teraz do modelu oszacowanego na początku tego rozdzału: -------------+------------------------------ F( 15, 1067) = 17.9 Model 150436697 15 1009113.1 Prob > F = 0.0000 Resdual 597044439 1067 559554.3 R-squared = 0.013 -------------+------------------------------ Adj R-squared = 0.1900 Total 747481135 108 69083.84 Root MSE = 748.03 wek 4.4433 14.7454 1.66 0.098-4.489958 53.3766 wek_ -.3154905.187908-1.68 0.093 -.68401.0531 plec -6.7845 46.67488-5.63 0.000-354.3695-171.1995 _Imasto_ 14.0054 103.183 1.38 0.169-60.45966 344.4705 _Imasto_3 153.7331 81.13839 1.89 0.058-5.475779 31.94 _Imasto_4 397.9565 97.11639 4.10 0.000 07.3957 588.517 _Imasto_5 178.0643 80.83386.0 0.08 19.4598 336.6757 _Imasto_6 53.9841 77.0504 3.30 0.001 10.7934 405.1748 _Imasto_7 63.345 9.7850.84 0.005 81.8316 445.4068 _Imasto_8 360.6358 83.535 4.3 0.000 196.79 54.545 _Iwyksztal~ 74.88474 76.7659 0.98 0.39-75.66738 5.4369 _Iwyksztal~3 401.197 10.583 3.91 0.000 00.0397 60.3996 wlasccel 401.98 59.3749 6.76 0.000 84.8864 517.71 _Ikeruje_ 197.8718 61.9404 3.19 0.001 76.339 319.4106 _Ikeruje_3 67.3974 85.4647 7.87 0.000 504.7745 840.004 _cons 39.78778 83.5818 0.14 0.888-516.6535 596.9 Zaczynamy od przetestowana łącznej stotnośc zmennych zerojedynkowych dotyczących mejsca zameszkana. Hpoteza zerowa jest następująca: H : β = β =... = β = 0 (mejsce zameszkana ne wpływa na dochód). 0 masto _ masto _ 3 masto _ 8 Testujemy hpotezę w Stace:. test _Imasto Imasto_3 _Imasto_4 _Imasto_5 _Imasto_6 _Imasto_7 _Imasto_8 ( 1) _Imasto_ = 0 ( ) _Imasto_3 = 0 ( 3) _Imasto_4 = 0 ( 4) _Imasto_5 = 0 ( 5) _Imasto_6 = 0 ( 6) _Imasto_7 = 0 ( 7) _Imasto_8 = 0 F( 7, 1068) = 4.37 Prob > F = 0.0001 Hpotezę zerową odrzucamy, bo p-value wynos 0.0001, czyl łączny wpływ zmennych zerojedynkowych dotyczących mejsca zameszkana jest stotny. 4

Co prawda łączny wpływ mejsca zameszkana na dochód jest stotny, jednakże zmenne zerojedynkowe wyróżnające masta do 10 tyś. masta mędzy 10 tyś. a 5 tyś. są nestotne na pozome stotnośc 0,05. Przetestujemy teraz hpotezę łączną, która zakłada, że ne ma różnc w dochodach pomędzy mastam do 10 tyś. a wsą oraz mastam mędzy 10 tyś. a 5 tyś. wsą. Hpotezę zerową można zapsać w następujący sposób: H : β = β = 0 Ponżej wynk testu:. test _Imasto Imasto_3 ( 1) _Imasto_ = 0 ( ) _Imasto_3 = 0 F(, 1067) =.5 Prob > F = 0.1063 0 masto _ masto _ 3 Na pozome stotnośc 0,05 brak podstaw do odrzucena hpotezy zerowej. Ponżej oszacowana modelu, w którym zakładamy, że ne ma różnc w dochodze pomędzy osobam meszkającym na ws, w meśce do 10 tyś. oraz w meśce mędzy 10 a 5 tyś.:. x: regress dochod wek wek_ plec m_4 - m_8.wyksztalcene wlasccel.keruje.wyksztalcene _Iwyksztalc_1-3 (naturally coded; _Iwyksztalc_1 omtted).keruje _Ikeruje_1-3 (naturally coded; _Ikeruje_1 omtted) -------------+------------------------------ F( 13, 1069) = 0.9 Model 1479650 13 11378665.4 Prob > F = 0.0000 Resdual 599558485 1069 560859. R-squared = 0.1979 -------------+------------------------------ Adj R-squared = 0.1881 Total 747481135 108 69083.84 Root MSE = 748.91 wek 4.83166 14.7501 1.68 0.093-4.110998 53.77431 wek_ -.3168414.187878-1.69 0.09 -.685487.0517999 plec -57.903 46.64001-5.53 0.000-349.4186-166.3859 m_4 33.8538 9.390 3.61 0.000 151.8638 513.8439 m_5 114.618 75.17501 1.5 0.18-3.8898 6.154 m_6 189.1386 70.80091.67 0.008 50.1403 38.0631 m_7 199.4538 87.8547.7 0.03 7.06657 371.841 m_8 94.9849 77.66397 3.80 0.000 14.5938 447.376 _Iwyksztal~ 101.0681 75.81161 1.33 0.183-47.68831 49.846 _Iwyksztal~3 434.9573 101.3591 4.9 0.000 36.07 633.846 wlasccel 38.0437 58.69174 6.51 0.000 66.8796 497.078 _Ikeruje_ 05.7981 61.88897 3.33 0.001 84.36045 37.358 _Ikeruje_3 688.5181 84.94894 8.11 0.000 51.835 855.037 _cons 6.17371 83.6879 0. 0.87-494.4746 618.81 Zmenna m_ dla = 4,...,8 to zmenna zerojedynkowa wyróżnająca -ty pozom zmennej masto. Pozomem bazowym jest weś masta do 5 tyś. meszkańców. Tym razem nestotny okazał sę pozom 5 (masta mędzy 50 tyś. a 100 tyś. meszkańców). Oszacowana parametrów przy zmennych m_5, m_6 m_7 są na bardzo zblżonym pozome. Sprawdzmy, czy można połączyć je w jeden pozom. Testujemy następującą hpotezę: H β = β = β (dochód jest tak sam w mastach od 50 tyś. do 500 tyś. 0 : m _ 5 m_ 6 m _ 7 Wynk testu ponżej: meszkańców) 5

. test m_5 = m_6 = m_7 ( 1) m_5 - m_6 = 0 ( ) m_5 - m_7 = 0 F(, 1069) = 0.46 Prob > F = 0.6339 P-value wynos 0,6339, węc brak podstaw do odrzucena hpotezy zerowej. Tworzymy nową zmenną oznaczającą mejsce zameszkana (masto_): 1 - weś, masto do 5 tyś. - masto od 5 tyś. do 50 tyś. 3 - masto od 50 tyś. do 500 tyś. 4 - masto powyżej 500 tyś. Ponżej wynk regresj z nową zmenną dotyczącą mejsca zameszkana:. x: regress dochod wek wek_ plec.masto_.wyksztalcene wlasccel.keruje.masto Imasto 1-4 (naturally coded; _Imasto 1 omtted).wyksztalcene _Iwyksztalc_1-3 (naturally coded; _Iwyksztalc_1 omtted).keruje _Ikeruje_1-3 (naturally coded; _Ikeruje_1 omtted) -------------+------------------------------ F( 11, 1071) = 3.9 Model 147410998 11 13400999.8 Prob > F = 0.0000 Resdual 600070137 1071 56089.577 R-squared = 0.197 -------------+------------------------------ Adj R-squared = 0.1890 Total 747481135 108 69083.84 Root MSE = 748.5 wek 4.37596 14.73036 1.65 0.098-4.57668 53.796 wek_ -.311463.1876344-1.66 0.097 -.679636.0567095 plec -58.39 46.61433-5.54 0.000-349.705-166.7735 _Imasto 33.6783 9.19174 3.61 0.000 151.7814 513.575 _Imasto 3 165.3864 5.83547 3.13 0.00 61.71365 69.059 _Imasto 4 94.4363 77.638 3.79 0.000 14.171 446.7455 _Iwyksztal~ 103.608 75.69144 1.37 0.171-44.913 5.183 _Iwyksztal~3 439.061 101.097 4.34 0.000 40.6144 637.7979 wlasccel 381.987 58.65077 6.51 0.000 66.8453 497.01 _Ikeruje_ 05.4504 61.83148 3.3 0.001 84.158 36.775 _Ikeruje_3 686.863 84.88147 8.09 0.000 50.3103 853.4161 _cons 69.9635 83.394 0.4 0.807-486.771 65.3637 Pozomem bazowym dla zmennych zerojedynkowych dotyczących mejsca zameszkana jest weś masta do 5 tyś. meszkańców. Tym razem wszystke pozomy są stotne. Nestotna jest jednak zmenna zerojedynkowa oznaczająca osoby z wykształcene średnm. Oszacujemy węc następny model, w którym za pozom bazowy odnośne wykształcena przyjmemy osoby z wykształcenem podstawowym średnm:. x: regress dochod wek wek_ plec.masto_ wyzsze wlasccel.keruje.masto Imasto 1-4 (naturally coded; _Imasto 1 omtted).keruje _Ikeruje_1-3 (naturally coded; _Ikeruje_1 omtted) -------------+------------------------------ F( 10, 107) = 6.10 Model 14636100 10 1463610 Prob > F = 0.0000 Resdual 601119935 107 560746.08 R-squared = 0.1958 -------------+------------------------------ Adj R-squared = 0.1883 Total 747481135 108 69083.84 Root MSE = 748.83 6