Zadane Analzujemy model z jedną zmenną objaśnającą bez wyrazu wolnego: y = β x + ε, ε ~ (0, σ ), gdze x jest nelosowe.. Wyznacz estymator MNK parametru β oraz oblcz jego warancję. (4 pkt) y. Zaproponowano jako estymator parametru β wyrażene postac. Pokazać, że ten x estymator jest neobcążony oraz wyznaczyć jego warancję. (4 pkt) 3. Czy stnej estymator parametru β postac Cy, gdze C jest pewnym wektorem a y jest wektorem zawerającym obserwacje na zmennej zależnej, który jest neobcążony ma mnejszą warancję nż estymator uzyskany w punkce. ( pkt) Rozwązane x x x. X X = = [ x x ] = x x n x n x n n n = x y y n X y = [ x x = n ] = x y = x n y n y n ( ) ( ) n n n x y = b = X X X y = x x y = = = n x Var( y ) = Var( βx + ε ) = Var( ε ) = σ = n x y = n σ n n = n x x x = = = Var( b) = Var = x Var( y ) = σ Lub proścej: przy spełnenu założeń KMRL postać warancj estymatora MNK: σ Var( b) = σ ( X X ) = n x = y n n n n. E = E ( n y ) ( ) E y ( β x ) β x β = = = = = = = = x x nx nx nx y n n Var σ = Var ( n y ) = ( ) Var y nσ = = = = x x n x n x nx 3. Model spełna założena twerdzena Gaussa-Markowa, czyl estymator MNK w klase lnowych (estymator postac Cy) neobcążonych estymatorów ma najmnejszą warancję. Czyl ne stneje estymator lnowy neobcążony, który małby mnejszą warancję nż estymator MNK. IID
Zadane Celem analzy jest wyznaczene determnantów długośc bezroboca. Ops zmennych: bezroboce czas przebywana na bezrobocu wyrażony w mesącach (zmenna zależna); wek wek wyrażony w latach; wek_ wek podnesony do kwadratu; sredne wartość, jeżel dla osoby najwyższym ukończonym pozomem wykształcena jest wykształcene średne, 0 w pozostałych przypadkach; wyzsze wartość, jeżel dla osoby najwyższym ukończonym pozomem wykształcena jest wykształcene wyższe, 0 w pozostałych przypadkach; angelsk wartość, jeżel osoba zna begle w mowe pśme język angelsk, 0 w pozostałych przypadkach; srednexang nterakcja mędzy zmenną sredne angelsk; wyzszexang nterakcja mędzy zmenną wyzsze angelsk; plec wartość dla kobet, 0 dla mężczyzn. Wszystke hpotezy testujemy na pozome stotnośc 0.05. Ponżej znajdują sę wynk oszacowanego modelu. Source SS df MS Number of obs = 085 -------------+------------------------------ F( 8, 076) =.8 Model 5346.40487 8 668.300609 Prob > F = 0.0000 Resdual 59033.7979 076 54.86444 R-squared = 0.0830 -------------+------------------------------ Adj R-squared = 0.076 Total 64380.08 084 59.3933 Root MSE = 7.407 bezroboce Coef. Std. Err. t P> t [95% Conf. Interval] wek.657934.6968 5. 0.000.403038.905543 wek_ -.007450.006-4.66 0.000 -.005895 -.004306 sredne -.54659.646765 -.5 0.0 -.7559 -.3400584 wyzsze -5.844.437908-3.56 0.000-7.939837 -.9699 angelsk -.57804.47005 -.04 0.97-7.448.6877 srednexang.67486.54764 0.85 0.394 -.885 7.5685 wyzszexang.969.98838 0.7 0.478-3.743963 7.983 plec.8898.45997 4.7 0.000.00096.778678 _cons.845.347 0.77 0.439 -.78369 6.405983. Proszę znterpretować wynk testu na łączną stotność regresj oraz R. Które ze zmennych są stotne? ( pkt). Jaka zależność mędzy wekem respondenta a długoścą trwana bezroboca wynka z modelu? Osoby w jakm weku przebywają najdłużej na bezrobocu? ( pkt) 3. Wyznaczyć efekt cząstkowy dla weku. Jaka jest oczekwana zmana długośc trwana bezroboca przy wzrośce weku o rok dla trzydzestoletnego respondenta? ( pkt) 4. Dokonać nterpretacj oszacowań parametrów (bez zmennej wek wek_). ( pkt) 5. Postanowono wprowadzć do analzowanej regresj zmenną edu, która oznacza lczbę lat pośwęconych na naukę. Jak problem wystąp w zmodyfkowanym modelu? ( pkt) 6. Nech zmenna edu_ przyjmuje wartość dla osób, które mają wykształcene średne lub wyższe. Jeżel tę zmenną wprowadzmy do modelu to jak problem wystąp (odpowedź proszę uzasadnć). ( pkt) 7. Istneje przypuszczene, że wpływ weku na czas przebywana na bezrobocu zależy od płc respondenta. Proszę podać postać modelu, który będze odpowadał temu założenu. ( pkt)
Rozwązane. Test na łączną stotność regresj: F =.8, p value = 0.000 < 0.05 odrzucamy hpotezę zerową o łącznej nestotnośc regresj. 8.3% zmennośc czasu przebywana na bezrobocu zostało wyjaśnonych za pomocą zmennych nezależnych. Istotne zmenne, to te dla których p-value jest mnejsze od przyjętego pozomu stotnośc wynoszącego 0.05. Czyl stotne zmenne to: wek ( t = 5., p value = 0.000 ) wek_ ( t = 4.66, p value = 0.000 ) sredne ( t =.5, p value = 0.0 ) wyższe ( t = 3.56, p value = 0.000 ) plec ( t = 4.7, p value = 0.000 ). Zależność mędzy długoścą trwana bezroboca a wekem jest kwadratowa: bezroboce = 0.007450wek + 0.657934 - parabola z ramonam skerowanym do dołu, czyl wraz ze wzrostem weku czas przebywana na bezrobocu rośne, ale coraz wolnej, b maksmum funkcj jest osągane dla osoby w weku 44 lat ( = 0.657934 ). Dla osób a ( 0.007450) 44.5 powyżej 44 lat zależność mędzy wekem a czasem przebywana na bezrobocu jest ujemna czas przebywana na bezrobocu maleje coraz szybcej wraz ze wzrostem weku. 3. Postać analzowanego modelu: bezroboce = β + β wek + β wek + β sredne + β wyzsze + β angelsk + β sredne ang + 0 3 4 5 6 β7wyzsze ang + β8 plec + ε Efekt cząstkowy dla weku: E ( bezroboce ) = β + βwek wek Oszacowane efektu cząstkowego na podstawe modelu dla osoby trzydzestoletnej wynos: b + b wek = 0.657934+ ( 0.007450) 30.- oczekwany wzrost długośc trwana bezroboca przy wzrośce weku o rok dla trzydzestoletnego respondenta wynos 0. mesąca. 4. Kobety w porównanu z mężczyznam mają o.89 mesąca dłuższy czas przebywana na bezrobocu. Wartość oczekwana: E bezroboce = β + β sredne + β wyzsze + β angelsk + β sredne ang + β wyzsze ang + reszta ( ) 0 3 4 5 gdze reszta oznacza część modelu zawerającą wek płeć. Wartość oczekwaną dla różnych kombnacj wykształcena znajomośc języka angelskego: E bezroboce = β + reszta - wykształcene podstawowe, ne zna języka angelskego; ( ) 0 ( ) β0 β3 reszta ( ) β0 β reszta ( ) β0 β β3 β4 ( ) β0 β reszta ( ) β0 β β3 β5 E bezroboce E bezroboce E bezroboce E bezroboce E bezroboce = + + - wykształcene podstawowe, zna język angelsk; = + + - wykształcene średne, ne zna języka angelskego; = + + + + reszta - wykształcene średne, zna język angelsk; = + + - wykształcene wyższe, ne zna języka angelskego; = + + + + reszta - wykształcene średne, zna język angelsk; Osoby z wykształcenem podstawowym, które znają język angelsk w porównanu z osobam z wykształcenem podstawowym neznającym języka angelskego o.58 mesąca krótszy czas przebywana na bezrobocu (parametr β 3). 3
Osoby z wykształcenem średnm, które ne znają języka angelskego w porównanu z osobam z wykształcenem podstawowym neznającym języka angelskego o.55 mesąca krótszy czas przebywana na bezrobocu (parametr β ). Osoby z wykształcenem średnm, które znają język angelsk w porównanu z osobam z wykształcenem średnm neznającym języka angelskego mają o 0.4 mesąca krótszy czas przebywana na bezrobocu ( β3 + β4 = -.57804+.67486 = -0.40556 ). Osoby z wykształcenem wyższym, które ne znają języka angelskego w porównanu z osobam z wykształcenem podstawowym neznającym języka angelskego mają o 5. mesąca krótszy czas przebywana na bezrobocu (parametr β ). Osoby z wykształcenem wyższym, które znają język angelsk w porównanu z osobam z wykształcenem wyższym neznającym języka angelskego mają o 0.46 mesąca krótszy czas przebywana na bezrobocu ( β3 + β5 = -.57804+.969 = -0.45843 ). 5. Zmenna edu oznaczająca wykształcene merzone za pomocą lczby lat nauk będze slne skorelowana ze zmennym zerojedynkowym dotyczącym pozomu osągnętego wykształcena, węc wystąp (najprawdopodobnej) problem współlnowośc. Zmenna edu ne wnos nc nowego, węc ne ma sensu wprowadzać jej do regresj. 6. Zmenna edu_ przyjmuje wartość dla osób, które mają wykształcene średne lub wyższe, węc będze dokładne współlnowa ze zmennym zerojedynkowym sredne wyzsze. Dla każdej obserwacj w próbe będze zachodzć: edu _ = sredne + wyzsze. Jeżel jedna z kolumn macerzy X jest kombnacją lnową pozostałych, to macerz X X ne ma pełnego rzędu kolumnowego, węc ne stneje macerz odwrotna do X X - ne można wyznaczyć estymatora MNK dla takego modelu. Należy usunąć jedną ze zmennych wywołujących problem dokładnej współlnowośc. 7. Należy wprowadzć do modelu nterakcję mędzy zmennym dotyczącym weku a zmenną płeć: bezroboce = β + β wek + β wek + β plec wek + β plec wek + β sredne + β wyzsze + 0 3 4 5 6 β angelsk + β sredne ang + β wyzsze ang + β plec + ε 7 8 9 0 Zadane 3. Mamy następujące regresje: (*) y na stałej, x, oraz x 3 * * (**) y na z, gdze y = y x, z = x + x Jaka zachodz relacja mędzy RSS w tych regresjach? (6 pkt) 3. Postanowono oszacować regresję wyjaśnającą lczbę zdobytych punktów na egzamne z analzy matematycznej za pomocą lczby punktów uzyskanych przez Studenta podczas egzamnu wstępnego na studa z matematyk. Jak będze prawdopodobny kerunek obcążena parametru przy zmennej oznaczającej lczbę punktów uzyskaną podczas egzamnu wstępnego z matematyk wynkły z pomnęca lorazu ntelgencj studenta? ( pkt) 3. Przyjmujemy następujące oznaczena: y dochód, wek wek wyrażony w latach, masto wartość, jeżel osoba meszka w meśce oraz 0 jeżel na ws. Analzujemy następującą regresję: y = β + β masto + β ( masto ) wek + β masto wek + ε 3 4 4
Jaka jest różnca w oczekwanej zmane dochodu przy wzrośce weku o jednostkę mędzy osobam meszkającym w meśce na ws? ( pkt) Rozwązane. Wprowadzamy następujące oznaczena: RSS * - suma kwadratów reszt dla modelu (*), RSS ** - suma kwadratów reszt dla modelu (**). Sumy kwadratów reszt są rozwązanem następującego problemu optymalzującego: * = mn n 3 3 b, b, b3 = ( ) RSS y b b x b x n * n n mn ( ) ( ( 3 )) ( 3 ) γ mn γ mn γ γ = = = RSS ** = y z = y x x + x = y ( + ) x x γ γ γ W przypadku regresj (**) mnmalzujemy tę samą funkcję co dla regresj (*), ale wprowadzamy następujące ogranczene: β = 0. β = β3 + Czyl RSS * to wartość mnmalzowanej funkcj dla problemu bez ogranczeń, natomast RSS ** to wartość mnmalzowanej funkcj dla problemu z ogranczenam, węc mus zachodzć RSS* RSS **.. Jeżel prawdzwy jest model natomast estymujemy model y = β + β x + β x + ε 0 y = β + β x + ε 0 to obcążene parametru przy zmennej x wyraża sę wzorem: sx E( b ) β = β ρx x s β > 0 dodatne obcążene (ntelgencja dodatno wpływa na wynk egzamnu z analzy ρx 0 x > matematycznej jest dodatno skorelowana z uzyskaną lczbą punktów na egzamne wstępnym). 3. Wartość oczekwana dochodu dla osób meszkających na ws: E ( y ) = E β + β masto + β3 ( masto ) wek + β4 masto wek + ε = β + β3wek 0 0 Parametr β 3 nterpretujemy jako oczekwaną zmanę dochodu przy wzrośce weku o jednostkę dla osób meszkających na ws. Wartość oczekwana dochodu dla osób meszkających w meśce: E ( y ) = E β + β masto + β3 ( masto ) wek + β4 masto wek + ε = β + β + β4wek 0 Parametr 4 β nterpretujemy jako oczekwaną zmanę dochodu przy wzrośce weku o jednostkę dla osób meszkających w meśce. x 5
Czyl różnca w oczekwanej zmane dochodu przy wzrośce weku o jednostkę mędzy osobam meszkającym w meśce a na ws wynos β β. 4 3 Zadane 4 Celem analzy jest wyznaczene determnantów czasu korzystana w cągu tygodna z nternetu. Ops zmennych: ln_nternet logarytm czasu korzystana w cągu tygodna z nternetu; sredne wartość, jeżel osoba ma wykształcene średne, 0 w pozostałych przypadkach; wyzsze wartość, jeżel osoba ma wykształcene wyższe, 0 w pozostałych przypadkach; plec wartość dla kobet oraz 0 dla mężczyzn; wek wek wyrażony w latach; srednexwek nterakcja mędzy zmenną sredne wek; wyzszexwek nterakcja mędzy zmenną wyzsze wek; ln_dochod logarytm mesęcznych zarobków. Source SS df MS Number of obs = 866 -------------+------------------------------ F( 7, 858) =.96 Model 96.5664934 7 3.79533 Prob > F = 0.0000 Resdual 989.844836 858.536653 R-squared = 0.0889 -------------+------------------------------ Adj R-squared = 0.085 Total 086.433 865.5596685 Root MSE =.074 ln_nternet Coef. Std. Err. t P> t [95% Conf. Interval] sredne.9886977.397787.5 0.0.7778.75967 wyzsze.9586863.384979.49 0.03.03075.7498 plec -.377483.074576-5.06 0.000 -.53855 -.3094 wek -.000743.0085047-0.0 0.984 -.068667.0658 srednexwek -.09046.0075 -.5 0.03 -.048685 -.009406 wyzszexwek -.0845.009845 -.87 0.06 -.0377748.000873 ln_dochod.3860075.07653 5.05 0.000.358364.536787 _cons -.55739.60653 -.9 0.055 -.33664.05448 RESET F(3, 855) = 0.55 [0.650] Breusch-Pagan ch() = 4. [0.0400] Jarque-Berra ch() = 3.6 [0.0000] Proszę odpowedzeć na następujące pytana (testy przeprowadzamy na pozome stotnośc 0,05):. Po co wprowadzono do regresj nterakcję mędzy zmennym dotyczącym wykształcena a zmenną wek? ( pkt). Proszę dokonać nterpretacj oszacowanych parametrów, nawet wtedy gdy zmenne są nestotne. ( pkt) 3. Proszę zaproponować sposób przetestowana hpotezy zakładającej, że wpływ weku na czas korzystana z nternetu jest tak sam u osób z wykształcenem średnm wyższym. Należy podać postać modelu z ogranczenam oraz statystykę, która posłuży do przeprowadzena testu. ( pkt) Rozwązane. Do regresj została wprowadzona nterakcja mędzy zmennym zerojedynkowym dotyczącym wykształcena a zmenną wek, gdyż spodzewano sę że wpływ weku na czas korzystana z nternetu zależy od osągnętego pozomu wykształcena.. Osoby z wykształcenem średnm korzystają z Internetu przecętne o 98.87% dłużej w porównanu z osobam o wykształcenu podstawowym. 6
Osoby z wykształcenem wyższym korzystają z Internetu przecętne o 95.87% dłużej w porównanu z osobam o wykształcenu podstawowym. Kobety w porównanu z mężczyznam korzystają z Internetu przecętne o 37.45% krócej. Wzrost dochodu o % przekłada sę średno na wzrost czasu korzystana z Internetu o 0.39%. Interpretując wpływ weku na czas korzystana z Internetu należy pamętać, że w modelu jest nterakcja. Wartość oczekwana zmennej zależnej: E(ln_ dochod ) = β0 + βwek + βsredne wek + β3wyzsze wek + reszta _ zmennych W rozbcu ze względu na pozom wykształcena: E(ln_ dochod ) = β0 + βwek + β sredne wek + β3 wyzsze wek + reszta _ zmennych 0 β _ 0 0 β + wek + reszta zmennych - wykształcene podstawowe E(ln_ dochod ) = β + β wek + β sredne wek + β wyzsze wek + reszta _ zmennych 0 0 3 0 β + ( β + β ) wek + reszta _ zmennych - wykształcene średne E(ln_ dochod ) = β0 + βwek + β sredne wek + β3 wyzsze wek + reszta _ zmennych = 0 β0 + ( β + β3) wek + reszta _ zmennych - wykształcene wyższe Wzrost weku o jeden rok u osób o wykształcenu podstawowym powoduje średno spadek czasu korzystana z Internetu o 0.0743% (parametr β ). Wzrost weku o jeden rok u osób o wykształcenu średnm powoduje średno spadek czasu korzystana z Internetu o.0789% (parametr β + β ). Wzrost weku o jeden rok u osób o wykształcenu wyższym powoduje średno spadek czasu korzystana z Internetu o.8655% (parametr β + β3 ). 3. Zgodne z poprzednm podpunktem, aby wpływ weku na czas korzystana z nternetu był tak sam u osób z wykształcenem średnm wyższym mus zachodzć β + β = β + β. 3 Zatem należy przetestować H 0 : β = β3. Postać modelu wyjścowego: ln_ dochod = β + β wek + β sredne wek + β wyzsze wek + β sredne + β wyzsze + 0 3 4 5 β6 plec + β7 ln_ dochod + ε Wprowadzamy ogranczene (postać modelu z ogranczenam): ln_ dochod = β + β wek + β sredne wek + β wyzsze wek + β sredne + β wyzsze + 0 4 5 β6 plec + β7 ln_ dochod + ε = β0 + βwek + β( sredne + wyzsze ) wek + β4sredne + β5wyzsze + β6 plec + β7 ln_ dochod + ε Zmenna X przyjmuje wartość dla osób o wykształcenu średnm lub wyższym oraz 0 dla osób o wykształcenu podstawowym. Hpotezę zerową testujemy za pomocą statystyk F ( porównane sumy kwadratów reszt dla modelu bez ogranczeń z ogranczenam): F = ( er er e e)/ g. e e/( N K ) e ReR - suma kwadratów reszt dla modelu z ogranczenam; e e - suma kwadratów reszt dla modelu bez ogranczeń; g lczba ogranczeń (w zadanu mamy jedno ogranczene); N lczba obserwacj; K lość szacowanych parametrów w modelu bez ogranczeń. X 7
Zad Na podstawe następujących danych: Y X 0 0 3 4 należy: a) oszacować parametry modelu yˆ = b + b x metodą najmnejszych kwadratów b) wyznaczyć reszty oraz ŷ c) polczyć ESS, TSS oraz RSS d) polczyć R R e) wyznaczyć Var( b ) f) przetestować hpotezę H0 : B = 0 Zad Na próbe lczącej 50 obserwacj oszacowano dwe regresję: y = α + α x, TSS = 00, α = I) ˆ 0 II) I) xˆ = b0 + b y, TSS = 00 Ile wynos b? Zad 3 Metodą Najmnejszych kwadratów szacujemy model z jedną zmenną objaśnającą stałą: y = α + Bx + ε, ε ~ N(0, σ I ) Proszę wyznaczyć cov( ˆ α, Bˆ ). (Wskazówka: Należy wyznaczyć macerz warancj kowarancj dla wektora oszacowanych parametrów, czyl: σ ( X X ) ). Zad 4 Metodą Najmnejszych Kwadratów oszacowano dwa modele: y = ˆ α + ˆ α x I) ˆ 0 II) y = b + b x * ˆ gdze 0 *. y = y x Udowodnj, że pomędzy oszacowanym parametram zachodzą następujące zależnośc: ˆ α 0 = b ˆ 0, α = b +. (Wskazówka: Należy skorzystać ze wzorów na estymatory MNK w cov( y, x) modelu ze stałą jedną zmenną objaśnającą, czyl: b = y b x, b =, oraz własnośc kowarancj). 0 var( x) Zad 5 Szacujemy Metodą Najmnejszych Kwadratów model ze stałą jedną zmenną objaśnającą, w którym spełnone są założena KMRL oraz zaburzene losowe ma rozkład normalny. Należy udowodnć, że kwadrat statystyk t służącej do testowana stotnośc zmennej objaśnającej jest równy statystyce F wykorzystywanej w teśce na łączną stotność równana regresj. Wskazówka: b cov( x, y) Wemy, że t = se( b ), gdze b = a se( b ) jest perwastkem z elementu stojącego w drugm var( x) werszu drugej kolumne macerzy s ( X X ). Należy pokazać, że 8
se( b ) = s = n n n x ( ) x = = n (cov( x, y)) n( n K) RSS. Następne trzeba wyznaczyć kwadrat ( n K) nvar( x) statystyk t: t = (można podstawć K = ). Statystyka służąca do testowana Var( x) RSS ESS /( K ) łącznej stotnośc równana regresj ma postać: F =. Podstawając K = RSS /( n K ) n przekształcając wzór otrzymujemy: F = ESS. Pozostaje węc pokazać, że RSS (cov( x, y)). n n bo w modelu jest stała ESS = n ( ˆ ˆ ) ( ˆ ), Var( x) ESS = y y = y y = = cov( x, y) podstawamy yˆ = b + b x = y + ( x x) (oczywśce należy to wyprowadzć!). var( x) Zad 6 Nech b będze wektorem parametrów uzyskanym w regresj y na X oraz c dowolnym wektorem (różnym od b) wymaru Kx. Udowodnj, że różnca w sume kwadratów reszt jest równa: ( y Xc) ( y Xc) ( y Xb) ( y Xb) = ( c b) X X ( c b) Pokaż, że ta różnca jest neujemna. Wskazówka: ( y Xb) ( y Xb) = y y y Xb + b X Xb W wyrażenu y Xb w mejsce y wstawamy Xb + e. Korzystając z faktu, że X ' e = 0 otrzymujemy: y Xb = b X Xb. Czyl: ( y Xb) ( y Xb) = y y b X Xb ( y Xc) ( y Xc) = y y y Xc + c X Xc W wyrażenu y Xb w mejsce y wstawamy Xb + e otrzymujemy: ( y Xc) ( y Xc) = y y b X Xc + c X Xc Różncę w sume kwadratów możemy zapsać jako: ( y Xc) ( y Xc) ( y Xb) ( y Xb) = c X Xc b X Xc + b X Xb Pozostaje pokazać, że ( c b) X X ( c b) = c X Xc b X Xc + b X Xb > 0 Zad 7 Oszacowano regresję, gdze zmenna zależna to dochod (mesęczne zarobk w złotówkach), a zmenne nezależne są następujące: wek (wek respondenta w latach), płeć ( mężczyzna, 0 kobeta), zmenne zero-jedynkowe dotyczące wykształcena podstawowe, średne, wyższe (przyjęto wykształcene podstawowe jako pozom referencyjny). Otrzymano następujące wynk: Source SS df MS Number of obs = 083 -------------+------------------------------ F(.,.) =. Model 69474590.4.. Prob > F =. Resdual 678006545.. R-squared =. -------------+------------------------------ Adj R-squared =. Total... Root MSE = 793.06 ----------------------------------------------- dochod Coef. Std. Err. t -------------+--------------------------------- wek 5.07945.. plec 336.588.. sredne 0.009.. wyzsze 70.353.. 9
_cons 85.4033.. Macerz warancj kowarancj wektora oszacowanych parametrów: wek plec sredne wyzsze _cons wek 5.89793 plec 7.3679 335.075 sredne 5.60377 7.699605 606.737 wyzsze 0.3453 80.4807 50.377 9904.358 _cons -50.898-55.86-665.489-563. 648.547 Proszę wykonać następujące polecena:. Uzupełnć brakujące mejsca.. Znterpretuj wartośc oszacowanych parametrów równana regresj. 3. Przeprowadź testy stotnośc dla poszczególnych zmennych oraz test na łączną stotnośc regresj. 4. Oceń dopasowane modelu (współczynnk determnacj lnowej). 5. Chcemy przetestować następującą hpotezę łączną: mężczyźn kobety zarabają tyle samo, osoby z wykształcenem wyższym zarabają o 300 zł węcej nż osoby z wykształcenem podstawowym, z każdym dodatkowym rokem dochód rośne o 0 zł. Zapsać hpotezę zerową za pomocą macerzy: HB = h oraz wyjaśnć jak można ją testować (podać postać modelu z ogranczenam). Przy testowanu hpotez proszę przyjąć pozom stotnośc 0.05. Do testowana hpotez mogą przydać sę następujące kwantyle: t 078,0.975 =.9667, t 079,0.975 =.9665, t =.96459, 588,0.975 0.95 F (4,079) =.38078. 0.95 F (3,078) =.63588, F 0.95 (4,078) =.380859, Zad 8 Na próbe lczącej 40 obserwacj oszacowano następujące modele: I) y = β + βx + β3x3 + β4x4 + ε, R = 0, 6, e e = 5 * * * * II) y = αx + α3x3 + ε, e e = 40, gdze: x = x + x, x = x + x * * * * III) y = γ + γ x + ε, e e = 8, gdze y = y x3, x = x x4 Proszę przetestować następujące hpotezy: β4 = β. H0 : β3 = β = 0. H0 : β = β3 + β4 H : β = β = β = 0 3. 0 3 4 3 3 4 Zad 9 Dysponujemy następującym zestawem zmennych: lnpłaca logarytm mesęcznych zarobków; wek wek w latach; pleć płeć respondenta ( mężczyzna, 0 kobeta); średne wartość jeden, jeśl osoba ma wykształcene średne, 0 w pozostałych przypadkach; wyższe wartość jeden, jeśl osoba ma wykształcene wyższe, w pozostałych przypadkach. Przeprowadzamy regresję, w której zmenną zależną jest logarytm mesęcznych zarobków, natomast zmenne nezależne to wszystke pozostałe. Dodatkowo wprowadzamy nterakcje: średnexwek wyższexwek. Ponżej wynk regresj: 0
Source SS df MS Number of obs = 083 -------------+------------------------------ F( 6, 076) =. Model 64.004798 6 0.70008 Prob > F = 0.0000 Resdual. 076.83995067 R-squared =. -------------+------------------------------ Adj R-squared =. Total 369.7797 08.347554 Root MSE =.539 ----------------------------------------------- lnplaca Coef. Std. Err. t -------------+--------------------------------- wek.0006888.004474 0.5 srednexwek.0037586.004849 0.78 wyzszexwek.00534.00656.6 sredne.3853.06593 0.55 wyzsze.853366.75546.04 plec.39506.035494 9.9 _cons 6.0783.9554 30.83 ----------------------------------------------- Proszę wykonać następujące polecena:. Uzupełnć brakujące mejsca.. Które ze zmenych są stotne na pozome stotnośc 0,05? 3. Proszę wyjaśnć dlaczego wprowadzono nterakcje mędzy zmenną wek a pozomem wykształcena do regresj. 4. Znterpretuj wartośc oszacowanych parametrów równana regresj (nawet w przypadku nestotnych zmennych). 5. Chcemy przetestować następującą hpotezę łączną: każdy dodatkowy rok ma tak sam wpływ na dochód, nezależne od osągnętego pozomu wykształcena; osoby z wykształcenem średnm oraz wyższym zarabają przecętne tyle samo oraz płeć ne wpływa na pozom dochodu. Zapsać hpotezę zerową za pomocą macerzy: HB = h oraz wyjaśnć jak można ją testować (podać postać modelu z ogranczenam). Przy testowanu hpotez proszę przyjąć pozom stotnośc 0.05. Do testowana hpotez mogą przydać sę następujące kwantyle: t 076,0.975 =.967, t 075,0.975 =.9673, F 0.95 (6,076) =.0699, F 0.95 (5,076) =.489, F 0.95 (5,077) =.4. Zad 0 Ops zmennych: ln_dochod logarytm zarobków rocznych (zmenna zależna); plec kobeta, 0 mężczyzna; małżeństwo, jeśl osoba w zwązku małżeńskm, 0 w pozostałych przypadkach; separacja, jeśl separacja, rozwód lub wdowec / wdowa, 0 w pozostałych przypadkach; plec_malz nterakcja mędzy zmenną płeć a małżeństwo; plec_separ nterakcja mędzy zmenną płeć a separacją; wek wek respondenta w latach. Pozom referencyjny w przypadku stanu cywlnego to stan wolny. Ponżej wynk estymacj modelu metodą najmnejszych kwadratów: Source SS df MS Number of obs = 595 -------------+------------------------------ F( 6, 588) = 08. Model 40.84469 6 68.364078 Prob > F = 0.0000 Resdual 004.09783 588.6330348 R-squared = 0.900 -------------+------------------------------ Adj R-squared = 0.873 Total 44.83 594.88753637 Root MSE =.7958 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval]
plec -.373567.088073 -.69 0.007 -.40084 -.0646049 malzenstwo.5494907.0757085 7.6 0.000.400996.6979898 separacja.453436.84 3.69 0.000.586.694386 plec_malz -.7945073.0053-7.90 0.000 -.996794 -.597335 plec_separ -.5079947.55393-3.7 0.00 -.879 -.03973 wek.0475.00659 6.5 0.000.003066.09954 _cons 9.4797.089668 05.7 0.000 9.3038 9.65558 Proszę odpowedzeć na ponższe pytana:. Wyjaśnć czemu wprowadzono do modelu nterakcje mędzy zmenną płeć a stanem cywlnym.. Dokonać nterpretacj parametrów. 3. Które ze zmennych są stotne na pozome 0,05? 4. Zaproponować sposób przetestowana następujących hpotez: - wpływ płc stanu cywlnego na dochód jest addytywny; - kobety mężczyźn w zwązku małżeńskm zarabają tyle samo; - prema za małżeństwo (przejśce ze stanu wolnego w zwązek małżeńsk) dla kobet mężczyzn jest taka sama. 5. W oparcu o ponżej wyestymowane modele przetestować hpotezy z podpunktu 4: Model x wartość - dla kobet ne będących w zwązku małżeńskm oraz 0 w pozostałych przypadkach. Source SS df MS Number of obs = 595 -------------+------------------------------ F( 5, 589) = 3.03 Model 9.4877 5 5.8975443 Prob > F = 0.0000 Resdual 84.79458 589.80855548 R-squared = 0.096 -------------+------------------------------ Adj R-squared = 0.0887 Total 44.83 594.88753637 Root MSE =.899 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval] malzenstwo -.0005994.0803607-0.0 0.994 -.5835.57047 separacja.35757.38775.54 0.0.0805553.649587 x.650.099598.7 0.03.0363.48573 plec_separ -.59556.75774-3.0 0.003 -.87438 -.848893 wek.0069.005454 7.95 0.000.05343.0595 _cons 9.30783.009776 9.8 0.000 9.09767 9.505894 Model z 0 dla mężczyzn, dla kobet ne będących w zwązku małżeńskm, dla kobet w zwązku małżeńskm. Source SS df MS Number of obs = 595 -------------+------------------------------ F( 5, 589) = 7. Model 404.94684 5 80.8589367 Prob > F = 0.0000 Resdual 009.9876 589.635609 R-squared = 0.859 -------------+------------------------------ Adj R-squared = 0.836 Total 44.83 594.88753637 Root MSE =.7975 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval] malzenstwo.4345768.0658536 6.60 0.000.3054077.5637458 separacja.356034.8906.99 0.003.8045.589634 z -.496304.03689-0.95 0.000 -.547693 -.4498386 plec_separ -.487986.30473 -.9 0.057 -.504759.00788 wek.04638.0074 6.44 0.000.00685.09079 _cons 9.58343.083949 5.9 0.000 9.404 9.746606 Model 3
Source SS df MS Number of obs = 595 -------------+------------------------------ F( 4, 590) = 4.0 Model 370.3485 4 9.585466 Prob > F = 0.0000 Resdual 043.94045 590.65656638 R-squared = 0.69 -------------+------------------------------ Adj R-squared = 0.600 Total 44.83 594.88753637 Root MSE =.809 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval] plec -.8350898.043974-0.7 0.000 -.9689 -.7538905 malzenstwo.6706.0650395 3.48 0.00.0986984.353847 separacja.73385.09086 3.0 0.003.095336.455366 wek.05073.00307 6.55 0.000.005565.095898 _cons 9.70066.0858609.98 0.000 9.53854 9.868679 Model 4 Source SS df MS Number of obs = 595 -------------+------------------------------ F( 5, 589) =.88 Model 370.68509 5 74.37049 Prob > F = 0.0000 Resdual 043.59709 589.65676348 R-squared = 0.6 -------------+------------------------------ Adj R-squared = 0.598 Total 44.83 594.88753637 Root MSE =.804 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval] plec -.84565.043798-9.33 0.000 -.93039 -.7594907 malzenstwo.9006.065595 3.5 0.000.003.356883 separacja.587.3398.77 0.076 -.0784.4537 plec_separ.09950.376389 0.7 0.470 -.70458.369493 wek.0495.00309 6.48 0.000.0049.09484 _cons 9.707893.08659. 0.000 9.53889 9.877597 Przy testowanu hpotez proszę przyjąć pozom stotnośc 0.05. Do testowana hpotez mogą przydać sę następujące kwantyle: F (,588) = 3.847376; F (,588) = 3.00387; F (3,588) =.60504 0.95 0.95 0.95 Zad Ops zmennych: ln_dochod logarytm zarobków rocznych (zmenna zależna); plec kobeta, 0 mężczyzna; wek wek w latach; wek_ wek podnesony do kwadratu. Ponżej wynk estymacj modelu metodą najmnejszych kwadratów: Source SS df MS Number of obs = 595 -------------+------------------------------ F( 3, 59) = 303.00 Model 54.8436 3 7.409479 Prob > F = 0.0000 Resdual 900.05386 59.5657585 R-squared = 0.3636 -------------+------------------------------ Adj R-squared = 0.364 Total 44.83 594.88753637 Root MSE =.754 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval] plec -.848345.037957 -.37 0.000 -.974 -.773935 wek.687537.009773 8.39 0.000.50759.867546 wek_ -.007685.000077-6.4 0.000 -.009798 -.00557 _cons 6.79847.894588 35.85 0.000 6.43 7.6446. Oceń dopasowane modelu (współczynnk determnacj lnowej, test na łączną stotność równana regresj). 3
. Znterpretuj oszacowane parametru przy zmennej płeć. W śwetle uzyskanych wynków jak wygląda zależność dochodu od weku (kedy dochód rośne a kedy maleje). 3. Proszę omówć w jak sposób można przetestować hpotezę, ż najwększe zarobk są uzyskwane przez osoby w weku 48 lat (zapsać hpotezę zerową, podać postać modelu z ogranczenam). 4. Przetestować hpotezę z podpunktu 3 na pozome stotnośc 0,05. Potrzebny będze jeden z ponższych model: Model x = wek _ 96* wek Source SS df MS Number of obs = 595 -------------+------------------------------ F(, 59) = 454.59 Model 54.09349 57.04674 Prob > F = 0.0000 Resdual 900.89948 59.565445947 R-squared = 0.3635 -------------+------------------------------ Adj R-squared = 0.367 Total 44.83 594.88753637 Root MSE =.7596 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval] plec -.847704.0378557 -.38 0.000 -.957 -.77308 x -.007353.0000837-0.7 0.000 -.008995 -.0057 _cons 6.8858.8937 37.4 0.000 6.460893 7.7563 Model x = 96* wek _ wek Source SS df MS Number of obs = 595 -------------+------------------------------ F(, 59) = 35.55 Model 3.9445 6.47076 Prob > F = 0.0000 Resdual 09.34084 59.68555606 R-squared = 0.83 -------------+------------------------------ Adj R-squared = 0.74 Total 44.83 594.88753637 Root MSE =.8796 ln_dochod Coef. Std. Err. t P> t [95% Conf. Interval] plec -.850885.04703-9.55 0.000 -.8968836 -.733933 x.89e-06.8e-07 8.68 0.000.46e-06.3e-06 _cons 0.5963.0536086 89.5 0.000 0.05448 0.6478 Przy testowanu hpotez proszę przyjąć pozom stotnośc 0.05. Do testowana hpotez mogą przydać sę następujące kwantyle: F (,59) = 3,00380; F (,59) = 3,847303; F (,59) = 3,003765; F 0.95 0.95 0.95 0.95 (,59) = 3,8473066 Zad Ops zmennych: dochod zarobk roczne w złotówkach (zmenna zależna); wek wek w latach; stan_zdrowa = słaby, = dobry, 3 = bardzo dobry. Wynk estymacj modelu metodą najmnejszych kwadratów ponżej:.stan_zdrowa _Istan_zdro_-3 (naturally coded; _Istan_zdro_ omtted) Source SS df MS Number of obs = 595 -------------+------------------------------ F( 3, 59) = 38.54 Model 8.5405e+0 3.8468e+0 Prob > F = 0.0000 Resdual.753e+ 59 73870548 R-squared = 0.0677 -------------+------------------------------ Adj R-squared = 0.0660 Total.607e+ 594 790894405 Root MSE = 779 4
dochod Coef. Std. Err. t P> t [95% Conf. Interval] wek 655.577 60.99844 0.75 0.000 535.879 775.635 _Istan_zdr~ 473.533 30.506 0.64 0.5-304.73 5989.798 _Istan_zdr~3 4906.89 90.03.4 0.03 45.5 9398.67 _cons 4380.507 3643.78.0 0.9-766.486 57.5 Oszacowane macerzy warancj-kowarancj b: wek _Istan_zdro Istan_zdro_3 _cons wek 370.8 _Istan_zdro_ 755.969 530533.7 _Istan_zdro_3 998.497 44780.5 54405.6 _cons -8497.54-4455379.6-556907 37668. Dokonaj nterpretacj parametrów.. Następne postanowono przetestować hpotezę, ż osoby, które zadeklarowały dobry bardzo dobry stan zdrowa, zarabają tyle samo. W tym celu postanowono oszacować ponowne model, ale dla zmennej oznaczającej stan zdrowa zastosowano efekty progowe. Ops nowych zmennych: dobry, jeżel osoba zadeklarowała przynajmnej dobry stan zdrowa, 0 w pozostałych przypadkach; b_dobry, jeżel osoba zadeklarowała bardzo dobry stan zdrowa, 0 w pozostałych przypadkach. Wynk estymacj ponżej: ------------------------------------------------ dochod Coef. Std. Err. t -------------+---------------------------------- wek 655.577 60.99844 0.75 dobry 473.533 30.506 0.64 b_dobry... _cons 4380.507 3643.78.0 ----------------------------------------------- Nestety zgubono wynk oszacowań dla zmennej b_dobry. Na podstawe oszacowań modelu, w którym zastosowano standardowe rozkodowane na zmenne zero-jedynkowe stanu zdrowa oraz zadana.0 ze zboru zadań (należy podać postać macerzy A A o których mowa w zadanu.0), należy wyznaczyć oszacowane parametru przy zmennej b_dobry, błąd standardowy oraz statystykę t. Czy rzeczywśce można przyjąć, że osoby, które zadeklarowały dobry bardzo dobry stan zdrowa zarabają tyle samo? Zad 3 Dysponujemy próbą dla Stanów Zjednoczonych z roku 988 dotyczącą kobet: ln_wage logarytm zarobków; ttl_exp całkowte dośwadczene zawodowe wyrażone w latach; unon czy osoba należy do zwązków zawodowych, tak, 0 ne; ln_age logarytm weku; race rasa, bały, czarny, 3 w pozostałych przypadkach. Ponżej znajdują sę oszacowana regresj, w której zmenną zależną jest ln_wage, natomast zmenne nezależne to ttl_exp, unon, ln_age, race. Ponadto w regresj uwzględnono nterakcje mędzy zmenną oznaczającą przynależność do zwązków zawodowych a dośwadczenem zawodowym. Pozom bazaowy dla zmennej race to rasa bała. Source SS df MS Number of obs = 880 -------------+------------------------------ F( 6, 873) = 97.9 Model.997897. 0.4996495 Prob > F = 0.0000 Resdual...0758 R-squared =. -------------+------------------------------ Adj R-squared = 0.35 Total 57.6673 879.7550497 Root MSE =.45904 ------------------------------------------------ ln_wage Coef. Std. Err. t --------------+-------------------------------- unon.3808039.074998 5.08 ttl_exp.0509.006579 9.7 5
unonxttl_exp -.068.0053937 -.7 ln_age -.449506.38556-3.4 _Irace_ -.0968.0449. _Irace_3.05847.094669 0.3 _cons.88445.506055 5.70 -----------------------------------------------. Uzupełnj brakujące mejsca.. Dlaczego wprowadzono do modelu nterakcje mędzy zmenną unon a ttl_exp? 3. Które ze zmennych są stotne? (odpowedź należy uzasadnć) 4. Dokonaj nterpretacj parametrów. 5. Przetestuj hpotezę o tym, że wpływ na dochód wzrostu dośwadczena o rok u kobet należących do zwązków zawodowych jest o % wększy nż u kobet nenależących do zwązków zawodowych. 6. Chcemy przetestować hpotezę, że kobety rasy nnej nż bała zarabają tyle samo oraz wzrost weku o % powoduje spadek dochodu o 0,5%. Zapsać hpotezę zerową za pomocą macerzy: HB = h oraz wyjaśnć jak można ją testować (podać postać modelu z ogranczenam). Przy testowanu hpotez proszę przyjąć pozom stotnośc 0.05. Do testowana hpotez mogą przydać sę następujące kwantyle: t 873,0.95 =.6456676, t 873,0.975 =.9634, t 87,0.95 =.645668, t 87,0.975 =.963, Source SS df MS Number of obs = 880 -------------+------------------------------ F( 6, 873) = 97.9 Model.997897 6 0.4996495 Prob > F = 0.0000 Resdual 394.66945 873.0758 R-squared = 0.376 -------------+------------------------------ Adj R-squared = 0.35 Total 57.6673 879.7550497 Root MSE =.45904 ln_wage Coef. Std. Err. t P> t [95% Conf. Interval] _Iunon_.3808039.074998 5.08 0.000.33849.577586 ttl_exp.0509.006579 9.7 0.000.0459963.0564 _IunXttl_~ -.068.0053937 -.7 0.03 -.08464 -.006899 ln_age -.449506.38556-3.4 0.00 -.7467 -.777658 _Irace_ -.0968.0449-8.37 0.000 -.49305 -.5465 _Irace_3.05847.094669 0.3 0.80 -.6398.07503 _cons.88445.506055 5.70 0.000.89555 3.876735 Zad 4 Dla modelu (*) y = X β + ε, stworzylśmy macerz X* = XA, gdze A jest pewną macerzą neosoblwą, oraz wektor y* = cy, gdze c R c 0. Następne defnujemy model (**) y* = X * β * + η.. Ile wynos estymator MNK dla regresj (**)? Estymator b * należy przedstawć jako funkcję estymatora b.. Wyznaczyć Var( b *). 3. Wyznaczyć wektor reszt dla regresj (**) jako funkcję wektora reszt dla regresj (*). Pokazać, że R w obu regresjach jest take samo. 6
Zad 5 a) Mamy następujący model ze stałą jedną zmenną objaśnającą: y = β + β x + ε gdze E( ε ) = 0 Var( ε ) = σ I, Wyznaczyć cov( b, b ), gdze b b są estymatoram parametrów uzyskanym Metodą Najmnejszych Kwadratów. b) Oszacowano regresję y β x ε, x = x x uzyskano estymator b. Utworzono nowe zmenne: = + gdze [ k ] * * y = cy oraz [ ] a 0 c 0. Oszacowano regresję muszą spełnać stałe a c aby b = ˆ γ? y x ax ax ax gdze a, c R oraz = k =, = γ x + ε uzyskano estymator ˆ. γ Jak warunek * * 7