Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie!
|
|
- Danuta Sobczak
- 8 lat temu
- Przeglądów:
Transkrypt
1 Uniwersytet Warszawski Wydział Nauk Ekonomicznych Mateusz Błażej Nr albumu: Chcesz zwiększyć swój dochód? Przenieś się i pracuj w Urzędzie! Model ekonometryczny na kierunku: Informatyka i Ekonometria Praca wykonana pod kierunkiem mgr Anety Dzik z Katedry Statystyki i Ekonometrii WNE UW Warszawa, styczeń
2 SPIS TREŚCI WSTĘP 3 1. FUNDAMENTY TEORETYCZNE I PRZEGLĄD LITERATURY HIPOTEZY BADAWCZE 5 3. OPIS BAZY DANYCH I DEFINICJE ZMIENNYCH.5 4. FORMA FUNKCYJNA MODELU WYNIKI REGRESJI.9 6. INTERPRETACJA DIAGNOSTYKA 7.1. Poprawność formy funkcyjnej Normalność zaburzenia losowego Homoskedastyczność NIETYPOWE OBSERWACJE WSPÓŁLINIOWOŚĆ PODSUMOWANIE BIBLIOGRAFIA ZAŁĄCZNIKI Statystyki opisowe zmiennych Analiza zmiennych dyskretnych Praca nad formą modelu regresji Obliczenia dotyczące wpływu stażu na dochód
3 WSTĘP Celem mojej pracy było zdefiniowanie głównych czynników wpływających na potencjalny dochód. Nie jest łatwe precyzyjne wskazanie wszystkich zmiennych determinujących jego wielkość. Niewątpliwie, oprócz niżej opisanych, istotny udział ma branża, w której dana osoba jest zatrudniona. Istnieje wiele publikacji naukowych opisujących jego główne determinanty, skupiające się głównie na płci, stanie cywilnym, wykształceniu i wieku. Oprócz tych zmiennych, postanowiłem uwzględnić staż, rodzaj firmy oraz województwo, w którym dana osoba jest zatrudniona. Świadomość występujących zależności może być przydatna dla osób chcących polepszyć swoją sytuację materialną, gdyż na część zmiennych ma się bezpośredni wpływ. Można pominąć śladowe przypadki zmiany płci, zmianę stanu cywilnego uwarunkowaną chęcią zwiększenia zarobków, a także niemożliwą ingerencję w wiek, jednakże na poziom wykształcenia, wybór firmy i województwo pracy ma się bezpośredni wpływ. 1. FUNDAMENTY TEORETYCZNE I PRZEGLĄD LITERATURY Niniejsza praca opiera się głównie na publikacjach zagranicznych, m.in. dotyczącej Libanu. Beyrouti (2009) zajął się problemem nierówności dochodów wśród absolwentów wyższych uczelni. Próbował on udowodnić, że poziom wykształcenia, jak i poziom doświadczenia są ważnymi czynnikami prowadzącymi do powstawania różnic w dochodach. Zbadał on istotne determinanty przy użyciu analizy regresji wielokrotnej programem Statistical Package for the Social Sciences 9.0. Zmienną objaśnianą był dochód, a zmiennymi objaśniającymi poziom doświadczenia (w ujęciu rocznym) oraz zmienne binarne wskazujące na uczelnie, do której osoby badane uczęszczały. Udało się udowodnić dodatnią zależność między wysokością dochodów, a poziomem edukacji i doświadczeniem. Jednocześnie zauważył on dużą różnicę pomiędzy wynagrodzeniami osób po uczelniach amerykańskich, aniżeli uczelniach libańskich. Dodatkowo, w większości poziomów wykształcenia, wzrost dochodu wraz ze zwiększaniem poziomu wykształcenia jest bardziej zauważalny u mężczyzn, aniżeli u kobiet. Lazear (1997) zasugerował, że ludzie uczą się do momentu, w którym poziom ich edukacji zapewni dochód maksymalizujący ich użyteczność. Bartlett (1978) zauważa spadek znaczenia edukacji. W 1939 roku, rok dodatkowej edukacji powodował wzrost dochodów o 9.4%, podczas gdy w 1969 roku jedynie o 6.5%. 3
4 Analizy przeprowadzone w ogólnodostępnych badaniach potwierdzają przypuszczenia wyższych zarobków mężczyzn niż kobiet, a także niższych wynagrodzeń osób wolnych. Wyjaśnieniem tych zależności zajęli się Landau i Arthur (1992). Przeprowadzili oni hierarchiczną analizę regresji na 1537 osobach w różnym wieku pracujących na kierowniczych i profesjonalnych stanowiskach w Stanach Zjednoczonych. Zmienna objaśniana - wynagrodzenie (podzielona na 6 przedziałów) - wyjaśniona została m.in. za pomocą płci, wieku, poziomu wykształcenia, lokalizacji pracy, stanu cywilnego, a także zmiennych binarnych: czy osoba miała kiedykolwiek urlop macierzyński dłuższy niż 3 miesiące, czy małżonek był zatrudniony oraz czy w domu były dzieci poniżej 18 roku życia. Otrzymano następujące rezultaty. Pensja była dodatnio skorelowana z posiadaniem współmałżonka, który nie pracuje i nie ma dzieci poniżej 18 roku życia. Dodatkowo kobiety oraz osoby, które zawsze były wolne, zarabiały mniej. Co więcej pracownicy będący w związku małżeńskim, mający współmałżonków nieprowadzących kariery zawodowej, zarobili więcej niż pracownicy, których współmałżonkowie ją prowadzili, ale nie zarabiali więcej niż osoby rozwiedzione. Pracownicy, którzy nigdy nie byli w związku małżeńskim, zarabiali mniej niż osoby, które się rozwiodły, a także niż osoby, które były w związku małżeńskim, niezależnie od tego, czy ich współmałżonkowie prowadzili karierę zawodową. W tym przypadku posiadanie dzieci poniżej 18 roku życia nie miało wpływu na wysokość wynagrodzenia. Zależności były te same dla mężczyzn i kobiet, jednakże mężczyźni posiadający dzieci zarabiali więcej, niż bezdzietni - u kobiet już ta zależność nie wystąpiła. Wynagrodzenie osób, które były na urlopie macierzyńskim dłuższym niż 3 miesiące, nie zmieniło się istotnie. Może to być uwarunkowane małą próbą (jedynie 12% kobiet). Wpływu wieku nie można intuicyjnie określić, z powodu możliwej korelacji ze stażem pracy, i tak młodszy wiek pracownika powiązany z brakiem doświadczenia nie musi oznaczać wyższych zarobków. Łatwiej jest opisać wpływ regionu, w którym się mieszka, na poziom dochodów. Według statystyk Głównego Urzędu Statystycznego najwyższe średnie zarobki w 2009 roku odnotowano w województwie mazowieckim, a następnie podobne w województwach pomorskim, dolnośląskim i wielkopolskim. Andrzej Sadowski z Centrum im. Adama Smitha jako przyczynę wskazuje atrakcyjność dużych miast, które z jednej strony są idealne na centralę firmy, a z drugiej przyciągają zagraniczne spółki, które otwierają w dużych ośrodkach miejskich swoje filie
5 Rzadziej analizowany jest wpływ rodzaju firmy na wysokość zarobków. Większość naukowych stwierdzeń dotyczących tej kwestii ukrytych jest w pracach poruszających inne tematy. Barro (1973) zauważa, że zarobki w urzędach nie dostosowują się do poziomu obecnego na rynku, w związku z czym występuje istotna nadwyżka w zarobkach osób pracujących w instytucjach publicznych. Często występująca różnica nie musi pochodzić z wielkości pensji, ale także z przyznawanych dodatków, premii lub atrakcyjnych warunków wyjazdów wypoczynkowych. Jacek Czaputowicz, Dyrektor Krajowej Szkoły Administracji Publicznej, zauważa, że zarobki w administracji publicznej są o 23% wyższe niż w sektorze prywatnym. Zauważa, że praca urzędnika jest w pewnym stopniu służbą wymagającą dużej empatii 2. Odmienne dane dostarcza PKPP Lewiatan i GUS, według których zarobki w sektorze publicznym są wyższe kolejno o 10% i 13%. 3 Wartości te zmieniają się w czasie, jednak stale budżetówka płaci więcej. 2. HIPOTEZY BADAWCZE Zgodnie z przeglądem literatury, która dokonana została w poprzednim punkcie, można się spodziewać, że w poniższym modelu wpływ poszczególnych zmiennych na dochód będzie następujący. Województwa mazowieckie, pomorskie, dolnośląskie i wielkopolskie wykażą wyższy dochód od pozostałych województw. Mężczyźni będą zarabiali więcej od kobiet. Osoby wolne będą zarabiały mniej od osób w innym stanie cywilnym. Ludzie z wykształceniem wyższym będą wykazywały większy dochód. Pracownicy firm publicznych będą zarabiali więcej. Wpływ wieku ze względu na korelację ze stażem jest trudny do przewidzenia. 3. OPIS BAZY DANYCH I DEFINICJE ZMIENNYCH Model został opracowany na podstawie bazy danych pobranej ze strony:
6 Jest to Badanie Ekonomicznej Aktywności Ludności z 4. kwartału 2009 roku. Prowadzone jest ono przez Główny Urząd Statystyczny co kwartał, przy czym przy każdym nowym badaniu wymieniana jest ¼ próby. Badanie dotyczy osób w wieku 15 lat i starszych. Pobrana baza zawiera 3400 obserwacji, jednak po wstępnej selekcji zostało 396 obserwacji. Dobór polegał na usunięciu obserwacji, dla których nie były podane dane dotyczące wymaganych zmiennych, a także z niepoprawną wartością (symboliczne oznaczenie dochodu 99999, a także w jednym przypadku wartość województwa 0 ). 8 zmiennych zostało wykorzystanych. Są to: - województwo, - płeć, - stan cywilny, - wykształcenie, - rodzaj instytucji, - dochód, - staż, - wiek. Zmienna objaśniana: - dochód osoby badanej (zł, w skali miesiąca). Jest to zmienna ciągła, przyjmująca wartości z przedziału <150,5000> y=dochod. Po przeprowadzeniu przekształcenia Boxa-Coxa, zmienną zależną został logarytm dochodu y=ln(dochod)=lndochod. Zmienne objaśniające: - województwo zamieszkania osoby badanej x1=wojewodztwo. Jest to zmienna dyskretna przyjmująca jedną z szesnastu wartości: 6
7 SYMBOL WOJEWÓDZTWA NAZWA 2 Dolnośląskie 4 Kujawsko-Pomorskie 6 Lubelskie 8 Lubuskie 10 Łódzkie 12 Małopolskie 14 Mazowieckie 16 Opolskie 18 Podkarpackie 20 Podlaskie 22 -> 0 Pomorskie 24 Śląskie 26 Świętokrzyskie 28 Warmińsko-Mazurskie 30 Wielkopolskie 32 Zachodniopomorskie W modelu została ona rozkodowana i.wojewodztwo. Po wstępnej analizie województwo pomorskie (o największym średnim dochodzie) przyjęło wartość 0, aby stać się wartością bazową. wartości: - płeć osoby badanej x2=plec. Jest to zmienna dyskretna, przyjmująca jedną z dwóch 1 płeć męska, 2 płeć żeńska. W modelu została ona rozkodowana i.plec. - stan cywilny osoby badanej x3=stancywilny. Jest to zmienna dyskretna przyjmująca jedną z czterech wartości: 1 kawaler, panna, 2 żonaty, zamężna, 3 wdowiec, wdowa, 4 rozwiedziony, rozwiedziona. W modelu została ona rozkodowana i.stancywilny. - wykształcenie osoby badanej x4=wyksztalcenie. Jest to zmienna dyskretna przyjmująca jedną z siedmiu wartości: 1 wyższe. 2 policealne, 3 średnie, 4 zasadnicze zawodowe, 7
8 5 gimnazjalne, 6 podstawowe, 7 niepełne podstawowe. W modelu została ona rozkodowana i.wyksztalcenie. - rodzaj instytucji, która jest głównym miejscem pracy osoby badanej x5=rodzaj. Jest to zmienna dyskretna przyjmująca jedną z dwóch wartości: 1 publiczna, 2 prywatna. W modelu została ona rozkodowana i.rodzaj. - staż osoby badanej x5=staz. Jednostką jest ilość lat. Jest to zmienna ciągła, przyjmująca wartości z przedziału <0,64>. W modelu wprowadzono dodatkową zmienną objaśniającą x6=staz 2. - wiek osoby badanej x7=wiek. Jednostką jest ilość lat. Jest to zmienna ciągła, przyjmująca wartości z przedziału <17,80>. Z powodu współliniowości ze zmienną staż została w modelu pominięta (dokładne informacje w załączniku). 4. FORMA FUNKCYJNA MODELU Ostatecznie do modelu użyto logarytmu naturalnego dochodu. Poniżej przedstawiono formalny tekst Boxa-Coxa. Dokładne wyniki dostępne są w załączniku. i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.stancywilny _Istancywil_1-4 (naturally coded; _Istancywil_1 omitted) i.wyksztalcenie _Iwyksztalc_1-7 (naturally coded; _Iwyksztalc_1 omitted) i.rodzaj _Irodzaj_1-2 (naturally coded; _Irodzaj_1 omitted) Number of obs = 396 LR chi2(28) = Log likelihood = Prob > chi2 = dochod Coef. Std. Err. z P> z [95% Conf. Interval] /theta
9 Test Restricted LR statistic P-value H0: log likelihood chi2 Prob > chi theta = theta = theta = Na poziomie istotności 5% brak podstaw do odrzucenia hipotezy zerowej o poprawnej formie funkcyjnej, wartość statystyki testowej 2.82, jednocześnie najniższa spośród pozostałych, dlatego końcowy model będzie ze zlogarytmowaną zmienną dochód. 5. WYNIKI REGRESJI Wartości określające poziom zmiennych objaśniających nie zostały celowo zmienione, aby były zgodne z użytymi w badaniu. Ostateczna regresja wygląda następująco: xi: reg lndochod i.wojewodztwo i.plec i.stancywilny i.wyksztalcenie i.rodzaj staz stazz i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.stancywilny _Istancywil_1-4 (naturally coded; _Istancywil_1 omitted) i.wyksztalcenie _Iwyksztalc_1-7 (naturally coded; _Iwyksztalc_1 omitted) i.rodzaj _Irodzaj_1-2 (naturally coded; _Irodzaj_1 omitted) Source SS df MS Number of obs = F( 28, 367) = 7.07 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lndochod Coef. Std. Err. t P> t [95% Conf. Interval] _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_
10 _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iplec_ _Istancywil_ _Istancywil_ _Istancywil_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Irodzaj_ staz stazz _cons Regresji nie przeprowadzono na zmiennej wiek, ponieważ okazała się współliniowa ze zmienną staż. Dodatkowe informacje oraz prace nad zmiennymi znajdują się w dalszej części dokumentu. Na podstawie testu F, gdzie wartość statystyki testowej wynosi 7.07, p-value równa się , na dowolnie przyjętym poziomie istotności odrzucono hipotezę zerową o łącznej nieistotności wszystkich zmiennych. Po zastosowaniu macierzy wariancji-kowariancji White, nieistotne okazały się zmienne wojewodzt_8, wojewodzt_12, wojewodzt_16, stancywil_3, wyksztalc_6 oraz rodzaj_2, które oznaczają kolejno: osoba pochodzi z województwa lubuskiego, osoba pochodzi z województwa małopolskiego, osoba pochodzi z województwa opolskiego, osoba jest wdową lub wdowcem, osoba ma wykształcenie podstawowe oraz osoba pracuje w instytucji prywatnej. Warto zauważyć, że trzy ostatnie zmienne byłyby istotne już na poziomie istotności wynoszącym 6%. Dodatkowe informacje w dalszej części dokumentu. W 35.03% wyjaśniona została zmienność zmiennej objaśnianej, a model dopasowany jest do danych w 30.07%. 6. INTERPRETACJA 10
11 ln(dochod)=β0 + β1wojewodzt_2 + β2wojewodzt_4 + β3wojewodzt_6 + β4wojewodzt_8 + β5wojewodzt_10 + β6wojewodzt_12 + β7wojewodzt_14 + β8wojewodzt_16 + β9wojewodzt_18 + β10wojewodzt_20 + β11wojewodzt_24 + β12wojewodzt_26 + β13wojewodzt_28 + β14wojewodzt_30 + β15wojewodzt_32 + β16plec_2 + β17stancywil_2 + β18stancywil_3 + β19stancywil_4 + β20wyksztalc_2 + β21ksztalc_3 + β22wyksztalc_4 + β23wyksztalc_5 + β24wyksztalc_6 + β25wyksztalc_7 + β26rodzaj_2 + β27staz + β28stazz β1 = : osoba z województwa dolnośląskiego zarabia mniej o 32.16% niż osoba z województwa pomorskiego, β2 = : osoba z województwa kujawsko-pomorskiego zarabia mniej o 34.01% niż osoba z województwa pomorskiego, β3 = : osoba z województwa lubelskiego zarabia mniej o 24.73% niż osoba z województwa pomorskiego, β4 = : osoba z województwa lubuskiego zarabia mniej o 12.36% niż osoba z województwa pomorskiego. Zmienna jest nieistotna, β5 = : osoba z województwa łódzkiego zarabia mniej o 32.83% niż osoba z województwa pomorskiego, β6 = : osoba z województwa małopolskiego zarabia mniej o 9.06% niż osoba z województwa pomorskiego. Zmienna jest nieistotna, β7 = : osoba z województwa mazowieckiego zarabia mniej o 25.47% niż osoba z województwa pomorskiego, β8 = : osoba z województwa opolskiego zarabia mniej o 18.72% niż osoba z województwa pomorskiego. Zmienna jest nieistotna, β9 = : osoba z województwa podkarpackiego zarabia mniej o 32.45% niż osoba z województwa pomorskiego, β10 = : osoba z województwa podlaskiego zarabia mniej o 31.68% niż osoba z województwa pomorskiego, β11 = : osoba z województwa śląskiego zarabia mniej o 28.81% niż osoba z województwa pomorskiego, β12 = : osoba z województwa świętokrzyskiego zarabia mniej o 45.13% niż osoba z województwa pomorskiego, β13 = : osoba z województwa warmińsko-mazurskiego zarabia mniej o 28.99% niż osoba z województwa pomorskiego, 11
12 β14 = : osoba z województwa wielkopolskiego zarabia mniej o 28.45% niż osoba z województwa pomorskiego, β15 = : osoba z województwa zachodniopomorskiego zarabia mniej o 30.22% niż osoba z województwa pomorskiego, β16 = : kobieta zarabia o 31.43% mniej od mężczyzny, β17 = : żonaty mężczyzna lub zamężna kobieta zarabiają o 10.77% więcej od osoby wolnej, β18 = : wdowiec lub wdowa zarabiają o 21.15% więcej od osoby wolnej. Zmienna jest nieistotna na poziomie 5%, przy 6% jest istotna, β19 = : rozwiedziony mężczyzna lub rozwiedziona kobieta zarabiają o 27.93% więcej od osoby wolnej, β20 = : osoba z wykształceniem policealnym zarabia o 33.24% mniej niż osoba z wykształceniem wyższym, β21 = : osoba z wykształceniem średnim zarabia o 25.75% mniej niż osoba z wykształceniem wyższym, β22 = : osoba z wykształceniem zasadniczym zawodowym zarabia o 18.96% mniej niż osoba z wykształceniem wyższym, β23 = : osoba z wykształceniem gimnazjalnym zarabia o 48.12% mniej niż osoba z wykształceniem wyższym, β24 = : osoba z wykształceniem podstawowym zarabia o 93.98% mniej niż osoba z wykształceniem wyższym. Zmienna jest nieistotna na poziomie 5%, przy 6% jest istotna, β25 = : osoba z wykształceniem niepełnym podstawowym zarabia o 62.61% mniej niż osoba z wykształceniem wyższym, β26 = : osoba pracująca w instytucji prywatnej zarabia o 8.43% mniej niż osoba pracująca w instytucji publicznej. Zmienna jest nieistotna na poziomie 5%, przy 6% jest istotna, β27 = , β28 = : w celu poprawnej interpretacji wykonano wykres obrazujący wpływ stażu na poziom dochodu. Po analizie analitycznej oraz graficznej, do 21 roku stażu następuje wzrost wysokości dochodu, następnie spadek. Osoba mająca 21 lat stażu zarabia więcej o 25,99% od osoby nie posiadającej ani jednego roku stażu. Wykonane obliczenia znajdują się w załączniku. 12
13 Rys. 1. Wpływ stażu na dochód Źródło: Opracowanie własne 7. DIAGNOSTYKA 7.1. Poprawność formy funkcyjnej Test RESET: Ramsey RESET test using powers of the fitted values of lndochod Ho: model has no omitted variables F(3, 364) = 3.34 Prob > F = Na podstawie testu F, statystyka testowa 3.34, p-value , na poziomie istotności 5% odrzucono hipotezę zerową o braku pominiętych zmiennych (o poprawnej formie funkcyjnej). Na podstawie niskiej statystyki testowej (bliskiej 2) oraz wcześniej przeprowadzonego testu Boxa-Coxa, skorzystano z tej formy funkcyjnej. Dodatkowe informacje znajdują się w załączniku Normalność zaburzenia losowego 13
14 W celu zbadania normalności zaburzenia losowego, została przeprowadzona graficzna analiza reszt. Poniżej otrzymane wyniki: Rys. 2. Analiza graficzna reszt Źródło: Opracowanie własne Na podstawie pierwszej grafiki można wysunąć wniosek, że reszty nie mają rozkładu normalnego. Na kolejnej grafice (wykres pudełkowy - BOX) widać występujące obserwacje nietypowe. Nie wydaje się być ich dużo. Następna grafika (wykres kwantylowy) przedstawia niedopasowane do rozkładu normalnego ogony reszt. Ostatnia grafika (wykres prawdopodobieństwa) obrazuje występującą asymetrię. Test Jarque-Berra: Skewness/Kurtosis tests for Normality joint Variable Obs Pr(Skewness) Pr(Kurtosis) chi2(2) Prob>chi residual
15 Na podstawie wysokiej statystyki testowej (27.01) i p-value równego , na dowolnie przyjętym poziomie istotności odrzucono hipotezę zerową, że zaburzenie losowe reszt ma rozkład normalny. Jest to zgodne z przypuszczeniami opartymi na graficznej analizie. Pomimo braku rozkładu normalnego, spełnione są założenia twierdzenia Gaussa-Markowa, więc estymator MNK wektora parametrów jest najlepszym nieobciążonym i liniowym estymatorem. Istnieją jednak estymatory nieliniowe, które wykazują większą efektywność od estymatorów MNK Homoskedastyczność Test Breuscha-Pagana: Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: _Iwojewodzt_2 _Iwojewodzt_4 _Iwojewodzt_6 _Iwojewodzt_8 _Iwojewodzt_10 _Iwojewodzt_12 _Iwojewodzt_14 _Iwojewodzt_16 _Iwojewodzt_18 _Iwojewodzt_20 _Iwojewodzt_24 _Iwojewodzt_26 _Iwojewodzt_28 _Iwojewodzt_30 _Iwojewodzt_32 _Iplec_2 _Istancywil_2 _Istancywil_3 _Istancywil_4 _Iwyksztalc_2 _Iwyksztalc_3 _Iwyksztalc_4 _Iwyksztalc_5 _Iwyksztalc_6 _Iwyksztalc_7 _Irodzaj_2 staz stazz chi2(28) = Prob > chi2 = Na podstawie wysokiej statystyki testowej (182.63) i p-value równego , na dowolnie przyjętym poziomie istotności odrzucono hipotezę zerową o homoskedastyczności zaburzenia losowego. Test White a: White's test for Ho: homoskedasticity against Ha: unrestricted heteroskedasticity chi2(241) = Prob > chi2 = Cameron & Trivedi's decomposition of IM-test --- Source chi2 df p 15
16 Heteroskedasticity Skewness Kurtosis Total Na podstawie statystyki testowej (320.86) i p-value równego , na poziomie istotności 5% odrzucono hipotezę zerową o homoskedastyczności zaburzenia losowego. Heteroskedastyczność jest istotnym problemem. W celu jego wyeliminowania należy użyć estymatorów White a, ponieważ odporne są one na heteroskedastyczność i zapewniają odpowiednie estymatory błędów standardowych estymatorów oraz wariancji składnika losowego. xi: reg lndochod i.wojewodztwo i.plec i.stancywilny i.wyksztalcenie i.rodzaj staz stazz,robust i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.stancywilny _Istancywil_1-4 (naturally coded; _Istancywil_1 omitted) i.wyksztalcenie _Iwyksztalc_1-7 (naturally coded; _Iwyksztalc_1 omitted) i.rodzaj _Irodzaj_1-2 (naturally coded; _Irodzaj_1 omitted) Linear regression Number of obs = 396 F( 28, 367) = 9.66 Prob > F = R-squared = Root MSE = Robust lndochod Coef. Std. Err. t P> t [95% Conf. Interval] _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_
17 _Iwojewodzt_ _Iplec_ _Istancywil_ _Istancywil_ _Istancywil_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Irodzaj_ staz stazz _cons Kierunek zmiany wartości błędów standardowych, statystyk testowych oraz p-value nie był jednorodny, jednakże otrzymano istotniejsze ich oszacowanie. Zmienna stancywil_2 okazała się istotna (wzrost statystyki testowej do 2.11 oraz spadek p-value do 0.036), więc na poziomie istotności 5% zmienna oznaczająca osoby w związku małżeńskim jest istotna. Podobnie zmienna stancywil_3 oznaczająca wdowy lub wdowców okazała się nieistotna (spadek statystyki testowej do 1.96 oraz wzrost p-value do 0.051). Kolejną zmienną nieistotną na poziomie istotności 5% jest wyksztalc_6 oznaczająca osoby z wykształceniem podstawowym (wzrost statystyki testowej do oraz wzrost p-value do 0.056). Ostatnią zmienną, która okazała się nieistotna jest rodzaj_2, czyli oznaczająca osoby pracujące w prywatnych firmach (wzrost statystyki testowej do oraz wzrost p-value do 0.051). Warto zauważyć, że wszystkie spośród wymienionych wyżej zmiennych okazałyby się istotne już na poziomie 6%. Postanowiono nie usuwać zmiennej rodzaj z regresji z powodu granicznej wartości statystyki testowej oraz jej istotności na minimalnie wyżej przyjętym poziomie. 8. NIETYPOWE OBSERWACJE Znalezione zostały 4 nietypowe obserwacje, co stanowi 1.01% wszystkich obserwacji. Nic nie wskazuje by były one błędne, stąd nie zostały one pominięte. Poniżej zostały one przedstawione: +--+ dochod wojewo~o plec stancy~y wykszt~e rodzaj staz leverage residua~t cook_d~t 17
18 W obserwacji nr 1 nietypowy jest dochód. Pozostałe zmienne nie są nietypowe, jednak poziom dochodu jest najniższy spośród wszystkich obserwacji, znacznie odbiegający od średniej. W kolejnych dwóch nietypowych obserwacjach wyróżnia się wykształcenie tych osób. Pomimo niskiego wykształcenia (podstawowe) zarobki są całkiem wysokie (w porównaniu do średniej wynoszącej 1184 zł). Ostatnia obserwacja wyróżnia się wysokim dochodem (najwyższym w swoim województwie) znacznie odbiegającym od średniej oraz wysokim stażem pracy. Warto zauważyć, że pierwsze 3 nietypowe obserwacje dotyczą wykształcenia podstawowego, a w bazie danych znajdują się tylko 4 osoby z tym poziomem wykształcenia. Ma to niewątpliwie wpływ na powyższy wynik. 9. WSPÓŁLINIOWOŚĆ Test VIF: Poniżej przedstawione zostały wyniki testu na współliniowość zmiennych: Variable VIF 1/VIF staz stazz _Iwojewod~ _Iwyksztal~ _Iwojewod~ _Iwojewod~ _Istancywi~ _Iwojewod~ _Iwojewod~ _Iwojewod~_ _Iwyksztal~ _Iwojewod~_ _Iwojewod~ _Iwojewod~ _Iwojewod~ _Iwojewod~_ _Iwojewod~_
19 _Istancywi~ _Iwyksztal~ _Iwojewod~ _Iwojewod~ _Iwyksztal~ _Istancywi~ _Iwojewod~ _Iwyksztal~ _Iplec_ _Iwyksztal~ _Irodzaj_ Mean VIF 2.60 Powyższy test wykazał problem współliniowości między zmiennymi staz i stazz, ponieważ wartość jest większa od 10. Jednak stazz=staz 2, stąd pozostawiono oszacowania bez zmian, gdyż zmienna staz 2 została celowo wprowadzona do modelu. Znaczący problem byłby gdyby statystyka którejkolwiek z pozostałych zmiennych przekraczała 10. W tym przypadku jej najwyższa wartość wynosi Warto zauważyć, że przy szukaniu ostatecznej formy funkcyjnej wystąpił problem współliniowości między zmiennymi wiek i staz. Prace nad tymi zmiennymi i dokładniejsze informacje znajdują się w załączniku. 10. PODSUMOWANIE W niniejszej pracy udało się wykazać większość zależności występujących między poziomem dochodu, a wymienionymi zmiennymi. Jedyną zmienną, którą zdecydowano się usunąć z powodu współliniowości była zmienna wiek. Otrzymane rezultaty dotyczące wykształcenia, a także płci są zgodne z badaniami Beyrouti (2009). W prawdzie dotyczyły one innego kraju, jednak podobnie kobiety zarabiały mniej od mężczyzn, dodatkowo była zauważalna różnica w wynagrodzeniach osób lepiej wykształconych. Również uzyskane wyniki zgodne są z badaniami Landau i Arthur (1992). W tym przypadku doświadczenie miało miejsce w kolejnym kraju, jednak nie zauważono istotnych różnic. Podobnie wyższe wynagrodzenia otrzymywały osoby posiadające współmałżonka. Również osoby wolne zarabiały mniej od jednostek rozwiedzionych. Nieco odmienne, aczkolwiek zbliżone wartości otrzymano dotyczące województw, w których zarabia się najwięcej. Według wyżej przeprowadzonej regresji najwyższe wynagrodzenia otrzymywały osoby z województwa pomorskiego, co nie jest zgodne ze statystykami GUS, według których 19
20 najwyższe zarobki odnotowano w województwie mazowieckim, a dopiero później w województwie pomorskim. Niewątpliwie uzyskałoby się inne wyniki, gdyby oszacowanie przeprowadzone zostało na większej próbie. Również zgodne wyniki dotyczą rodzaju firmy (przy przyjęciu poziomu istotności 6%), w której dana osoba pracuje. Mianowicie według Barro (1973), a także danych przedstawionych na początku pracy, wyższe zarobki osiąga się w instytucjach publicznych. Zgodnie z przeprowadzoną regresją zarobki w instytucjach prywatnych są niższe o 8,71%, co jest wynikiem niższym niż wartości podane przez PKPP Lewiatan i GUS, kolejno 10% i 13%. Zgodnie z przeprowadzoną regresją, statycznie maksymalne dochody osiągnie osoba spełniająca następujące warunki: 1. jest mężczyzną, 2. z wykształceniem wyższym, 3. pracującym w instytucji publicznej, 4. który się rozwiódł, 5. zamieszkałym w województwie pomorskim, 6. mającym 21 lat stażu. 20
21 11. BIBLIOGRAFIA Dane: 1. Badanie Ekonomicznej Aktywności Ludności z 4. kwartału 2009 roku: Literatura: 1. Lazear, E., "Education: Consumption or production?", The Journal of Political Economy, Vol. 85 (3), Bartlett, S. "Education, Experience, and Wage Inequality: ", The Journal of Human Resources, Vol. 13, (3) Barro, R. (1973), The Control of Politicians: An Economic Model, Public Choice 14 (September), Landau, J., Arthur, M. B. (1992), The relationship of marital status, spouse s career status, and gender to salary level, Sex Roles, Vol. 27,
22 12. ZAŁĄCZNIKI Statystyki opisowe zmiennych Poniżej przedstawione zostały statystyki opisowe zmiennych ciągłych, tj. średnia, odchylenie standardowe, minimalna i maksymalna wartość po usunięciu jednej błędnej obserwacji opisanej w dalszej części dokumentu dochod staz wiek Zauważalne jest duże zróżnicowanie zmiennych dochod, staz i wiek. Macierz korelacji dla tych zmiennych wygląda następująco: dochod wiek staz dochod wiek staz Występuje dodatnia korelacji między dochodem, a wiekiem oraz dochodem i stażem, jednak jest to korelacja bardzo słaba. Dodatkowo zauważalna jest bardzo silna dodatnia korelacja między wiekiem, a stażem, stąd można podejrzewać wystąpienie problemu współliniowości w dalszej części analizy. Szczegółowe dane dotyczące zmiennej zależnej dochod: dochod Percentiles Smallest 1% % % Obs % Sum of Wgt % 1500 Mean
23 Largest Std. Dev % % Variance % Skewness % Kurtosis Kurtoza wynosi 6.14, co jest wartością większą od 3, a to oznacza że rozkład jest bardziej wysmukły niż normalny, oraz że występuje większe skupienie wartości wokół średniej. Dodatkowo mediana równa 1500 jest wartością mniejszą od średniej równej , co oznacza że występuje więcej obserwacji o dochodzie niższym niż średnia. Rys. 3. Histogram zmiennej dochod Źródło: opracowanie własne Podobne wnioski do przedstawionych powyżej można wyciągnąć po analizie histogramu zmiennej dochod Analiza zmiennych dyskretnych Poniżej przedstawione zostały rozkłady zmiennych wyksztalcenie, wojewodztwo, plec i stancywilny: 23
24 wyksztalcen ie Freq. Percent Cum Total Na tym etapie zauważona została jedna błędna obserwacja wartość 0 dla wykształcenia jest nieopisana może oznaczać brak danych lub błędną informację. Najwięcej spośród badanych osób ma wykształcenie gimnazjalne, najmniej wykształcenie podstawowe. Znacząca ilość obserwacji przyjmuje wartości odpowiadające wykształceniom średniemu i wyższemu. Rozkłady zmiennych wojewodztwo, plec i stancywilny wyświetlone zostały już po usunięciu błędnej obserwacji: wojewodztwo Freq. Percent Cum Total Dane wydają się być poprawne. Najwięcej badanych mieszka w województwie warmińsko-mazurskim, a najmniej w małopolskim. 24
25 plec Freq. Percent Cum Total Występuje niewielka przewaga w ilości mężczyzn, jednak różnica jest niewielka. Nie są zauważalne dane niezgodne. stancywilny Freq. Percent Cum Total Najwięcej osób ma żonę lub męża (prawie 2/3). Następnie miejsce wśród ilości osób badanych zajmują osoby wolne. Również nie stwierdzono błędnych obserwacji. Do poprawnej analizy, konieczne okazało się wyświetlenie zmiennej dochod w zależności od zmiennych wyksztalcenie, wojewodztwo oraz stancywilny: - -> wyksztalcenie = dochod > wyksztalcenie = dochod > wyksztalcenie = 3 25
26 dochod > wyksztalcenie = dochod > wyksztalcenie = dochod > wyksztalcenie = dochod > wyksztalcenie = dochod Osoby z wykształceniem wyższym zarabiają najwięcej, stąd nie jest konieczna zmiana wartości bazowej. - -> wojewodztwo = dochod
27 - -> wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = 16 27
28 dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod > wojewodztwo = dochod
29 - -> wojewodztwo = dochod > wojewodztwo = dochod Osoby z województwa pomorskiego zarabiają najwięcej, stąd zdecydowano się ustalić tę wartość jako bazową. W tym celu zamieniono wartość przyjmowaną przez osoby badane zamieszkujące województwo pomorskiego z 22 na > stancywilny = dochod > stancywilny = dochod > stancywilny = dochod
30 -> stancywilny = dochod bazowej. Osoby wolne zarabiają najmniej, stąd nie stwierdzono konieczności zmiany wartości -> plec = dochod > plec = dochod Średnio rzecz biorąc kobiety zarabiają mniej od mężczyzn o zł Praca nad formą modelu regresji Przy wstępnej regresji użyto zmiennej dochod, jako zmiennej objaśnianej: xi: reg dochod i.wojewodztwo i.plec i.stancywilny i.wyksztalcenie i.rodzaj staz wiek i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.stancywilny _Istancywil_1-4 (naturally coded; _Istancywil_1 omitted) i.wyksztalcenie _Iwyksztalc_1-7 (naturally coded; _Iwyksztalc_1 omitted) i.rodzaj _Irodzaj_1-2 (naturally coded; _Irodzaj_1 omitted) Source SS df MS Number of obs = F( 28, 367) = 6.80 Model Prob > F = Residual R-squared =
31 Adj R-squared = Total Root MSE = dochod Coef. Std. Err. t P> t [95% Conf. Interval] _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iplec_ _Istancywil_ _Istancywil_ _Istancywil_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Irodzaj_ staz wiek _cons Ramsey RESET test using powers of the fitted values of dochod Ho: model has no omitted variables F(3, 364) = Prob > F = Forma funkcyjna okazała się niepoprawna (interpretacja testu pkt 7.1). W celu znalezienia jej poprawnej formy przeprowadzono test Boxa-Coxa (pkt 4). Rezultaty kolejnej regresji, w której użyto zmiennej lndochod jako zmiennej objaśnianej: xi: reg lndochod i.wojewodztwo i.plec i.stancywilny i.wyksztalcenie i.rodzaj staz wiek 31
32 i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.stancywilny _Istancywil_1-4 (naturally coded; _Istancywil_1 omitted) i.wyksztalcenie _Iwyksztalc_1-7 (naturally coded; _Iwyksztalc_1 omitted) i.rodzaj _Irodzaj_1-2 (naturally coded; _Irodzaj_1 omitted) Source SS df MS Number of obs = F( 28, 367) = 6.35 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lndochod Coef. Std. Err. t P> t [95% Conf. Interval] _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iplec_ _Istancywil_ _Istancywil_ _Istancywil_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Irodzaj_ staz wiek _cons Ramsey RESET test using powers of the fitted values of lndochod Ho: model has no omitted variables F(3, 364) = 2.26 Prob > F =
33 Forma funkcyjna okazał się poprawna. Z powodu zauważenia wysokiej korelacji między zmiennymi wiek i staz we wstępnej analizie danych przeprowadzony został test na współliniowość zmiennych: Variable VIF 1/VIF wiek staz _Iwojewod~ _Iwojewod~ _Iwyksztal~ _Iwojewod~ _Iwojewod~ _Istancywi~ _Iwojewod~ _Iwojewod~_ _Iwojewod~_ _Iwyksztal~ _Iwojewod~ _Iwojewod~ _Iwojewod~ _Iwojewod~_ _Iwojewod~_ _Istancywi~ _Iwyksztal~ _Iwojewod~ _Iwojewod~ _Istancywi~ _Iwyksztal~ _Iwojewod~ _Iwyksztal~ _Iplec_ _Iwyksztal~ _Irodzaj_ Mean VIF 2.36 Został wykryty problem współliniowości dla zmiennych których VIF > 10 (dokładna interpretacja pkt 9). Wynikać może on z wielu czynników, m.in. niewystarczającej ilości obserwacji, a także z rzeczywiście występującej współliniowości. Podjęto próby wyeliminowania problemu. Pierwsze dwie to regresje przeprowadzone z wykorzystaniem zmiennej staz jako zmiennej objaśniającej oraz kolejno zmiennej wiek: xi: reg lndochod i.wojewodztwo i.plec i.stancywilny i.wyksztalcenie i.rodzaj staz i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) 33
34 i.stancywilny _Istancywil_1-4 (naturally coded; _Istancywil_1 omitted) i.wyksztalcenie _Iwyksztalc_1-7 (naturally coded; _Iwyksztalc_1 omitted) i.rodzaj _Irodzaj_1-2 (naturally coded; _Irodzaj_1 omitted) Source SS df MS Number of obs = F( 27, 368) = 6.19 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lndochod Coef. Std. Err. t P> t [95% Conf. Interval] _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iplec_ _Istancywil_ _Istancywil_ _Istancywil_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Irodzaj_ staz _cons xi: reg lndochod i.wojewodztwo i.plec i.stancywilny i.wyksztalcenie i.rodzaj wiek i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) i.plec _Iplec_1-2 (naturally coded; _Iplec_1 omitted) i.stancywilny _Istancywil_1-4 (naturally coded; _Istancywil_1 omitted) i.wyksztalcenie _Iwyksztalc_1-7 (naturally coded; _Iwyksztalc_1 omitted) i.rodzaj _Irodzaj_1-2 (naturally coded; _Irodzaj_1 omitted) 34
35 Source SS df MS Number of obs = F( 27, 368) = 6.29 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lndochod Coef. Std. Err. t P> t [95% Conf. Interval] _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iwojewodzt_ _Iplec_ _Istancywil_ _Istancywil_ _Istancywil_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Iwyksztalc_ _Irodzaj_ wiek _cons Na podstawie statystyk testowych t równych oraz i p-value oraz > 0.05 nie było podstaw do odrzucenia hipotezy zerowej o nieistotności tych zmiennych. Utworzono zmienne wiekk=wiek 2 oraz staz=staz 2. Przeprowadzone regresje oraz testy na poprawność formy funkcyjnej dały następujące rezultaty: xi: reg lndochod i.wojewodztwo i.plec i.stancywilny i.wyksztalcenie i.rodzaj wiek wiekk i.wojewodztwo _Iwojewodzt_0-32 (naturally coded; _Iwojewodzt_0 omitted) 35
Diagnostyka w Pakiecie Stata
Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.
Bardziej szczegółowoDiagnostyka w Pakiecie Stata
Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.
Bardziej szczegółowoWprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu
Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności
Bardziej szczegółowoEgzamin z ekonometrii wersja IiE, MSEMAT
Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMAT 08-02-2017 1. W jaki sposób przeprowadzamy test Chowa? 2. Pokazać, że jest nieobciążonym estymatorem. 3. Udowodnić, że w modelu ze stałą TSSESS+RSS.
Bardziej szczegółowoEgzamin z ekonometrii wersja IiE, MSEMAT
Egzamin z ekonometrii wersja IiE, MSEMAT 02022015 Pytania teoretyczne 1. Podać treść twierdzenia GaussaMarkowa i wyjaśnić jego znaczenie. 2. Za pomocą jakich testów testuje się autokorelację? Jakiemu założeniu
Bardziej szczegółowoEgzamin z ekonometrii wersja ogólna Pytania teoretyczne
Egzamin z ekonometrii wersja ogólna 08-02-2017 Pytania teoretyczne 1. Za pomocą którego testu testujemy stabilność parametrów? Jakiemu założeniu KMRL odpowiada H0 w tym teście? Jaka jest hipoteza alternatywna
Bardziej szczegółowoNatalia Nehrebecka Stanisław Cichocki. Wykład 6
Natalia Nehrebecka Stanisław Cichocki Wykład 6 1 1. Zmienne dyskretne Zmienne zero-jedynkowe 2. Modele z interakcjami 2 Zmienne dyskretne Zmienne nominalne Zmienne uporządkowane 3 4 1 podstawowe i 0 podstawowe
Bardziej szczegółowoNatalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Bardziej szczegółowoEkonometria Ćwiczenia 19/01/05
Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych
Bardziej szczegółowoEgzamin z ekonometrii wersja IiE, MSEMAT
Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy
Bardziej szczegółowoTesty własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu
Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε
Bardziej szczegółowo1. Obserwacje nietypowe
1. Obserwacje nietypowe Przeanalizujemy następujący eksperyment: 1) Generujemy zmienną x z rozkładu N (,1) (37 obserwacji). ) Generujemy zmienną y w następujący sposób: y = 1+ x + ε, gdzie ε ~ N(0,1).
Bardziej szczegółowoEgzamin z ekonometrii - wersja ogólna
Egzamin z ekonometrii - wersja ogólna 06-02-2019 Regulamin egzaminu 1. Egzamin trwa 90 min. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Bardziej szczegółowoEkonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością
Bardziej szczegółowo1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.
Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.
Bardziej szczegółowoEkonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Bardziej szczegółowoEgzamin z ekonometrii wersja ogolna
Egzamin z ekonometrii wersja ogolna 04-02-2016 Pytania teoretyczne 1. Wymienić założenia Klasycznego Modelu Regresji Liniowej (KMRL). 2. Wyprowadzić estymator MNK dla modelu z wieloma zmiennymi objaśniającymi.
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne Obserwacje nietypowe i błędne Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2)
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych
Bardziej szczegółowoNatalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Bardziej szczegółowoTestowanie hipotez statystycznych
Część 2 Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład statystyki testowej Hipoteza łączna H 0 : Rβ = q Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład
Bardziej szczegółowoMetoda najmniejszych kwadratów
Własności algebraiczne Model liniowy Zapis modelu zarobki = β 0 + β 1 plec + β 2 wiek + ε Oszacowania wartości współczynników zarobki = b 0 + b 1 plec + b 2 wiek + e Model liniowy Tabela: Oszacowania współczynników
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Bardziej szczegółowoEgzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne
Egzamin z ekonometrii wersja IiE, MSEMat 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Wyjaśnić, jakie korzyści i niebezpieczeństwa
Bardziej szczegółowoEkonometria egzamin 07/03/2018
imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Bardziej szczegółowoPomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.
Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-
Bardziej szczegółowoNatalia Nehrebecka. 18 maja 2010
Natalia Nehrebecka 18 maja 2010 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Problemy z danymi Obserwacje nietypowe i błędne Współliniowość. Heteroskedastycznośd i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji
Bardziej szczegółowoHeteroskedastyczość w szeregach czasowyh
Heteroskedastyczość w szeregach czasowyh Czesto zakłada się, że szeregi czasowe wykazuja autokorelację ae sa homoskedastyczne W rzeczywistości jednak często wariancja zmienia się w czasie Dobrym przykładem
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Testowanie autokorelacji 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji 3.Problemy z danymi Zmienne pominięte
Bardziej szczegółowoZadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1
Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów
Bardziej szczegółowoEgzamin z ekonometrii wersja ogólna Pytania teoretyczne
Egzamin z ekonometrii wersja ogólna 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Porównaj zastosowania znanych ci kontrastów
Bardziej szczegółowoZmienne sztuczne i jakościowe
Zmienne o ograniczonym zbiorze wartości Przykład 1. zarobki = β 0 + β 1 liczba godzin pracy + β 2 wykształcenie + ε Przykład 2. zarobki = β 0 + β 1 liczba godzin pracy + β 2 klm + ε zarobki = β 0 + β 1
Bardziej szczegółowoProblem równoczesności w MNK
Problem równoczesności w MNK O problemie równoczesności mówimy, gdy występuje korelacja między wartościa oczekiwana ε i i równoczesnym x i Model liniowy y = Xβ + ε, E (u) = 0 Powiedzmy, że występuje w
Bardziej szczegółowo1.8 Diagnostyka modelu
1.8 Diagnostyka modelu Dotychczas zajmowaliśmy się własnościami estymatorów przy spełnionych założeniach KMRL. W praktyce nie zawsze spełnione są wszystkie założenia modelu. Jeżeli któreś z nich nie jest
Bardziej szczegółowoEkonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 06/03/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Bardziej szczegółowoEkonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 31/01/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Bardziej szczegółowoEkonometria dla IiE i MSEMat Z12
Ekonometria dla IiE i MSEMat Z12 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 09-01-2017 Test RESET Ramsey a W pierwszym etapie estymujemy współczynniki regresji w modelu:
Bardziej szczegółowoZmienne Binarne w Pakiecie Stata
Karol Kuhl Zbiór (hipotetyczny) dummy.dta zawiera dane, na podstawie których prowadzono analizy opisane poniżej. Nazwy zmiennych oznaczają: doch dochód w jednostkach pieniężnych; plec płeć: kobieta (0),
Bardziej szczegółowoNatalia Nehrebecka. Wykład 1
Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Dwiczenia Literatura 2. Czym zajmuje się ekonometria? 3. Formy danych statystycznych 4. Model ekonometryczny 2 1. Sprawy organizacyjne
Bardziej szczegółowoEkonometria egzamin wersja ogólna 29/01/08
imię, nazwisko, nr indeksu: Ekonometria egzamin wersja ogólna 29/0/08. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca
Bardziej szczegółowoNatalia Nehrebecka Stanisław Cichocki. Wykład 13
Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje
Bardziej szczegółowo, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59
Zadanie 1. Ekonometryk szacując funkcję konsumpcji przeprowadził estymację osobno dla tzw. Polski A oraz Polski B. Dla Polski A posiadał n 1 = 40 obserwacji i uzyskał współczynnik dopasowania RA 2 = 0.4,
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Bardziej szczegółowoEkonometria egzamin wersja Informatyka i Ekonometria 26/06/08
imię, nazwisko, nr indeksu: Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz
Bardziej szczegółowoJak zarabiają najbardziej wpływowi - determinanty zarobków CEO
Uniwersytet Warszawski Wydział Nauk Ekonomicznych Cyryl Kasperski Nr albumu: 276885 Jak zarabiają najbardziej wpływowi - determinanty zarobków CEO Praca na kierunku: Informatyka i Ekonometria Praca wykonana
Bardziej szczegółowoĆwiczenia IV
Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Bardziej szczegółowoEkonometria dla IiE i MSEMat Z7
Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany
Bardziej szczegółowoEkonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 01/02/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12
Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie
Bardziej szczegółowo1 Modele ADL - interpretacja współczynników
1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać
Bardziej szczegółowoAutokorelacja i heteroskedastyczność
Autokorelacja i heteroskedastyczność Założenie o braku autokorelacji Cov (ε i, ε j ) = E (ε i ε j ) = 0 dla i j Oczekiwana wielkość elementu losowego nie zależy od wielkości elementu losowego dla innych
Bardziej szczegółowoEkonometria egzamin wersja ogólna 17/06/08
imię, nazwisko, nr indeksu: Ekonometria egzamin wersja ogólna 17/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie
Bardziej szczegółowoMODEL EKONOMETRYCZNY. Marcin Michalski, Konrad Rotuski, gr. 303, WNE UW
MODEL EKONOMETRYCZNY Marcin Michalski, Konrad Rotuski, gr. 303, WNE UW 1. Problem ekonometryczny Bardzo waŝnym problemem w duŝych firmach i korporacjach jest ustalanie wysokości wynagrodzenia głównych
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Wykład 1
Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Ćwiczenia Literatura 2. Obciążenie Lovella 3. Metoda od ogólnego do szczególnego 4. Kryteria informacyjne 2 1.
Bardziej szczegółowoEkonometria I Weryfikacja: współliniowość i normalność. Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie
Ekonometria I Weryfikacja: współliniowość i normalność Dr Michał Gradzewicz Szkoła Główna Handlowa w Warszawie 1 Współliniowość 2 Przypomnienie: Założenia MNK Założenia MNK: 1. Zmienne objaśniające są
Bardziej szczegółowoEkonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18
Ekonometria Metodologia budowy modelu Jerzy Mycielski WNE, UW Luty, 2011 Jerzy Mycielski (WNE, UW) Ekonometria Luty, 2011 1 / 18 Sprawy organizacyjne Dyżur: środa godz. 14-15 w sali 302. Strona internetowa
Bardziej szczegółowoCzasowy wymiar danych
Problem autokorelacji Model regresji dla szeregów czasowych Model regresji dla szeregów czasowych y t = X t β + ε t Zasadnicze różnice 1 Budowa prognoz 2 Problem stabilności parametrów 3 Problem autokorelacji
Bardziej szczegółowoWielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna
Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna
Bardziej szczegółowoEkonometria egzamin wersja Informatyka i Ekonometria 29/01/08
imię, nazwisko, nr indeksu: Ekonometria egzamin wersja Informatyka i Ekonometria 29/0/08. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz
Bardziej szczegółowoCzynniki wpływające na wielkość oczekiwanej płacy po ukończeniu studiów przez studentów z województwa podlaskiego
Model ekonometryczny Czynniki wpływające na wielkość oczekiwanej płacy po ukończeniu studiów przez studentów z województwa podlaskiego Praca napisana na ćwiczeniach z Ekonometrii pod kierunkiem dr Stanisława
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichoci Natalia Nehrebeca Wyład 10 1 1. Testowanie hipotez prostych Rozład estymatora b Testowanie hipotez prostych przy użyciu statystyi t Przedziały ufności Badamy czy hipotezy teoretyczne
Bardziej szczegółowoPrzyczynowość Kointegracja. Kointegracja. Kointegracja
korelacja a związek o charakterze przyczynowo-skutkowym korelacja a związek o charakterze przyczynowo-skutkowym Przyczynowość w sensie Grangera Zmienna x jest przyczyną w sensie Grangera zmiennej y jeżeli
Bardziej szczegółowoModele warunkowej heteroscedastyczności
Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Racjonalne oczekiwania inwestorów P t = E(P t+1 I t ) 1 + R (1) Teoria Przykład - zwroty
Bardziej szczegółowoJednowskaźnikowy model Sharpe`a
Uniwersytet Warszawski Wydział Nauk Ekonomicznych Milena Jamroziak i Paweł Androszczuk Model ekonometryczny Jednowskaźnikowy model Sharpe`a dla akcji Amici Praca zaliczeniowa napisana pod kierunkiem mgr
Bardziej szczegółowoZadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Bardziej szczegółowoREGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Bardziej szczegółowoBudowa modelu i testowanie hipotez
Problemy metodologiczne Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Gdzie jest problem? Obciążenie Lovella
Bardziej szczegółowo1.5 Problemy ze zbiorem danych
1.5 Problemy ze zbiorem danych W praktyce ekonometrycznej bardzo rzadko spełnione są wszystkie założenia klasycznego modelu regresji liniowej. Częstym przypadkiem jest, że zbiór danych którymi dysponujemy
Bardziej szczegółowo1.6 Zmienne jakościowe i dyskretne w modelu regresji
1.6 Zmienne jakościowe i dyskretne w modelu regresji 1.6.1 Zmienne dyskretne i zero-jedynkowe (Dummy Variables) W badaniach ekonometrycznych bardzo często występują zjawiska, które opisujemy zmiennymi
Bardziej szczegółowoEkonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Ćwiczenia nr 3 Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 3 Własności składnika losowego 1 / 18 Agenda KMNK przypomnienie 1 KMNK przypomnienie 2 3 4 Jakub Mućk
Bardziej szczegółowoPrzykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku
Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie
Bardziej szczegółowoPODSUMOWANIE OGÓLNOPOLSKIEGO BADANIA WYNAGRODZEŃ W 2017 ROKU
12.02.2018 Informacja prasowa portalu PODSUMOWANIE OGÓLNOPOLSKIEGO BADANIA WYNAGRODZEŃ W 2017 ROKU Pytania i dodatkowe informacje: tel. 509 509 536 media@sedlak.pl Informacje o badaniu: W 2017 roku w badaniu
Bardziej szczegółowoHeteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów
Formy heteroscedastyczności Własności estymatorów MNK wydatki konsumpcyjne 0 10000 20000 30000 40000 14.4 31786.08 dochód rozporz¹dzalny Zródlo: Obliczenia wlasne, dane BBGD 2004 Formy heteroscedastyczności
Bardziej szczegółowoCzynniki wpływające na aktywność zawodową osób starszych. Analiza ekonometryczna
Czynniki wpływające na aktywność zawodową osób starszych Analiza ekonometryczna Problemy Polska należy do krajów o najmłodszym wieku wycofania się z rynku pracy Aktywność zawodowa osób starszych w Polsce
Bardziej szczegółowo7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
Bardziej szczegółowoRegresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
Bardziej szczegółowoCZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH
TOMASZ BĄK KATARZYNA OWCZARSKA gr. 312 CZYNNIKI WPŁYWAJĄCE NA WYDATKI DOKONYWANE ZA POMOCĄ KART KREDYTOWYCH Praca na pisana na ćwiczeniach z Ekonometrii pod kierunkiem mgr Natalii Nehrebeckiej. UNIWERSYTET
Bardziej szczegółowoTEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.
TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
Bardziej szczegółowo3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach Opis danych statystycznych
3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach 1995-2005 3.1. Opis danych statystycznych Badanie zmian w potencjale opieki zdrowotnej można przeprowadzić w oparciu o dane dotyczące
Bardziej szczegółowoNatalia Nehrebecka Stanisław Cichocki. Wykład 10
Natala Nehrebecka Stansław Cchock Wykład 10 1 1. Testy dagnostyczne 2. Testowane prawdłowośc formy funkcyjnej modelu 3. Testowane normalnośc składnków losowych 4. Testowane stablnośc parametrów 5. Testowane
Bardziej szczegółowo1.7 Ograniczenia nakładane na równanie regresji
1.7 Ograniczenia nakładane na równanie regresji Często teoria ekonomiczna wskazuje dobór zmiennych do modelu. Jednak nie w każdym przypadku oceny wartości parametrów są statystycznie istotne. Zastanowimy
Bardziej szczegółowoEmerytury nowosystemowe wypłacone w grudniu 2018 r. w wysokości niższej niż wysokość najniższej emerytury (tj. niższej niż 1029,80 zł)
Emerytury nowosystemowe wypłacone w grudniu 18 r. w wysokości niższej niż wysokość najniższej emerytury (tj. niższej niż 9,8 zł) DEPARTAMENT STATYSTYKI I PROGNOZ AKTUARIALNYCH Warszawa 19 1 Zgodnie z art.
Bardziej szczegółowoEstymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Bardziej szczegółowoEgzamin z Ekonometrii
Pytania teoretyczne Egzamin z Ekonometrii 18.06.2015 1. Opisać procedurę od ogólnego do szczegółowego na przykładzie doboru liczby opóźnień w modelu. 2. Na czym polega najważniejsza różnica między testowaniem
Bardziej szczegółowoSTATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Bardziej szczegółowoTESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Bardziej szczegółowoMODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Bardziej szczegółowoWłasności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Bardziej szczegółowoModele wielorównaniowe (forma strukturalna)
Modele wielorównaniowe (forma strukturalna) Formę strukturalna modelu o G równaniach AY t = BX t + u t, gdzie Y t = [y 1t,..., y Gt ] X t = [x 1t,..., x Kt ] u t = [u 1t,..., u Gt ] E (u t ) = 0 Var (u
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych
Bardziej szczegółowo