Wydział Nauk Ekonomicznych Uniwersytetu Warszawskiego Karolina Cisoń Renata Samburska SKĄD SIĘ BIORĄ DZIECI? -ANALIZA CZYNNIKÓW WPŁYWAJĄCYCH NA WSPÓŁCZYNNIK URODZEŃ Model ekonometryczny przygotowany pod kierunkiem mgr Dariusza Szymańskiego Warszawa, styczeń 2009
SPIS TREŚCI: 1. WSTĘP... 3 2. OMÓWIENIE LITERATURY POD KĄTEM HIPOTEZ BADAWCZYCH... 4 3. BUDOWA MODELU ORAZ DANE... 8 4. WYBÓR FORMY FUNKCYJNEJ... 9 5. DIAGNOSTYKA MODELU... 11 5.1. TEST RESET TEST NA POPRAWNOŚĆ FORMY FUNKCYJNEJ... 11 5.2. BADANIE WSPÓŁLINIOWOŚCI... 11 5.3. NORMALNOŚĆ SKŁADNIKA LOSOWEGO... 12 a) analiza graficzna... 12 b) formalny test... 13 5.4. TEST WHITE A NA HOMOSKEDASTYCZNOŚĆ... 13 6. INTERPRETACJA PARAMETRÓW MODELU... 14 7. WERYFIKACJA HIPOTEZ BADAWCZYCH... 17 8. PODSUMOWANIE... 19 9. BIBLIOGRAFIA... 20 ZAŁĄCZNIK... 21 2
1. Wstęp Od lat osiemdziesiątych stopniowo spada dzietność kobiet i przyrost naturalny. Społeczeństwo polskie, podobnie jak krajów Europy Zachodniej, staje się coraz starsze. Bezpośrednią przyczyną zmniejszania się liczby ludności jest notowany od 1984 r. spadek liczby urodzeń przy prawie nieistotnych zmianach w liczbie zgonów. Znajdujemy się w tzw. depresji urodzeniowej, poziom reprodukcji nie gwarantuje prostej zastępowalności pokoleń. Jest to problem społeczny, który w niedalekiej przyszłości moŝe stać się problemem takŝe gospodarczym. Coraz mniejsza grupa pracujących będzie utrzymywać rosnącą liczebnie populację emerytów. Postępujący spadek liczby urodzeń ma wiele róŝnych przyczyn kulturowych-demograficznych i ekonomicznych. Wśród czynników kulturowych zwraca się uwagę na wzrastające aspiracje rodziców i społeczne oczekiwania, jeŝeli chodzi o zapewnienie dzieciom jakości Ŝycia (przede wszystkim wykształcenia i umiejętności), co powoduje, Ŝe ogranicza się ich ilość. Innym czynnikiem jest przemiana roli kobiet w społeczeństwie -zwiększenie ich aktywności zawodowej moŝe ograniczyć im moŝliwości i chęci posiadania dzieci. Ekonomiczne czynniki to koszty wychowania dziecka, a takŝe ryzyko, jakie wiąŝe się z jego urodzeniem. Dotychczasowe badania, wskazują, Ŝe szczególne znaczenie w tej kwestii ma utrata kontaktu z rynkiem pracy i spadek konkurencyjności. Matkom małych dzieci bardzo trudno jest pogodzić obowiązki domowe i zawodowe. W naszej pracy poprzez analizę poszczególnych regionów Polski (za obserwacje przyjęłyśmy wszystkie powiaty wraz z miastami na prawach powiatu) postaramy się wskazać przyczyny, które determinują liczbę urodzeń. Z ekonomicznego punktu widzenia współczynnik urodzeń jest narzędziem przewidywania przyszłej podaŝy pracy. Model będzie miał zastosowanie praktyczne m.in. dla władz powiatowych chcących zwiększyć przyrost naturalny w swoim regionie i uniknąć tym samym problemów związanych ze starzejącym się społeczeństwem na rynku pracy oraz w systemie zabezpieczenia społecznego. Celem jest wiec wskazanie co naleŝy zmienić, aby kobiety częściej decydowały się na urodzenie dziecka.
2. Omówienie literatury pod kątem hipotez badawczych Naukowcy z Central European University 1 postulowali negatywną korelację między stopą bezrobocia, a współczynnikiem urodzeń. Jest ona ich zdaniem czynnikiem wzbudzającym ekonomiczną niepewność wśród rodzin co do przyszłości i co za tym idzie zniechęca do planowania potomstwa. Kwestia ta została szerzej zanalizowana przez J. Joźwiak 2. Wg niej wpływ stopy bezrobocia na współczynnik urodzeń moŝe być dwukierunkowy. Bezrobotni męŝczyźni są zniechęceni do ojcostwa w porównaniu z pracującymi. Dla kobiet relacja ta nie jest jednoznaczna. System zasiłków rodzinnych, zasiłków dla bezrobotnych moŝe zachęcać kobiety do posiadania licznego potomstwa. Pomoc socjalna moŝe być alternatywnym źródłem finansowania kosztów generowanych przez posiadane potomstwo. 3 Poza tym niepracujące kobiety ponoszą niŝsze koszty związane z wychowaniem niŝ pracujące (ulgi podatkowe, prorodzinne) są wiec bardziej skłonne do bycia matkami. Postanowiłyśmy więc w naszym modelu uwzględnić całkowitą stopę bezrobocia, poniewaŝ dwie te tendencje mogą się równowaŝyć tj. kobiet i męŝczyzn, a wynik ujemny lub dodatni będzie wskazywał na silniejszą tendencje odpowiednio męŝczyzn lub kobiet. Badania prowadzone w Stanach Zjednoczonych przez M.E. Edwards a 4 na grupie tamtejszych studentek dowiodły, Ŝe główna przyczyną odkładania rodzicielstwa jest pierwszorzędne zdobycie wykształcenia wyŝszego. Kobiety uznały, iŝ nie do pogodzenia jest jednoczesne studiowanie i wychowywanie dziecka. Ponadto ta grupa kobiet deklaruje się na dalszą karierę zawodową po skończeniu studiów. Bezsprzecznie deklarowały, iŝ dziecko przyczyniłoby się do opóźnienia kariery i zmniejszyło ich szanse zawodowe na rynku pracy. Śmiało moŝemy przenieść tą argumentację na warunki polskich kobiet. Kobiety z wykształceniem wyŝszym odraczają decyzje o urodzeniu dziecka. Wg Departamentu Badań Demograficznych 5 na dzietność kobiet w istotnym stopniu wpływa liczba zawartych związków małŝeńskich. Zdecydowana większość dzieci (w 2006 r. - ponad 80%) rodzi się w rodzinach tworzonych przez prawnie zawarte związki małŝeńskie, a prawie połowa dzieci małŝeńskich rodzi się w okresie pierwszych trzech lat trwania małŝeństwa rodziców. Począwszy od 2003 r. obserwuje się wzrost liczby nowozawartych małŝeństw - co pozwala przewidywać utrzymanie pozytywnego trendu, jakim jest rosnąca liczba urodzeń. Częstość zawierania małŝeństw jest nieznacznie niŝsza w miastach. Niezmiennie wśród nowozawartych 1 Department of Economics, Does unemployment give birth to more children? Central European University,USA 2 Joźwiak Janina, Has the birth rate become a matter of public concern? http://europa.eu.int/comm/employment_social/events/2005/demographic_change/jozwiak_txt_en.pdf 3 d Addino Anna Cristina and d Ercole Marco Mira, Trends and Determinants of Fertility Rates in OECD Countries: The Role of Policies, OECD Social, Employment and Migration Working Papers No. 27, 2005. 4 Edwards Mark Evan, Education and Occupations: Reexamining the Conventional Wisdom about Later First Births among American Mothers, Sociological Forum, Vol. 17, No. 3 (Sep., 2002), pp. 423-443 5 Główny Urząd Statystyczny, Departament Badań Demograficznych, Sytuacja demograficzna w Polsce, 2007 r. 4
związków ok. 86% stanowią małŝeństwa pierwsze, tj. panien z kawalerami. MałŜeństwa wyznaniowe, tj. zawarte w kościołach i jednocześnie zarejestrowane w urzędach stanu cywilnego, stanowią około 70% zawieranych prawnie związków i takie teŝ dane podlegają naszej dalszej analizie. Zła sytuacja demograficzna kraju niska dzietność i starzenie się ludności znajdują odbicie w problemach rynku pracy, a nieprzyjazny rodzinie rynek pracy ogranicza jej plany rozwojowe. Zmusza to do szukania powiązań pomiędzy aktywnością zawodową kobiet i męŝczyzn a rozwojem rodziny oraz do wprowadzania zmian, które ułatwiają pogodzenie tych obu sfer Ŝycia. Nasza wstępna hipoteza zakłada negatywną korelację między współczynnikiem urodzeń, a współczynnikiem aktywności zawodowej kobiet. Badanie CBOS dotyczyło polityki państwa wobec rodzin oraz sytuacji na rynku pracy kobiet w ciąŝy oraz matek małych dzieci. 6 Respondenci (zarówno osoby nie mające dzieci, jak i posiadające juŝ potomstwo) w większości opowiadali się za polityką państwa zachęcającą do posiadania potomstwa. W ich wypowiedziach najczęściej pojawiała się pomoc dla młodych małŝeństw w uzyskaniu mieszkania (54% wskazań) oraz pomoc w powrocie do pracy bądź znalezienie jej dla młodych matek (46%) jako sposób na zwiększenie liczby urodzeń. AŜ 34% ankietowanych wskazało, Ŝe wysokie zasiłki dla rodzin w trudnej sytuacji materialnej (pomoc socjalna) jako zachętę do posiadania potomstwa. Ciekawe są równieŝ wypowiedzi młodych kobiet, które nie mają jeszcze dzieci, ale planują je mieć. Potencjalne matki większą wagę przywiązują do pomocy w powrocie do pracy oraz znalezieniu zatrudnienia, zaś nieznacznie mniejszą co do udzielanej pomocy w znalezieniu mieszkania (odpowiednio 64% i 53%). Zbadano równieŝ które z działań mogących ułatwić matkom powrót do pracy jest najbardziej skuteczne według respondentów. Jako najskuteczniejsze zdaniem ponad połowy pytanych stworzenie matkom warunków, aby mogły pracować w dogodnych dla nich godzinach lub w niepełnym wymiarze czasu (56%). Na drugim miejscu znalazł się rozwój tanich i dostępnych placówek zapewniających opiekę nad małymi dziećmi, takich jak Ŝłobki, które za skuteczny sposób uwaŝa dwie piąte Polaków (41%). Jak widać z wyników powyŝszego badania moŝemy przypuszczać, iŝ w powiatach, w których jest moŝliwość korzystania z placówek zapewniających opiekę nad małymi dziećmi (takich jak Ŝłobki) współczynnik urodzeń będzie większy, poniewaŝ kobietom łatwiej będzie pogodzić pracę zawodową z wychowaniem małego dziecka. 6 Wenzel Michał, Polityka państwa wobec rodziny oraz dyskryminacja w miejscu pracy kobier w ciąŝy i matek małych dzieci, Centrum Badań Opinii Społecznej, 2006. 5
Potwierdzeniem wpływu czynnika mieszkaniowego na liczbę urodzeń w Polsce jest opracowanie Raport 2006 o naprawie sytuacji mieszkaniowej 7. Przedstawiono w nim analizę zaleŝności ilości wybudowanych mieszkań oraz liczby urodzonych dzieci w latach 1965-2005. Wykres 1. Ilość wybudowanych mieszkań oraz liczba urodzonych dzieci w latach 1965-2005. Dane według GUS (Dla wyeliminowania niemiarodajnych danych z 2003 roku przyjęto je jako średnia z poprzedniego i następnego roku). Źródło: Witkowski Piotr red., Raport 2006 o naprawie sytuacji mieszkaniowej, http://www.habitat.pl/download/raport2006.pdf, 2007. Analiza statystyczna wykazała istnienie bardzo silnego związku między krzywymi (po uwzględnieniu przesunięcia w czasie współczynnik korelacji Pearsona wynosi 94,1%). Badających nie zaskoczył fakt korelacji, jedynie jej siła. MoŜe to oznaczać, iŝ aktualnie w Polsce przewaŝają decyzje racjonalne nad uczuciowymi w kwestii posiadania potomstwa oraz liczby dzieci. W opracowaniu zamieszczono równieŝ funkcję przybliŝającą liczbę urodzeń ilością wybudowanych mieszkań (model liniowy z trendem): D(r)= 1,55727*M(r-5)+ -2,44563*r+5131,23658 (oznaczenia: r = rok (1965...2005); D(r)= ilość dzieci urodzonych w danym roku; M(r)= ilość mieszkań wybudowanych w danym roku) W modelu przyjęto poziom istotności 1, na tym poziomie wszystkie zmienne są istotne, model wyjaśnia zmienność w 93,47% (R2=0.9374), odchylenie standardowe reszt (RSE) =30,01. Z modelu wynika, iŝ niezaleŝnie od liczby wybudowanych mieszkań co rok liczba urodzonych spada o około 2500, zaś jedno nowe mieszkanie przyczynia się do wzrostu liczby urodzeń o 1,56 dziecka. UwaŜamy, Ŝe liczba oddanych mieszkań jest bardzo waŝna z punktu widzenia poprawności naszego modelu, co potwierdziły nam zarówno badanie CBOSu jak równieŝ powyŝsze wyniki badań. Zła sytuacja na rynku mieszkaniowym zniechęca do powiększania rodziny zaś perspektywa 7 Witkowski Piotr red., Raport 2006 o naprawie sytuacji mieszkaniowej, http://www.habitat.pl/download/raport2006.pdf, 2007. 6
uzyskania własnego mieszkania mogłaby skłonić młodych ludzi do podjęcia decyzji o urodzeniu dziecka. Spodziewamy się zatem, iŝ wzrost liczby wybudowanych mieszkań będzie przekładał się na wzrost współczynnika urodzeń. Gary Becker, amerykański ekonomista, laureat nagrody Nobla w dziedzinie ekonomii, w swojej pracy An Economic Analysis of Fertility 8 wykorzystał ramy gospodarcze do analizy czynników determinujących liczbę dzieci. Wyprowadził on wiele implikacji dla teorii ekonomiczne z tradycyjnej teorii demograficznej. RozwaŜał dwojaki związek pomiędzy liczbą urodzeń a wysokością dochodu. Becker twierdzi, iŝ wyŝszy dochód przekłada się na wyŝszy poziom edukacji, co moŝe prowadzić do większej znajomości technik planowania i zapobiegania niechcianym ciąŝom. Ekonomista zauwaŝył ujemną korelację pomiędzy wysokością dochodu a wielkością rodziny wynikającą z ujemnej korelacji między dochodem a wiedzą o metodach antykoncepcji. Z drugiej strony wzrost dochodu moŝe przekładać się na większą ilość dzieci, tak jak wzrost dochodu przekłada się na liczbę samochodów (lub innych dóbr konsumpcyjnych), ale takŝe na ich jakość (zauwaŝył, Ŝe elastyczność ilości powinna być mniejsza w porównaniu z elastycznością jakości). Według Beckera za dodatnią korelacją dochodu i liczby dzieci moŝe równieŝ świadczyć spadek śmiertelności niemowląt i dzieci wraz ze wzrostem dochodu (lepsza opieka medyczna). Jednak mimo spadku śmiertelności moŝe równieŝ występować spadek liczby urodzeń, poprzez zapobieganie niechcianym ciąŝom. Podejście ekonomiczne podkreśla wagę zmian w bezpośrednich i pośrednich kosztach posiadania dzieci. Ceny dóbr i usług związanych z utrzymaniem gospodarstwa i rodziny wzrosły, dlatego ludzie raczej odkładali zakładanie rodzin w czasie, przełoŝyło się to równieŝ na wzrost wydatków na opiekę nad dzieckiem. Zwiększeniu uległy zarówno bezpośrednie koszty posiadania dzieci, jak równieŝ pośrednie koszty (z powodu wzrostu cen za inne towary i usługi). Alternatywne koszty posiadania potomstwa równieŝ wzrosły, poniewaŝ rodzice wówczas zmuszeni są do cięŝszej i wydłuŝonej pracy w celu utrzymania poziomu Ŝycia, do którego przywykli. Wzrost wszystkich tych kosztów posiadania dziecka często powodował odkładanie, a nawet zaniechanie posiadania potomstwa 9. 8 Becker Gary, An Economic Analysis of Fertility, in Demographic and Economic Change in Developed Countries, NBER, Princeton, 1960. 9 d Addino Anna Cristina and d Ercole Marco Mira, Trends and Determinants of Fertility Rates in OECD Countries: The Role of Policies, OECD Social, Employment and Migration Working Papers No. 27, 2005. 7
Podsumowując, na podstawie przedstawionej literatury sformułowałyśmy następujące hipotezy badawcze: 1. Wzrost stopy bezrobocia zniechęca do posiadania potomstwa. 2. Wysokość udzielanej pomocy socjalnej wpływa na decyzje o posiadaniu potomstwa (dodatnia korelacja). 3. Wzrost odsetka kobiet o wyŝszym wykształceniu przyczynia się do spadku współczynnika urodzeń w danym powiecie. 4. Ilość małŝeństw jest dodatnio skorelowana z ilością urodzeń. 5. Aktywność kobiet na rynku pracy wpływa negatywnie na współczynnik urodzeń. 6. W powiatach, gdzie ilość oddanych do uŝytku mieszkań w stosunku do liczby mieszkańców jest wyŝsza, tam teŝ obserwowany jest wyŝszy współczynnik urodzeń. 7. Dostępność placówek opieki nad małymi dziećmi, takich jak Ŝłobki, wpływa dodatnio na liczbę urodzeń. 8. Wzrost przeciętnej płacy wpływa negatywnie na współczynnik urodzeń. 3. Budowa modelu oraz dane Za źródło danych posłuŝyło nam zestawienie zbiorcze Powiaty w Polsce przygotowane przez Departament Badań Regionalnych i Środowiska Głównego Urzędu Statystycznego. Opracowanie zawiera zestaw informacji statystycznych za 2006 rok charakteryzujących sytuację demograficzną, społeczną i gospodarczą kraju w ujęciu przestrzennym. Pojedynczymi obserwacjami są powiaty Polski oraz miasta na prawach powiatu, jest ich łącznie 379 (314 powiatów (tzw. ziemskich) oraz 65 miast na prawach powiatu). PoniŜej przedstawiamy dokładny opis wybranych przez nas zmiennych objaśniających oraz zmiennej objaśnianej: I Zmienna objaśniana Y- współczynnik urodzeń ((Ur. śywe/liczba ludności)* 1000, liczba podawana w promilach) II Zmienne objaśniające X 1 - współczynnik aktywności zawodowej kobiet (%) ((liczba kobiet bezrobotnych + + liczba kobiet pracujących)/łączna liczba kobiet w wieku produkcyjnym) X 2 - Stopa bezrobocia rejestrowanego; (obliczona jako stosunek liczby bezrobotnych zarejestrowanych do liczby cywilnej ludności aktywnej zawodowo, tj. bez osób odbywających czynną słuŝbę wojskową oraz pracowników jednostek budŝetowych prowadzących działalność w zakresie obrony narodowe i bezpieczeństwa) 8
X 3 - odsetek kobiet z wykształceniem wyŝszym (ilość kobiet z wykształceniem wyŝszym/ogólna liczba kobiet)*100%) X 4 - liczba mieszkań oddanych do uŝytku przypadająca na 1000 mieszkańców X 5 - przeciętny płaca przypadająca na 1 mieszkańca X 6 - wysokość udzielanej pomocy socjalnej na 1 mieszkańca X 7 - liczba miejsc w Ŝłobkach przypadająca na 1 mieszkańca X 8 - wskaźnik feminizacji (określa ile kobiet w danym społeczeństwie przypada na określoną liczbę męŝczyzn, najczęściej określa liczbę kobiet na 100 męŝczyzn) X 9 - współczynnik obciąŝenia ekonomicznego (mierzy ile na 100 osób w wieku produkcyjnym przypada osób w wieku nieprodukcyjnym) X 10 - częstość związków małŝeńskich (mierzona za pomocą współczynnika małŝeństw (liczba małŝeństw/ogólna liczba ludności)*1000, mierzony w promilach) X 11 -współczynnik ludności miejskiej ((liczba ludności miejskiej/liczba ludności ogółem)*100%) Zakładany model końcowy Y=β 0 +βx+ε Postać analityczna szacowanego równania regresji Współczynnik urodzeń = β 0 + β 1 X 1i + β 2 X 2i +β 3 X 3i + β 4 X 4i + β 5 X 5i + β 6 X 6i + β 7 X 7i + β 8 X 8i + β 9 X 9i + β 10 X 10i + β 11 X 11i +ε 4. Wybór formy funkcyjnej Rysunek 1. Histogramy współczynnika urodzeń (zmienna urodzenia zlogarytmowana, zmienna urodzenia bez logarytmu) Density 0 1 2 3 4 1.8 2 2.2 2.4 2.6 ln_współczynnik urodzeń Density 0.1.2.3.4 6 8 10 12 14 współczynnik urodzeń 9
Widzimy, Ŝe oba histogramy są zbliŝone do rozkładu normalnego, dlatego do wyboru formy funkcyjnej przeprowadzamy formalny test BoxCox. Wyniki testu zostały przedstawione w załączniku. Oszacowanie parametru wynosi 0,471 a więc zbliŝone jest do zera, co wskazuje na model ze logarytmowaną zmienna urodzenia (p-value przy teście mówiącym o tym, Ŝe zmienna powinna zostać logarytmowana wynosi 0,120). Postanowiłyśmy logarytmować wszystkie zmienne z wyjątkiem zmiennej Ŝłobki, poniewaŝ zmienna ta przyjmuje obserwacje zerowe. Przyjmując poziom istotności 5% 5 zmiennych w modelu jest istotnych oraz stała. Odrzucona zostaje hipoteza o łącznej nieistotności zmiennych Prob > F = 0.000. Model w 53.4% wyjaśnia zmienność logarytmu współczynnika urodzeń (R 2 =0.5340). UwaŜamy, Ŝe mimo iŝ pozostałe zmienne są nie istotne na poziomie istotności 5%, to one niemniej waŝne w wyjaśnieniu modelu. Nasze próby doprowadzenia ich do istotności są przedstawione w załączniku.. regress ln_urodzenia ln_aktywnosc ln_bezrobocie ln_wyzsze ln_mieszkania ln_place zlobki ln_so > cial ln_feminizacja ln_obciazenie ln_malzenstwa ln_miejskosc_1 Source SS df MS Number of obs = 379 F( 11, 367) = 38.23 Model 3.06680256 11.278800233 Prob > F = 0.0000 Residual 2.67669543 367.007293448 R-squared = 0.5340 Adj R-squared = 0.5200 Total 5.74349799 378.015194439 Root MSE =.0854 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0667865.024509 2.72 0.007.0185908.1149822 ln_bezrobo~e.0166335.0133544 1.25 0.214 -.0096272.0428943 ln_wyzsze -.0992961.027212-3.65 0.000 -.1528071 -.0457851 ln_mieszka~a.0708946.0080969 8.76 0.000.0549724.0868168 ln_place -.0303877.0417738-0.73 0.467 -.1125337.0517582 zlobki.0023971.0108447 0.22 0.825 -.0189284.0237226 ln_social -.0049954.0075505-0.66 0.509 -.0198432.0098524 ln_feminiz~a -.9870034.2491916-3.96 0.000-1.477026 -.4969809 ln_obciaze~e -.0200452.0672664-0.30 0.766 -.1523211.1122306 ln_malzens~a.5234099.055511 9.43 0.000.4142503.6325695 ln_miejsko~1.013.0117264 1.11 0.268 -.0100594.0360593 _cons 6.46434 1.350006 4.79 0.000 3.809622 9.119059 PoniŜej prezentujemy ostateczna postać modelu, gdzie wszystkie zmienne sa istotne na poziomie istotności 5%. Odrzucamy hipotezę zerowa o łącznej nieistotności zmiennych (p -value=0,000), model wyjaśnia zmienność logarytmu współczynnika urodzeń w 55,21% (R 2 =0.5521). 10
. xi: regress ln_urodzenia aktywnosc bezrobocie ln_wyzsze ln_mieszkania ln_place social social2 feminizacja ln_malzenstwa m > iejskosc_3m ln_wyzsze_ln_place Source SS df MS Number of obs = 379 F( 11, 367) = 41.13 Model 3.17108289 11.288280263 Prob > F = 0.0000 Residual 2.57241511 367.007009305 R-squared = 0.5521 Adj R-squared = 0.5387 Total 5.74349799 378.015194439 Root MSE =.08372 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] aktywnosc.3267366.1482258 2.20 0.028.0352582.6182151 bezrobocie.0016468.000761 2.16 0.031.0001503.0031433 ln_wyzsze -2.015763.697695-2.89 0.004-3.387744 -.6437812 ln_mieszka~a.0699988.0075989 9.21 0.000.055056.0849415 ln_place -.5556306.1999367-2.78 0.006 -.948796 -.1624653 social -.0002875.0001219-2.36 0.019 -.0005271 -.0000478 social2 4.42e-07 1.91e-07 2.31 0.021 6.63e-08 8.17e-07 feminizacja -.0103853.0022593-4.60 0.000 -.0148282 -.0059424 ln_malzens~a.5272172.0552826 9.54 0.000.4185068.6359276 miejskosc_3m -.0237124.0104699-2.26 0.024 -.044301 -.0031238 ln_wyzsze_~e.2471246.090198 2.74 0.006.0697548.4244944 _cons 6.88754 1.59857 4.31 0.000 3.744033 10.03105 5. Diagnostyka modelu 5.1. Test RESET test na poprawność formy funkcyjnej Test RESET wskazuje na poprawność przyjętej przez nas formy funkcyjnej na przyjętym poziomie istotności 5% (p-value = 0.0710 > 0.05, więc brak podstaw do odrzucenia hipotezy zerowej zakładającej poprawność przyjętej formy funkcyjnej, wartość statystyki testowej F(3,364) = 2,36).. ovtest Ramsey RESET test using powers of the fitted values of ln_urodzenia Ho: model has no omitted variables F(3, 364) = 2.36 Prob > F = 0.0710 5.2. Badanie współliniowości Jak widać VIF-y w naszym modelu są bardzo wysokie. Zazwyczaj w przypadku występowania współliniowości zaleca się usuniecie z modelu zmiennej o najwyŝszym VIF. Mamy jednak świadomość, ze usuniecie zmiennej, która w rzeczywistości jest istotna moŝe spowodować obciąŝenie estymatorów przy zmiennych, z którymi jest skorelowana. Logiczne jest, ze wysokie VIF-y są efektem silnego powiązania zmiennych: interakcji ln_wyzsze_ln_place, ln_wyzsze oraz ln_place, jak równieŝ zmiennej social i zmiennej social2 będącej jej kwadratem. 11
. estat vif Variable VIF 1/VIF ln_wyzsze_~e 3268.58 0.000306 ln_wyzsze 2864.32 0.000349 ln_place 39.50 0.025319 social 18.23 0.054844 social2 16.04 0.062335 feminizacja 3.70 0.270302 miejskosc_3m 3.10 0.322777 aktywnosc 2.26 0.443013 ln_malzens~a 1.49 0.671322 bezrobocie 1.47 0.679037 ln_mieszka~a 1.34 0.745573 Mean VIF 565.46 5.3. Normalność składnika losowego a) analiza graficzna Analiza Graficzna Reszt Histogram Wykres pudełkowy Density 0 1 2 3 4 5 -.3 -.2 -.1 0.1.2 Residuals Residuals -.3 -.2 -.1 0.1.2 Residuals -.3 -.2 -.1 0.1.2 Wykres kwantylowy -.2 -.1 0.1.2 Inverse Normal Normal F[(reszty-m)/s] 0.00 0.25 0.50 0.75 1.00 Wykres prawdopodbieństwa 0.00 0.25 0.50 0.75 1.00 Empirical P[i] = i/(n+1) Histogram z nałoŝoną gęstością rozkładu normalnego zbliŝony do rozkładu normalnego. Wykres pudełkowy: asymetria niezauwaŝalna, mało obserwacji nietypowych. Wykres kwantylowy wskazuje na problem z ogonami reszt. Na wykresie prawdopodobieństwa nie zauwaŝamy asymetrii. 12
A tak przedstawia się porównanie gęstości estymatora reszt z gęstością rozkładu normalnego: Kernel density estimate Density 0 1 2 3 4 5 -.4 -.2 0.2.4 Residuals kernel = epanechnikov, bandwidth =.02 Kernel density estimate Normal density b) formalny test Do tych samych wniosków dochodzimy przeprowadzając test Jarque-Berra, który wskazuje na normalność rozkładu zaburzenia losowego, wartość statystyki testowej wynosi 4.87, p value = 0.0877 > 0.05, czyli brak podstaw do odrzucenia hipotezy zerowej zakładającej normalność zaburzenia losowego... /*Test Jarque-Berra, H0: zaburzenie losowe ma rozkład normalny*/. sktest reszty Variable Skewness/Kurtosis tests for Normality joint Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 reszty 0.042 0.393 4.87 0.0877 5.4. Test White a na homoskedastyczność Na podstawie testu White a, statystyka testowa chi2 = 95.50, p-value = 0.0553 >0.05 nie ma podstaw do odrzucenia hipotezy zerowej zakładającej homoskedastyczność na przyjętym poziomie istotności 5%. Co oznacza, Ŝe moŝemy przyjąć, Ŝe wariancje błędów losowych dla wszystkich obserwacji są sobie równe. 13
.. imtest, white /*Test White*/ White's test for Ho: homoskedasticity against Ha: unrestricted heteroskedasticity chi2( 75) = 95.50 Prob > chi2 = 0.0553 Cameron & Trivedi's decomposition of IM-test Source chi2 df p Heteroskedasticity 95.50 75 0.0553 Skewness 10.10 11 0.5219 Kurtosis 0.45 1 0.5028 Total 106.05 87 0.0808 6. Interpretacja parametrów modelu. xi: regress ln_urodzenia aktywnosc bezrobocie ln_wyzsze ln_mieszkania ln_place social social2 feminizacja ln_malzenstwa > miejskosc_3m ln_wyzsze_ln_place Source SS df MS Number of obs = 379 F( 11, 367) = 41.13 Model 3.17108289 11.288280263 Prob > F = 0.0000 Residual 2.57241511 367.007009305 R-squared = 0.5521 Adj R-squared = 0.5387 Total 5.74349799 378.015194439 Root MSE =.08372 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] aktywnosc.3267366.1482258 2.20 0.028.0352582.6182151 bezrobocie.0016468.000761 2.16 0.031.0001503.0031433 ln_wyzsze -2.015763.697695-2.89 0.004-3.387744 -.6437812 ln_mieszka~a.0699988.0075989 9.21 0.000.055056.0849415 ln_place -.5556306.1999367-2.78 0.006 -.948796 -.1624653 social -.0002875.0001219-2.36 0.019 -.0005271 -.0000478 social2 4.42e-07 1.91e-07 2.31 0.021 6.63e-08 8.17e-07 feminizacja -.0103853.0022593-4.60 0.000 -.0148282 -.0059424 ln_malzens~a.5272172.0552826 9.54 0.000.4185068.6359276 miejskosc_3m -.0237124.0104699-2.26 0.024 -.044301 -.0031238 ln_wyzsze_~e.2471246.090198 2.74 0.006.0697548.4244944 _cons 6.88754 1.59857 4.31 0.000 3.744033 10.03105 Końcowa postać funkcyjna: ln(urodzenia) = 6.88754+ 0.3267366 aktywnosc + 0.0016468 bezrobocie 2.015763 ln(wyŝsze) + 0.0699988 ln(mieszkania) - 0.5556306 ln(place) 0.0002875 social + 4.42e-0.7 social2 0.0103853 feminizacja + 0.5272172 ln(małŝeństwa) - 0.0237124 miejsksoc_3m + 0.2471246 ln_wyzsze_ln_place Nasz model wyjaśnia zmienność logarytmu współczynnika urodzeń w 55,21% ( R 2 = 0.552). Statatystyka F = 41.13, p-value = 0.0000, odrzucamy hipotezę o łącznej nieistotności zmiennych. Na poziomie istotności 5% wszystkie zmienne w modelu są istotne (p-value < 0.05). 14
Wyestymowane parametry moŝna zinterpretować jako: Wzrost współczynnika aktywności zawodowej kobiet o 1 powoduje wzrost współczynnika urodzeń średnio o 32,67%, ceteris paribus. Wzrost stopy bezrobocia o 1 powoduje wzrost współczynnika urodzeń średnio o 0.165%, ceteris paribus. Wzrost ilości oddanych mieszkań na 1000 mieszkańców o 1% powoduje wzrost współczynnika urodzeń o średnio o 0.07%, ceteris paribus. Wzrost wskaźnika feminizacji o 1 powoduje spadek współczynnika urodzeń o średnio o 1,039%, ceteris paribus. Wzrost częstości związków małŝeńskich o 1% powoduje wzrost współczynnika urodzeń o średnio o 0.527 %, ceteris paribus. Zmienna miejskość_3m to zmienna dyskretna przyjmująca poziomy 1- miasto, 2 powiat miejski, 3 powiat wiejski. Współczynnik przy tej zmiennej mierzy premię za przejście z jednego poziomu do drugiego. W wyniku przejścia z poziomu 1 na 2 współczynnik urodzeń spada o 23%. Współczynnik przy interakcji ln_place_ln_wyzsze mierzy efekt synergii w zakresie wpływu na współczynnik urodzeń, występujący między płacami, a kobietami z wykształceniem wyŝszym. Oszacowanie parametru w naszym modelu przy tej interakcji ma jednak dodatni znak. (przy ln_placa i ln_wyzsze ujemny). Wprowadzając ta interakcje zakładałyśmy silniejszy ujemny wpływ tych zmiennych na współczynnik urodzeń. W takim wypadku zdecydowałyśmy się na policzenie efektów cząstkowych dla ln_place i ln_wyzsze = E ln( Y ) ln( wyzsze ) 2.015763 = + 2.015763 0.2471246 + 0.2471246 * ln(place) * 7.685655 = -0.11645 = Wzrost odsetka kobiet z wykształceniem wyŝszym o 1% powoduje spadek współczynnika urodzeń o 0.12% E ln( Y ) ln( place = 0.556 ) = 0.556 + 0.2471246 + 0.2471246 * 2.069614 * ln(wyzsze) = -0,04455 = Wzrost średniej płacy o 1% powoduje spadek współczynnika urodzeń o 0.045% 15
Błędem byłaby osobna interpretacja parametrów przy zmiennych social i social2, naleŝy patrzeć na oba oszacowania wspólnie, poniewaŝ jeŝeli zmienia się zmienna social to musi się takŝe zmienić zmienna social2, która jest kwadratem tej zmiennej. Aby zinterpretować te parametry najlepiej jest spojrzeć na wykres pokazujący zaleŝność między tymi zmiennymi, a logarytmem współczynnika urodzeń. Widać na nim, Ŝe początkowo przyrost pomocy socjalnej ujemnie wpływa na zmianę logarytmu urodzeń, po czym przyrosty te są co raz mniejsze, aŝ po przekroczeniu minimum zaczyna dodatnio wpływać na współczynnik urodzeń. W modelu to zjawisko przedstawia się w dodatnim współczynniku beta przy zmiennej social2. Oznacza to, Ŝe po przekroczeniu pewnego pułapu pomocy socjalnej (minimum funkcji = 325.99118), jesteśmy bardziej skłonni do podejmowania decyzji o dziecku. Rysunek 2 ZaleŜność między wysokością pomocy socjalnej, a logarytmem urodzeń. ln_urodzenia 11.16 11.18 11.2 11.22 11.24 11.26 0 200 400 600 800 pomoc socialna w zł. 16
7. Weryfikacja hipotez badawczych Paradoksalnie, większe zaangaŝowanie zawodowe kobiet łączy się z wyŝszymi wskaźnikami dzietności. Przystępując do estymacji zakładałyśmy, iŝ korelacja ta jest ujemna. Po głębszej jednak analizie tego zjawiska dochodzimy do wniosku, Ŝe tam, gdzie kobiety są postrzegane nie tylko jako osoby, na których wyłącznie spoczywają obowiązki rodzinne, ale akceptowana jest ich praca na równi z pracą męŝczyzn, za czym idą lepsze dostosowania organizacji form i czasu pracy umoŝliwiające wykonywanie obu funkcji, tam jest teŝ większe zatrudnienie kobiet i rodzi się więcej dzieci. Taką interpretację dostarczyły nam kraje skandynawskie i Francja, w których jest i duŝe zaangaŝowanie zawodowe kobiet, i wysoka dzietność. Warto dodać, iŝ w wielu wcześniejszych lekturach aktywność zawodowa kobiet była postrzegana jako czynnik hamujący dzietność, jak widać, owy negatywny związek został odwrócony. Uwzględniając bezrobocie w naszym modelu zakładałyśmy dwukierunkowy jego wpływ na współczynnik urodzeń. Dla męŝczyzn, w praktyce, bezrobocie zmniejsza skłonność do rodzicielstwa (w porównaniu do pracujących męŝczyzn), natomiast kobiety przez wzgląd na system zasiłków rodzinnych są bardziej skłonne do rodzenia 10. Parametr przy bezrobociu w naszym modelu jest dodatni, co świadczy o pozytywnym jego wpływie na dzietność. CzyŜby więc wpływ kobiet i zakładanej przez nie filozofii był silniejszy niŝ męŝczyzn? Nie będąc w pełni usatysfakcjonowane tym wyjaśnieniem postanowiłyśmy odnieść ten czynnik na rynek pracy. Mimo bezrobocia dobry pracownik staje się powoli dobrem rzadkim i trzeba o niego zabiegać, oferując mu więcej niŝ dotychczas, w tym umoŝliwiając pogodzenie pracy z rozwojem rodziny zarówno kobietom, jak i męŝczyznom. Przy duŝym bezrobociu to pracodawcy dyktują warunki, natomiast, gdy trudno jest o dobrego pracownika, moŝna go pozyskać, oferując dodatkowe świadczenia, pakiet socjalny o charakterze prorodzinnym, nowe standardy pracy, które pozwolą na łączenie ról zawodowych i rodzicielskich. Przykładem jest firma Google, uznana za najlepszego pracodawcę na świecie, która oferuje pracownikom bezpłatne wyŝywienie, Ŝłobki i przedszkola dla dzieci i inne udogodnienia. Tego typu dodatkowe świadczenia ze strony pracodawcy mogą mieć kapitalne znaczenie dla pozyskiwania pracowników, a takŝe dla rozwoju ich rodzin. Świadomość taką mają juŝ pracodawcy w Polsce, co wynika z wypowiedzi przedstawicieli firm, które deklarują, Ŝe chcą wprowadzać u siebie rozwiązania sprzyjające rodzinie. Nie zaskoczył nas natomiast wpływ odsetka kobiet wykształconych na współczynnik urodzeń. Kobiety podejmując studia odraczają decyzje o macierzyństwie. Po skończeniu studiów chcą pracować zawodowo tworzą więc i realizują ambitne plany, zwykle odraczając decyzję 10 Szersza analiza tego zjawiska przeprowadzona była przez J.Joźwiak w Has the birth rate become a matter of public concern? http://europa.eu.int/comm/employment_social/events/2005/demographic_change/jozwiak_txt_en.pdf 17
o dziecku. WiąŜe się ona się bowiem ze znacznym ograniczeniem czasu i zmniejszeniem szans na karierę. Wzrost dzietności w skali kraju wymaga więc zniesienia barier dla tej grupy kobiet, która dziś, chcąc pracować zawodowo, ponosi zbyt wysokie koszty macierzyństwa. Zapewnienie bardziej stabilnej sytuacji kobiet na rynku pracy zwiększy ich skłonność do posiadania dzieci. Potwierdziły się takŝe nasze wcześniejsze przypuszczenia odnośnie wpływu liczby małŝeństw w danym powiecie na liczbę noworodków. W Polsce, która jest krajem katolickim, znacząca większość urodzeń ma miejsce w prawnie zalegalizowanych związkach. Przyczyną tego moŝe być wciąŝ niewielka akceptacja społeczna dla urodzeń pozamałŝeńskich oraz wolnych związków, choć moŝna zauwaŝyć, iŝ ich liczba znacząco wzrosła w ostatnich latach. UwaŜamy, Ŝe w przyszłości coraz mniejsze znaczenie będzie odgrywać liczba zawieranych małŝeństw, choć nadal będzie to waŝny czynnik determinujący liczbę urodzeń. RównieŜ wpływ wzrostu dochodu na współczynnik urodzeń jest zgodny z naszymi przewidywaniami. Kobiety zarabiające więcej ponoszą równieŝ wyŝsze koszty alternatywne posiadania potomstwa, co często przyczynia się do spadku preferowanej liczby potomstwa w porównaniu z kobietami o niŝszym dochodzie lub decyzji o nieposiadaniu dzieci. Aktualnie moŝemy zaobserwować, iŝ rodzice juŝ od najmłodszych lat starają się zapewnić dziecku najlepsze warunki rozwoju, m.in. dodatkowe lekcje języków obcych, tańca czy chociaŝby muzyki. Te działania znacząco zwiększają pośrednie koszty posiadania potomstwa, co równieŝ negatywnie wpływa na liczbę dzieci w rodzinie. RównieŜ przyczyną takiego kierunku zmian moŝe być większa dostępność środków antykoncepcyjnych, a takŝe aborcji. Wówczas kobiety świadomie planują czas ciąŝy oraz liczbę potomstwa, zmniejsza to odsetek narodzin niechcianych urodzeń. Zmiana w sposobie podejmowania decyzji o potomstwie, z emocjonalnego na racjonalne widoczna w dzisiejszym społeczeństwie, objawia się m.in. w chęcią posiadania własnego mieszkania przed załoŝeniem rodziny. Dlatego teŝ nie dziwi nas, iŝ współczynnik urodzeń rośnie wraz z liczbą mieszkań oddaną do uŝytku. Wysokie ceny, niewielka ilość ofert sprzedaŝy, a takŝe czas oczekiwania na otrzymanie mieszkania mogą zniechęcać młodych ludzi do zakładania rodziny, a przynajmniej przesuwać w czasie moment podjęcia decyzji o potomstwie. Zaskakujące jednak moŝe być wpływ miejsca zamieszkania na współczynnik urodzeń. Z naszego modelu wynika, iŝ w miastach rodzi się najwięcej dzieci. Spadek odsetka ludności miejskiej pociąga za sobą spadek współczynnika urodzeń. Jak wiemy, panuje powszechne przekonanie, Ŝe to na terenach wiejskich rodzi się najwięcej dzieci. NaleŜy jednak zauwaŝyć, iŝ spadek znaczenia rolnictwa, a takŝe inna organizacja pracy, zmniejsza zapotrzebowanie na siłę roboczą jaką kiedyś były właśnie dzieci. MoŜe mieć to związek z dostępnością ośrodków opieki nad małymi dziećmi (takimi jak Ŝłobki). Jak juŝ wspomniałyśmy, aktywność zawodowa kobiet jest dodatnio skorelowana z liczną urodzeń, zaś takie ośrodki ułatwiają młodym matkom godzenie 18
obowiązków zawodowych z rodzicielskimi. Kierunek wpływu miejsca zamieszkania moŝna równieŝ tłumaczyć rozmieszczeniem uczelni wyŝszych. W dzisiejszych czasach większość młodych ludzi decyduje się na studia, najczęściej pociąga to za sobą zmianę miejsca zamieszkania, nie tylko tymczasowego. Wówczas moŝemy obserwować duŝe skupienie ludzi w wieku reprodukcyjnym właśnie na terenach miejskich lub w duŝych miastach, stąd teŝ moŝe wynikać wyŝszy współczynnik urodzeń. 8. Podsumowanie Opracowany wyŝej model potwierdził nasze wcześniej zasygnalizowane hipotezy. Okazuje się, Ŝe kierunki wpływu naszych zmiennych na zmienną zaleŝną nie odbiegają od tych przedstawionych w literaturze. Do samych oszacowań parametrów naleŝy jednak podchodzić z pewną dozą ostroŝności. Jesteśmy świadome, iŝ z braku danych nie byłyśmy w stanie umieścić innych, nie mniej istotnych zmiennych mających wpływ na współczynnik urodzeń (np. wielkość sprzedanych środków antykoncepcyjnych), co mogło obciąŝyć oszacowanie parametrów przy tych zmiennych uwzględnionych w modelu. Problem jest jednak warty dalszego analizowania i badania. Samorządy lokalne muszą być świadome niskiego poziomu dzietności, który bardzo powaŝnie osłabia potencjał rozwojowy ich regionu, oznacza bowiem spadek ogólnej liczby ludności oraz ludności w wieku produkcyjnym i przyspieszenie procesu starzenia się. Polityka państwa powinna wspierać zakładanie rodzin i rodzicielstwo czyli inwestować w kapitał ludzki kolejnych generacji. 19
9. Bibliografia 1. Becker Gary, An Economic Analysis of Fertility, in Demographic and Economic Change in Developed Countries, NBER, Princeton, 1960. 2. d Addino Anna Cristina and d Ercole Marco Mira, Trends and Determinants of Fertility Rates in OECD Countries: The Role of Policies, OECD Social, Employment and Migration Working Papers No. 27, 2005. 3. Department of Economics, Does unemployment give birth to more children? Central European University,USA 4. Edwards Mark Evan, Education and Occupations: Reexamining the Conventional Wisdom about Later First Births among American Mothers, Sociological Forum, Vol. 17, No. 3 (Sep., 2002), pp. 423-443 5. Joźwiak Janina, Has the birth rate become a matter of public concern?, http://europa.eu.int/comm/employment_social/events/2005/demographic_change/jozwiak_tx t_en.pdf 6. Wenzel Michał, Polityka państwa wobec rodziny oraz dyskryminacja w miejscu pracy kobier w ciąŝy i matek małych dzieci, Centrum Badań Opinii Społecznej, 2006. 7. Witkowski Piotr red., Raport 2006 o naprawie sytuacji mieszkaniowej, http://www.habitat.pl/download/raport2006.pdf, 2007. 20
ZAŁĄCZNIK 1. Główne statystyki PoniŜej przestawiamy podstawowe charakterystyki: średnią, odchylenie standardowe, minimum i maksimum poszczególnych zmiennych.. sum Variable Obs Mean Std. Dev. Min Max urodzenia 379 10.04151 1.229849 6.73834 14.16166 aktywnosc 379.1902282.0436475.0401.38553 bezrobocie 379 17.94934 6.866734 4.6 36.7 wyzsze 379 8.428281 3.441676 3.984908 23.42222 mieszkania 379 2.350495 1.832414.07281 15.16722 place 379 2198.531 338.8684 1583.52 4669.76 zlobki 379.430692.5532754 0 3.057954 social 379 160.1141 150.865 16.00695 721.4542 feminizacja 379 104.9459 3.665938 95.8 119.6 obciazenie 379 57.44512 5.966684 38.8 72.9 malzenstwa 379 6.071253.5785425 4.59318 8.47539 miejskosc_1 379 51.29947 27.13019 2 100 ZauwaŜamy bardzo duŝą rozpiętość wartości przy zmiennej social. Minimum wynosi zaledwie 16 zł, a maksimum sięga aŝ 721 zł na jednego mieszkańca. Podobna sytuacja się ma przy zmiennej miejskość_1. Jest to wyraźna wskazówka dla nas, ze te zmienne muszą ulec odpowiednim przekształceniom. 2. Histogramy i przekształcenie BoxCox Mając na uwadze to, Ŝe nasze zmienne są współczynnikami lub stopami, najlepszą interpretacje dostarczyłyby nam zmienne logarytmowane (interpretowałybyśmy je jako elastyczności). PoniŜej histogramy z nałoŝoną linią rozkładu normalnego zmiennej zaleŝnej bez logarytmu i z logarytmem. Density 0 1 2 3 4 1.8 2 2.2 2.4 2.6 ln_współczynnik urodzeń Density 0.1.2.3.4 6 8 10 12 14 współczynnik urodzeń 21
Ostatecznie przeprowadzenie formalnego testu skłania nas do logarytmowania zmiennej zaleŝnej.. boxcox urodzenia aktywnosc bezrobocie wyzsze mieszkania place zlobki social feminizacja obcia > zenie malzenstwa rozwody miejskosc_1 Fitting comparison model Iteration 0: log likelihood = -615.68893 Iteration 1: log likelihood = -614.44074 Iteration 2: log likelihood = -614.44074 Fitting full model Iteration 0: log likelihood = -477.66087 Iteration 1: log likelihood = -476.13589 Iteration 2: log likelihood = -476.13589 Number of obs = 379 LR chi2(12) = 276.61 Log likelihood = -476.13589 Prob > chi2 = 0.000 urodzenia Coef. Std. Err. z P> z [95% Conf. Interval] /theta.4709547.3030082 1.55 0.120 -.1229306 1.06484 Estimates of scale-variant parameters Coef. Notrans aktywnosc 1.507312 bezrobocie.0046639 wyzsze -.0206674 mieszkania.0679018 place -.0000544 zlobki.0070993 social -.0000422 feminizacja -.0291226 obciazenie -.0021331 malzenstwa.2710895 rozwody -.0214066 miejskosc_1 -.0001376 _cons 5.501444 /sigma.251824 Test Restricted LR statistic P-value H0: log likelihood chi2 Prob > chi2 theta = -1-487.85507 23.44 0.000 theta = 0-477.34241 2.41 0.120 theta = 1-477.66087 3.05 0.081. end of do-file 3. Analiza zmiennej zlobki. ln_urodzenia 1.8 2 2.2 2.4 2.6 0 1 2 3 liczba miejsc w Ŝłobkach na 1000 mieszkańców 22
Jak widać na wykresie rozproszenia zmienna zlobki przyjmuje duŝo wartości zerowych i w związku z tym postanowiłyśmy rozkodować ja na dwa poziomy: 0- brak Ŝłobków 1- pozostałe PoniŜej przedstawiamy wyniki regresji z rozkodowaną zmienną, jak widać p-value znacznie spadło (0.825 do 0.193), wyjaśnienie modelu się nie zmieniło, wszystkie zmienne są nadal łącznie istotne jak równieŝ nieznacznej poprawie uległy p-value.. regress ln_urodzenia ln_aktywnosc ln_bezrobocie ln_wyzsze ln_mieszkania ln_place zlobki_1 ln_ > social ln_feminizacja ln_obciazenie ln_malzenstwa ln_miejskosc_1 Source SS df MS Number of obs = 379 F( 11, 367) = 38.55 Model 3.07878958 11.279889962 Prob > F = 0.0000 Residual 2.66470842 367.007260786 R-squared = 0.5360 Adj R-squared = 0.5221 Total 5.74349799 378.015194439 Root MSE =.08521 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0683379.0244661 2.79 0.005.0202266.1164493 ln_bezrobo~e.0156648.0133094 1.18 0.240 -.0105074.041837 ln_wyzsze -.0983012.0270174-3.64 0.000 -.1514296 -.0451729 ln_mieszka~a.0699759.0080859 8.65 0.000.0540754.0858764 ln_place -.0265313.041407-0.64 0.522 -.107956.0548935 zlobki_1 -.0141651.0108641-1.30 0.193 -.0355289.0071986 ln_social -.0059653.0075679-0.79 0.431 -.0208472.0089165 ln_feminiz~a -.9486973.245468-3.86 0.000-1.431398 -.465997 ln_obciaze~e -.0424935.0677323-0.63 0.531 -.1756856.0906985 ln_malzens~a.5145871.0557292 9.23 0.000.4049984.6241757 ln_miejsko~1.0150946.0117802 1.28 0.201 -.0080707.0382598 _cons 6.372854 1.333118 4.78 0.000 3.751346 8.994362 3. Analiza zmiennej obciaznie. ln_urodzenia 1.8 2 2.2 2.4 2.6 40 50 60 70 80 ile na 100 osób w wieku produkcyjnym przypada osób w wieku nieprodukcyjnym 23
Na powyŝszym wykresie rozproszenia zauwaŝyłyśmy, iŝ obserwacje koncentrują się w dwóch obszarach na prawo i lewo dla obciąŝenia równego 60. Stąd zmienna obciąŝenie_1 przyjmuje wartości: 0 - dla obciąŝenia poniŝej 60 1 - dla obciąŝenia powyŝej 60 Patrząc na wyniki estymacji był to słuszny krok.. regress ln_urodzenia ln_aktywnosc ln_bezrobocie ln_wyzsze ln_mieszkania ln_place zlobki_1 ln_ > social ln_feminizacja obciazenie_1 ln_malzenstwa ln_miejskosc_1 Source SS df MS Number of obs = 379 F( 11, 367) = 38.94 Model 3.09338255 11.281216595 Prob > F = 0.0000 Residual 2.65011545 367.007221023 R-squared = 0.5386 Adj R-squared = 0.5248 Total 5.74349799 378.015194439 Root MSE =.08498 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0651059.0245023 2.66 0.008.0169234.1132884 ln_bezrobo~e.0144352.0132071 1.09 0.275 -.0115359.0404063 ln_wyzsze -.0872351.028044-3.11 0.002 -.1423822 -.0320881 ln_mieszka~a.0674851.0081205 8.31 0.000.0515165.0834536 ln_place -.0273278.0403595-0.68 0.499 -.1066927.0520371 zlobki_1 -.0156421.0107347-1.46 0.146 -.0367513.0054671 ln_social -.0065275.0073961-0.88 0.378 -.0210715.0080165 ln_feminiz~a -.9885719.2457284-4.02 0.000-1.471784 -.5053596 obciazenie_1 -.0201792.0129806-1.55 0.121 -.0457049.0053465 ln_malzens~a.5235014.0556918 9.40 0.000.4139864.6330165 ln_miejsko~1.0108824.0117902 0.92 0.357 -.0123023.0340672 _cons 6.379351 1.239434 5.15 0.000 3.942067 8.816634 4. Analiza zmiennej miejskość. ln_urodzenia 1.8 2 2.2 2.4 2.6 0 20 40 60 80 100 odsetek ludnośći miejskiej Patrzą na specyfikacje naszych danych doszłyśmy do wniosku, Ŝe naleŝałoby powiaty zaklasyfikować do 3 podgrup w zaleŝności od odsetka ludności zamieszkałej w miastach: 1 - miasta na prawach powiatu (miejskosc_1=100) 2 - powiat miejski( miejskosc_1 <50;100) 3 - powiat wiejski (miejskosc _1 < 50). 24
miejskosc_ miejsce_zam1 3m 0 1 Total 1 0 65 65 2 160 0 160 3 154 0 154 Total 314 65 379 miejskosc_ miejsce_zam2 3m 0 1 Total 1 65 0 65 2 0 160 160 3 154 0 154 Total 219 160 379 miejskosc_ miejsce_zam3 3m 0 1 Total 1 65 0 65 2 160 0 160 3 0 154 154 Total 225 154 379 Główne statystyki dla kaŝdego poziomu są zbliŝone, pozwala nam to przypuszczać, Ŝe premie za przejście z jednego poziomu na drugi jest taka sama (późnej przeprowadzimy formalny test).. bys miejskosc_3m: sum ln_urodzenia -> miejskosc_3m = 1 Variable Obs Mean Std. Dev. Min Max ln_urodzenia 65 2.207204.0909405 1.907814 2.448204 -> miejskosc_3m = 2 Variable Obs Mean Std. Dev. Min Max ln_urodzenia 160 2.3099.1214302 1.963475 2.550265 -> miejskosc_3m = 3 Variable Obs Mean Std. Dev. Min Max ln_urodzenia 154 2.326915.1194482 1.979098 2.650538 Przeprowadzamy regresje uwzględniając zmienną miejskość_3m (bez rozkodowania na zmienne zerojedynkowe) zakładając, iŝ premie są równe. ZauwaŜamy poprawę istotności zmiennej miejskość_3m.. 25
. do "C:\DOCUME~1\komin\USTAWI~1\Temp\STD0d000000.tmp". xi: regress ln_urodzenia ln_aktywnosc ln_bezrobocie ln_wyzsze ln_mieszkania ln_place zlobki_1 > ln_social ln_feminizacja obciazenie_1 ln_malzenstwa miejskosc_3m Source SS df MS Number of obs = 379 F( 11, 367) = 39.36 Model 3.10855807 11.282596188 Prob > F = 0.0000 Residual 2.63493992 367.007179673 R-squared = 0.5412 Adj R-squared = 0.5275 Total 5.74349799 378.015194439 Root MSE =.08473 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0640353.0241619 2.65 0.008.0165221.1115485 ln_bezrobo~e.0152554.0131373 1.16 0.246 -.0105785.0410893 ln_wyzsze -.0928186.0278471-3.33 0.001 -.1475785 -.0380587 ln_mieszka~a.0683808.0079627 8.59 0.000.0527225.0840391 ln_place -.0300554.0402581-0.75 0.456 -.1092209.04911 zlobki_1 -.014435.0105938-1.36 0.174 -.0352672.0063971 ln_social -.0102809.0077682-1.32 0.187 -.0255567.0049949 ln_feminiz~a -1.017646.2452889-4.15 0.000-1.499994 -.5352977 obciazenie_1 -.0165957.0128706-1.29 0.198 -.0419052.0087137 ln_malzens~a.5228796.0554331 9.43 0.000.4138733.631886 miejskosc_3m -.018858.0109416-1.72 0.086 -.040374.002658 _cons 6.642651 1.248775 5.32 0.000 4.186998 9.098304. end of do-file Przedstawiamy wynik estymacji ze zmiennymi zerojedynkowymi dla zmiennej miejskość_3m.. xi: regress ln_urodzenia ln_aktywnosc ln_bezrobocie ln_wyzsze ln_mieszkania ln_place zlobki_1 > ln_social ln_feminizacja obciazenie_1 ln_malzenstwa miejsce_zam1 miejsce_zam2 miejsce_zam3 Source SS df MS Number of obs = 379 F( 12, 366) = 35.98 Model 3.10859553 12.259049627 Prob > F = 0.0000 Residual 2.63490247 366.007199187 R-squared = 0.5412 Adj R-squared = 0.5262 Total 5.74349799 378.015194439 Root MSE =.08485 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0640808.024203 2.65 0.008.0164864.1116751 ln_bezrobo~e.0154899.0135511 1.14 0.254 -.0111579.0421377 ln_wyzsze -.0932065.0283987-3.28 0.001 -.1490517 -.0373613 ln_mieszka~a.0684468.0080259 8.53 0.000.0526642.0842294 ln_place -.0302887.0404422-0.75 0.454 -.1098169.0492396 zlobki_1 -.0144246.0106091-1.36 0.175 -.0352872.0064379 ln_social -.0106736.0094946-1.12 0.262 -.0293445.0079973 ln_feminiz~a -1.018983.2463201-4.14 0.000-1.503363 -.5346022 obciazenie_1 -.0168168.0132474-1.27 0.205 -.0428673.0092338 ln_malzens~a.5222936.0560998 9.31 0.000.4119753.6326119 miejsce_zam1 (dropped) miejsce_zam2 -.0203718.0236747-0.86 0.390 -.0669272.0261836 miejsce_zam3 -.0388347.0268458-1.45 0.149 -.091626.0139567 _cons 6.636057 1.260005 5.27 0.000 4.1583 9.113815 PoniŜej znajduje się formalny test potwierdzający nasze załoŝenie. Nasze liniowe ograniczenie, które chcemy przetestować: H 0 : 2 β 1 - β 2 = 0 H 1 :~ H 0 26
. test (2*miejsce_zam2 = miejsce_zam3) ( 1) 2 miejsce_zam2 - miejsce_zam3 = 0 F( 1, 366) = 0.01 Prob > F = 0.9425 Na poziomie istotności 5% nie ma podstaw do odrzucenia H 0 (p-value=0,9425) w związku z czym w dalszych estymacjach będziemy uŝywać zmiennej miejskość_3m. 5. Interakcja mi ędzy zmiennymi ln_wyŝsze i ln_place Postanowiłyśmy do naszego modelu dołączyć interakcje między zmiennymi ln_wyzsze i ln_place, poniewaŝ uwaŝamy, iŝ społeczeństwo w powiatach z wysokim odsetkiem kobiet wykształconych i wyŝszą przeciętną płacą moŝe być mniej skłonne do posiadania potomstwa lub posiadania mniejszej liczby dzieci. PoniŜej prezentujemy wyniki regresji z uwzględnieniem interakcji, która jak widać jest istotna (p-value=0.009), dzięki temu zmienna place stała się istotna.. xi: regress ln_urodzenia ln_aktywnosc ln_bezrobocie ln_wyzsze ln_mieszkania ln_place zlobki_1 > ln_social ln_feminizacja obciazenie_1 ln_malzenstwa miejskosc_3m ln_wyzsze_ln_place Source SS df MS Number of obs = 379 F( 12, 366) = 37.22 Model 3.15660746 12.263050622 Prob > F = 0.0000 Residual 2.58689054 366.007068007 R-squared = 0.5496 Adj R-squared = 0.5348 Total 5.74349799 378.015194439 Root MSE =.08407 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0535752.0243067 2.20 0.028.0057769.1013735 ln_bezrobo~e.0216356.0132625 1.63 0.104 -.0044446.0477157 ln_wyzsze -1.919923.7013023-2.74 0.006-3.299011 -.5408355 ln_mieszka~a.0662202.0079439 8.34 0.000.0505988.0818416 ln_place -.5450657.2015225-2.70 0.007 -.941353 -.1487783 zlobki_1 -.0105325.0106171-0.99 0.322 -.0314107.0103456 ln_social -.0105569.0077083-1.37 0.172 -.025715.0046012 ln_feminiz~a -1.081624.2446078-4.42 0.000-1.562637 -.6006111 obciazenie_1 -.0180974.0127831-1.42 0.158 -.043235.0070402 ln_malzens~a.532262.0551179 9.66 0.000.4238745.6406496 miejskosc_3m -.0211274.010891-1.94 0.053 -.0425442.0002893 ln_wyzsze_~e.2365871.0907393 2.61 0.009.0581512.4150229 _cons 10.86476 2.038971 5.33 0.000 6.855195 14.87433 6. Analiza zmiennej bezrobocie. Postanowiłyśmy rozkodować zmienna bezrobocie uwzględniając roczna stopę bezrobocia dla kraju za rok 2006, która wynosila14,8: 0 - poniŝej 14.8 1 - powyŝej 14.8 27
Otrzymałyśmy następujące wyniki:. xi: regress ln_urodzenia ln_aktywnosc bezrobocie_1 ln_wyzsze zlobki_1 ln_mieszkania ln_place > ln_social ln_feminizacja obciazenie_1 ln_malzenstwa miejskosc_3m ln_wyzsze_ln_place Source SS df MS Number of obs = 379 F( 12, 366) = 37.34 Model 3.16147761 12.263456467 Prob > F = 0.0000 Residual 2.58202039 366.007054701 R-squared = 0.5504 Adj R-squared = 0.5357 Total 5.74349799 378.015194439 Root MSE =.08399 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0503841.0245783 2.05 0.041.0020517.0987166 bezrobocie_1.0014246.0007776 1.83 0.068 -.0001045.0029537 ln_wyzsze -1.773355.6901621-2.57 0.011-3.130536 -.4161742 zlobki_1 -.0105948.0106033-1.00 0.318 -.0314457.0102562 ln_mieszka~a.0661836.0079213 8.36 0.000.0506067.0817606 ln_place -.5028097.1996047-2.52 0.012 -.8953258 -.1102936 ln_social -.0105986.0077001-1.38 0.170 -.0257407.0045434 ln_feminiz~a -1.064837.2452051-4.34 0.000-1.547025 -.5826493 obciazenie_1 -.0171084.0128241-1.33 0.183 -.0423266.0081097 ln_malzens~a.5368645.0553013 9.71 0.000.4281164.6456125 miejskosc_3m -.0210177.01088-1.93 0.054 -.0424127.0003774 ln_wyzsze_~e.2177658.0892179 2.44 0.015.0423218.3932098 _cons 10.47959 2.050666 5.11 0.000 6.44702 14.51215 Jak się okazało, zaproponowane przez nas rozkodowanie zmiennej bezrobocie nie przyniosło poprawy, postanowiłyśmy w dalszej pracy uwzględniać zmienna bezrobocie niezlogarytmowaną. 7. Eliminacja zmiennych. Patrząc na wyniki ostatniej regresji postanowiłyśmy usunąć zmienne zlobki_1 oraz obciąŝenie_1, poniewaŝ mimo wielu prób rozkodowania nadal pozostaje nieistotna. PoniŜej przedstawiamy wyniki ostatniej regresji juŝ bez tych zmiennych: a) zlobki. xi: regress ln_urodzenia ln_aktywnosc bezrobocie ln_wyzsze ln_mieszkania ln_place ln_social l > n_feminizacja obciazenie_1 ln_malzenstwa miejskosc_3m ln_wyzsze_ln_place Source SS df MS Number of obs = 379 F( 11, 367) = 40.65 Model 3.15443423 11.286766748 Prob > F = 0.0000 Residual 2.58906377 367.00705467 R-squared = 0.5492 Adj R-squared = 0.5357 Total 5.74349799 378.015194439 Root MSE =.08399 ln_urodzenia Coef. Std. Err. t P> t [95% Conf. Interval] ln_aktywnosc.0482784.0244877 1.97 0.049.0001245.0964323 bezrobocie.001455.000777 1.87 0.062 -.0000729.0029829 ln_wyzsze -1.869353.6834407-2.74 0.007-3.213304 -.5254015 ln_mieszka~a.0668968.007889 8.48 0.000.0513834.0824101 ln_place -.5332357.197268-2.70 0.007 -.9211531 -.1453183 ln_social -.0101689.0076881-1.32 0.187 -.0252871.0049494 ln_feminiz~a -1.09449.2434021-4.50 0.000-1.573128 -.6158522 obciazenie_1 -.0142386.0124983-1.14 0.255 -.0388158.0103387 ln_malzens~a.5417836.0550816 9.84 0.000.4334685.6500986 miejskosc_3m -.0210095.0108799-1.93 0.054 -.0424043.0003853 ln_wyzsze_~e.2299282.0883835 2.60 0.010.0561267.4037298 _cons 10.83386 2.019777 5.36 0.000 6.862075 14.80565 28