Uniwersytet Ekonomiczny w Poznaniu Wydział Informatyki i Gospodarki Elektronicznej Streszczenie pracy doktorskiej Estymacja pośrednia ubóstwa na poziomie regionalnym i lokalnym w Polsce Autor: mgr Łukasz Wawrowski Promotor: dr hab. Grażyna Dehnel, prof. nadzw. UEP Poznań 2017
Celem dysertacji jest pomiar ubóstwa na poziomie podregionów i powiatów w Polsce z wykorzystaniu statystyki małych obszarów. Przeprowadzone badania empiryczne potwierdzają, że estymacja ubóstwa z wykorzystaniem zmiennych pomocniczych z innych źródeł cechuje się lepszą jakością w porównaniu do estymacji bezpośredniej. W przeszłości wielu badaczy podejmowało problem zdefiniowania zjawiska niedostatku. Można w tym miejscu przywołać polskiego ekonomistę, profesora Jana Drewnowskiego, który łączył ubóstwo z niezaspokojeniem potrzeb na oczekiwanym poziomie [Drewnowski 1977]. Z kolei Amartya Sen, indyjski ekonomista i laureat Nagrody Banku Szwecji im. Alfreda Nobla, wskazał, że ubóstwo to nie tylko niedostępność określonych dóbr i usług, ale także brak możliwości uczestnictwa w podejmowaniu decyzji oraz udziału w życiu społecznym i kulturalnym [Sen 1992]. Rada Europejskiej Wspólnoty Gospodarczej (WE) w dokumencie z dnia 19 grudnia 1984 roku w sprawie działań mających na celu przeciwdziałanie ubóstwu zdefiniowała to zjawisko w następujący sposób: ubóstwo odnosi się do osób, rodzin lub grup osób, których zasoby (materialne, kulturowe i społeczne) są ograniczone w takim stopniu, że poziom ich życia obniża się poza akceptowalne minimum w kraju zamieszkania [EEC 1985]. Pomiar niedostatku bazuje na dwóch podstawowych wskaźnikach: stopie ubóstwa oraz głębokości ubóstwa. Pierwsza z tych miar informuje o odsetku ubogich w populacji. Wskaźnik ten jest prosty w budowie i interpretacji, niemniej posiada kilka wad. Przede wszystkim, nie bierze pod uwagę intensywności ubóstwa osoby znajdujące się poniżej granicy ubóstwa mogą mieć dochody bardzo zbliżone do tej granicy lub bardzo oddalone. W obu przypadkach stopa ubóstwa będzie taka sama, natomiast niewątpliwie większa bieda występuje w drugiej sytuacji. Uzupełnieniem stopy ubóstwa jest głębokość ubóstwa, która informuje o poziomie ubóstwa wśród osób znajdujących się poniżej linii ubóstwa. Oznacza to zatem, że pełniejszy obraz zjawiska otrzymamy prowadząc analizę opartą na obu wymienionych wskaźnikach [Haughton i Khandker 2009]. Badania empiryczne prowadzone w Polsce dostarczają informacji na temat biedy na bardzo ogólnym poziomie. Głównym źródłem oszacowań wskaź- 1
ników ubóstwa są badania reprezentacyjne prowadzone przez GUS takie jak Badanie Budżetów Gospodarstw Domowych (BBGD) oraz Europejskie Badanie Dochodów i Warunków Życia (EU-SILC). Jak dotąd wartości wskaźników ubóstwa publikowane są na poziomie całego kraju, w przekroju regionów oraz wybranych grup społeczno-demograficznych. Wielkość próby, jak również wykorzystywana obecnie metoda szacunku jaką jest estymacja bezpośrednia nie pozwalają na publikację wyników na niższych poziomach agregacji z powodu wysokich błędów oszacowań. Ponadto z roku na rok coraz więcej osób odmawia udziału w badaniach reprezentacyjnych. Wskaźnik braku realizacji wywiadu w przypadku badania EU-SILC w 2006 roku wynosił 48%, a w roku 2014 już 63% [GUS 2015]. Równolegle do obserwowanych spadków wskaźników realizacji badań reprezentacyjnych rosną potrzeby odbiorców informacji. Oczekuje się danych dla szczegółowych przekrojów oraz coraz mniejszych jednostek administracyjnych czy terytorialnych. W rozprawie do estymacji wskaźników ubóstwa na poziomie podregionów i powiatów zostały wykorzystane dwa typy modeli: obszarowe oraz jednostkowe. Bazują one na estymacji danej zmiennej zależnej za pomocą liniowego modelu mieszanego zawierającego efekt losowy przyporządkowany zazwyczaj do określonego stopnia podziału administracyjnego [Rao i Molina 2015]. W podejściu obszarowym zmienną zależną jest wskaźnik ubóstwa mierzony na określonym poziomie terytorialnym, a podejściu jednostkowym dochód gospodarstwa domowego. Natomiast po drugiej stronie równania znajdują się tzw. zmienne pomocnicze informacje silnie skorelowane ze zmienną zależną pochodzące z dodatkowego źródła danych [Guadarrama et al. 2016]. W badaniu kluczową rolę przy budowie modelu wykorzystanego w estymacji, odegrała identyfikacja symptomów ubóstwa. Pełniły one w procesie modelowania rolę informacji pomocniczej. Wskazanie cech stanowiących determinanty ubóstwa pozwoliło na stworzenie bazy tzw. zmiennych pomocniczych. Wśród najistotniejszych symptomów ubóstwa znalazły się takie cechy jak: źródło utrzymania gospodarstwa, liczebność gospodarstwa, wykształcenie członków gospodarstwa domowego czy występowanie w nim osób bezrobotnych bądź niepełnosprawnych [Czapliński i Panek 2011]. W dobie powszechnego dostępu do Internetu wskazuje się, że do szacowania ubóstwa 2
można wykorzystać dane z serwisów społecznościowych, a źródłem zmiennych pomocniczych mogą być chociażby serwisy z mapami [Marchetti et al. 2016]. Możliwe jest także wykorzystanie nocnych zdjęć satelitarnych [Elvidge et al. 2009]. Proces estymacji wskaźników ubóstwa poprzedzono empirycznym badaniem jakości danych pochodzących z badania EU-SILC. Wykazano, że znaczna część informacji dotyczących dochodów respondentów jest w nim imputowana. Z racji tego, że cechy te stanowią podstawę estymacji wskaźników ubóstwa, bardzo ważna jest świadomość pochodzenia tych danych. Przeprowadzona analiza stanowi przyczynek do dalszych badań nad zagadnieniem informative nonresponse [Laaksonen i Chambers 2006]. W pracach nad podejściem obszarowym do estymacji stopy oraz głębokości ubóstwa, przeanalizowano wpływ transformacji zmiennej zależnej na jakość oszacowań. Uwagę poświęcono przekształceniu z zastosowaniem pierwiastka arcus sinusa, która w założeniu ma stabilizować wariancję oszacowań bezpośrednich oraz zapewnić wyniki z przedziału [0, 1] [Burgard et al. 2016]. Badania symulacyjne wykazały, że pomimo pierwotnej poprawy własności rozkładu zmiennej zależnej, oszacowania pośrednie charakteryzowały się większym obciążeniem w porównaniu do modelu, w którym wskaźnik ubóstwa nie był transformowany. W toku prac ustalono, że najlepszymi własnościami pod względem precyzji, obciążenia oraz poprawności modelu na poziomie podregionów charakteryzuje się model Faya-Herriota z przestrzennie skorelowanym efektem losowym (SEBLUP) [Pratesi i Salvati 2008]. Wykorzystanie tego estymatora na poziomie powiatów nie pozwoliło na uzyskanie precyzyjnych oszacowań. W związku z tym zastosowano podejścia jednostkowe: metodę EB [Molina i Rao 2010] oraz MQ [Chambers i Tzavidis 2006]. Techniki te bazujące na generowaniu pseudo-populacji metodą Monte Carlo charakteryzowały się lepszymi własnościami w porównaniu do podejścia obszarowego. Z wykorzystaniem metod statystyki małych obszarów dostarczono precyzyjnych oszacowań stopy oraz głębokości ubóstwa na poziomie powiatów. O ile wcześniej podejmowane były próby estymacji stopy ubóstwa w przekroju podregionów i powiatów, tak wartości głębokości ubóstwa były publikowane wyłącz- 3
nie w wybranych przekrojach społeczno-demograficznych. Uzyskane wyniki istotnie rozszerzają szczegółowość dostępnych informacji, co stanowi novum rozprawy. Bardzo ważnym zagadnieniem w statystyce małych obszarów jest merytoryczna analiza oszacowań. W przypadku stopy oraz głębokości ubóstwa nie są znane prawdziwe wartości tych cech w populacji. W związku z tym stosuje się podejście polegające na porównaniu wyników estymacji pośredniej do tzw. zmiennych proxy. Przyjmuje się, że cechy te mogą stanowić pewne przybliżenie szacowanych parametrów. W dysertacji zaproponowano podejście polegające na wykorzystaniu danych dotyczących bezrobocia oraz pomocy społecznej pochodzących z rejestrów administracyjnych w celu oceny oszacowań. Wykazano, że korelacja pomiędzy oszacowaniami pośrednimi, a zmiennymi proxy jest wyższa, niż w przypadku oszacowań bezpośrednich. Ponadto, pozytywnie zweryfikowano hipotezę mówiącą o związku pomiędzy poziomem ubóstwa mierzonym stopą i głębokością ubóstwa, a sytuacją na rynku pracy. Relacja ta jest wyraźniejsza w ujęciu lokalnym, na poziomie powiatów, aniżeli w przekroju podregionów. W pracy zaproponowano także wykorzystanie metod porządkowania liniowego w ocenie oszacowań pośrednich. Na podstawie rankingów skonstruowanych dla wartości stopy oraz głębokości ubóstwa przy wykorzystaniu uogólnionej miary odległości (GDM) weryfikowano zgodność pozycji zajmowanych przez poszczególne domeny. Przeprowadzona analiza wykazała istnienie silnej korelacji pomiędzy modelowymi oszacowaniami wskaźników ubóstwa a rankingiem utworzonym wyłącznie na podstawie zestawu cech diagnostycznych. Potwierdzono także hipotezę badawczą mówiącą o wyraźnym zróżnicowaniu przestrzennym ubóstwa. Południowo-wschodnia część kraju charakteryzuje się wyższymi wartościami wskaźników ubóstwa w porównaniu do zachodniej części Polski. Zaobserwowano także, że ośrodki miejskie oraz przylegające do nich powiaty są mniej narażone na występowanie zjawiska ubóstwa aniżeli powiaty znacznie oddalone od dużych miast. Na podstawie otrzymanych wyników przeprowadzono także klasyfikacje podregionów i powiatów na grupy charakteryzujące się niskim, przeciętnym oraz wysokim poziomem ubóstwa. Na podstawie wartości statystyki Morana I stwier- 4
dzono występowanie umiarkowanej autokorelacji przestrzennej wskaźników ubóstwa. Otrzymane wyniki będą mogły stanowić składową obrazu spójności społecznej Polski w ujęciu regionalnym i lokalnym. Kartogramy zawarte w pracy umożliwiają identyfikację obszarów najbardziej narażonych na występowanie zjawiska ubóstwa. Z kolei wypracowana metodyka może zostać wykorzystana jako narzędzie ewaluacji w prowadzonych obecnie przedsięwzięciach takich jak Europa 2020, Krajowy Program Reform, Agenda Post-2015 czy Krajowy Program Przeciwdziałaniu Ubóstwu i Wykluczeniu Społecznemu 2020. Nowy wymiar aktywnej integracji mających na celu zmniejszenie poziomu ubóstwa. Wnioski uzyskane na podstawie przeprowadzonych badań będą mogły służyć jako informacja dla władz samorządowych w kontekście planowania efektywnej polityki społecznej. Literatura Burgard, J. P., Münnich, R., i Zimmermann, T. (2016). Impact of Sampling Designs in Small Area Estimation with Applications to Poverty Measurement, pages 83 108. John Wiley and Sons, Ltd. Chambers, R. i Tzavidis, N. (2006). M-quantile models for small area estimation. Biometrika, 93(2):255 268. Czapliński, J. i Panek, T. (2011). Wykluczenie społeczne. diagnoza społeczna 2011 warunki i jakość Życia polaków - raport. Contemporary Economics, 5(3):328 352. http://ce.vizja.pl/en/issues/volume/5/issue/ 3#art214. Drewnowski, J. (1977). Poverty: its meaning and measurement. Development and Change, 8:183 208. EEC (1985). On specific community action to combat poverty. Official Journal of the EEC, 2(24). 5
Elvidge, C. D., Sutton, P. C., Ghosh, T., Tuttle, B. T., Baugh, K. E., Bhaduri, B., i Bright, E. (2009). A global poverty map derived from satellite data. Computers and Geosciences, 35(8):1652 1660. Guadarrama, M., Molina, I., i Rao, J. N. K. (2016). A comparison of small area estimation methods for poverty mapping. STATISTICS IN TRANS- ITION new series and SURVEY METHODOLOGY. Joint Issue: Small Area Estimation 2014, 17(1):41 66. GUS (2015). Dezagregacja wskaźników strategii Europa 2020 na poziom NTS 2 z zakresu pomiaru ubóstwa i wykluczenia społecznego. Praca Badawcza Statystyka dla polityki spójności. http://stat.gov.pl/download/gfx/portalinformacyjny/pl/ defaultstronaopisowa/5803/1/1/raport_metodologiczny.pdf. Haughton, J. i Khandker, S. R. (2009). Handbook on Poverty and Inequality. The World Bank, Washington. Laaksonen, S. i Chambers, R. (2006). Survey estimation under informative nonresponse with follow-up. Journal of Official Statistics, 22(1):81-95. Marchetti, S., Giusti, C., i Pratesi, M. (2016). The use of twitter data to improve small area estimates of households share of food consumption expenditure in italy. AStA Wirtschafts- und Sozialstatistisches Archiv, 10(2):79 93. Molina, I. i Rao, J. N. K. (2010). Small area estimation of poverty indicators. Canadian Journal of Statistics, 38(3):369 385. Pratesi, M. i Salvati, N. (2008). Small area estimation: the eblup estimator based on spatially correlated random area effects. Statistical Methods and Applications, 17(1):113 141. Rao, J. N. K. i Molina, I. (2015). Small Area Estimation. John Wiley and Sons, Inc. Sen, A. (1992). Inequality reexamined. Harvard University Press, Cambridge. 6