Statystyka lokalna w służbie ożywienia gospodarczego Wojciech Roszka Uniwersytet Ekonomiczny w Poznaniu. Piła, 31.05.2012; Współczesne środowisko gospodarcze czyli jak to robią w UE? Przewiduj i reaguj - zarządzanie zmianą w subregionie pilskim - projekt jest współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego
Społeczeostwo informacyjne Rosnące społeczne minima informacyjne Rosnące luki informacyjne: Cywilizacyjne Funkcjonalne Sytuacyjne Rosnący naturalny popyt na informację Rosnące koszty informacji Rosnący szum informacyjny Rozwój i upowszechnianie technologii informacyjnych służyć powinny minimalizacji luk informacyjnych
Gospodarka oparta na wiedzy Informacja - podstawowym czynnikiem wytwórczym, produktem, towarem i dobrem konsumpcyjnym Przemysłowa produkcja informacji Sektor informacyjny jednym z podstawowych sektorów gospodarki Publiczny sektor informacyjny Komercyjny sektor informacyjny Globalny rynek informacyjny i jego specyfika Jakość informacji - konflikt między publicznym i komercyjnym sektorem informacyjnym Poziom infrastruktury informacyjnej decyduje o rozwoju społecznym i gospodarczym
Demokracja zapewnia obywatelom społeczne bezpieczeństwo informacyjne Społeczne minima informacyjne cywilizacyjne funkcjonalne sytuacyjne Warunek bezpieczeństwa - informacja, jaką dysponują ludzie, podmioty społeczno gospodarcze i instytucje państwa, spełnia minima informacyjne Dostarczenie informacji adekwatnej do społecznych minimów informacyjnych jest niezbywalnym zadaniem państwa demokratycznego Państwo, które tych obowiązków nie wypełnia, nie jest państwem demokratycznym
Społeczny ład informacyjny Spójny system Społecznych norm informacyjnych Procesów informacyjnych Systemów informacyjnych Zasobów informacyjnych zapewniający obywatelom i podmiotom bezpieczeństwo informacyjne symetrię informacyjną między państwem a obywatelem i podmiotem społecznym lub gospodarczym
Wielka Brytania STATYSTYKA SĄSIEDZTWA
Statystyka sąsiedztwa Statystyka sąsiedztwa powstała w Wielkiej Brytanii w ramach przygotowao do spisu powszechnego w 2001 roku; Wykorzystuje ona dane spisowe, jak również dane z rejestrów administracyjnych i innych badao; Nowa metodologia mająca na celu stworzenie wskaźnika odrzucenia dla małych obszarów sąsiedztw ; Nowoczesne metody prezentacji danych z wykorzystaniem GIS;
Statystyka sąsiedztwa Zadania Wykrywanie nieprawidłowości w działaniu małych społeczności; Wskazywanie miejsc o szczególnie niskim poziomie życia; Wspomaganie lokalnych samorządów i przedsiębiorców.
Statystyka sąsiedztwa Okręgi badawcze w Anglii Jednostki administracji publicznej SOA wyższej warstwy - jeszcze nie utworzone Okręgi spisowe - średnia populacja: 6000 osób - utworzono 8800 okręgów SOA średniej warstwy - średnia populacja: 7200 osób - utworzono 7193 jednostki SOA niższej warstwy - składają się z 4 6 OA - średnia populacja: 1500 osób - utworzono 34378 jednostek Obszary wynikowe (Output Areas, OA) - docelowo 125 gospodarstw domowych, - średnia populacja: 300 osób - utworzono 175434 obszarów wynikowych Rekordy źródłowe (adresy)
Statystyka sąsiedztwa Udział poszczególnych domen w konstrukcji wskaźnika Zakresy merytoryczne (domeny) Anglia Irlandia Północna Szkocja Walia Dochody 0,225 0,25 0,28 0,25 Zatrudnienie 0,225 0,25 0,28 0,25 Opieka zdrowotna 0,135 0,15 0,14 0,15 Edukacja 0,135 0,15 0,14 0,15 Bariery w dostępie do mieszkań i usług 0,093 - - 0,1 Bliskość punktów usługowych - 0,1 - - Dostęp geograficzny - - 0,09 - Mieszkalnictwo - - 0,02 0,05 Środowisko życia 0,093 0,05 - - Środowisko fizyczne - - - 0,05 Przestępczość 0,093 0,05 0,05 - OGÓŁEM 1 1 1 1
Statystyka sąsiedztwa Różnice we wskaźnikach w krajach członkowskich Kraj Liczba domen Podstawowe obszary badawcze Średnia populacja obszaru Ranking odrzucenia (1=najbardziej ubogi) Anglia 7 SOA Niższej Warstwy 1500 1 do 32482 Irlandia Płn. 7 SOA 1900 1 do 890 Szkocja 7 Data Zones 750 1 do 6505 Walia 7 SOA Niższej Warstwy 1500 1 do 1896
Statystyka sąsiedztwa Mapa regionalnego zróżnicowania ubóstwa w krajach członkowskich Zjednoczonego Królestwa. Kolor najciemniejszy oznacza 20% najbardziej zubożonych rejonów, kolor najjaśniejszy oznacza 20% najmniej zubożonych.
Statystyka sąsiedztwa Prezentacja wyników http://neighbourhood.statistics.gov.uk
Statystyka sąsiedztwa Prezentacja wyników
Wojciech Roszka
Statystyka sąsiedztwa Prezentacja wyników
Statystyka sąsiedztwa Inne wyniki badao przykład prezentacji danych Anglia Londyn Westminster Westminster 001 Westminster 001A Kraj Region Dzielnica Londynu SOA średniej warstwy SOA niższej warstwy Populacja całkowita 49 138 831 7 172 091 181 286 6 332 1 603 Średnia wieku 38,6 35,95 37,28 39,74 40,99 Mediana wieku 37 34 34 36 39 Średnia godzin pracy w tygodniu (mężczyźni) Średnia godzin pracy w tygodniu (kobiety) Procent osób rasy czarnej pochodzenia karaibskiego 42,21 41,9 44,6 46,27 44,11 31,38 34,31 38,52 38,65 37,37 1,14 4,79 3,1 0,81 1,31
Statystyka sąsiedztwa Korzyści i perspektywy wiarygodne źródło informacji lokalnych; dostępnośd informacji; poprawa jakości danych; podstawa rozwoju małych domen; zwiększenie efektywności działao sektora publicznego i prywatnego;
Holandia ZINTEGROWANY SYSTEM STATYSTYKI PUBLICZNEJ
Idea integracji
Badania oparte na zintegrowanych źródłach danych Spis wirtualny w Holandii 2001
Badania oparte na zintegrowanych źródłach danych 1. Porównanie źródeł pokrycie rzetelność informacji 2. Reguły integracji korekty imputacja Na podstawie zintegrowanych źródeł danych utworzono tabele kontyngencji dla cech nieobserwowanych łącznie w żadnym ze zbiorów. 3. Klucze zastosowane w integracji rejestry: numery ubezpieczenia, NIP badania ankietowe: płeć, wiek, adres 4. Strategia integracji: optymalizacji liczby połączeń minimalizacja liczby błędnych połączeń
Polska PIERWSZE PRÓBY WYKORZYSTANIA REJESTRÓW ADMINISTRACYJNYCH
Wykorzystanie rejestrów administracyjnych w statystyce publicznej Klasyczne podejście do statystyki publicznej: Badania pełne bardzo wysokie koszty długi czas przeprowadzenia badania i analizy wyników przeprowadzane rzadko (raz na ok. 10 lat) Badania reprezentacyjne wysokie koszty brak możliwości tworzenia szacunków dla małych domen problemy z brakami odpowiedzi 24
Wykorzystanie rejestrów administracyjnych w statystyce publicznej Nowe podejście do statystyki publicznej: wykorzystanie rejestrów administracyjnych: stosunkowo niskie koszty pokrycie praktycznie całej populacji kraju dzięki wykorzystaniu nowoczesnych technologii informacyjnych przetwarzanie danych jest szybkie i tanie możliwe jest przeprowadzanie analiz na całej populacji generalnej z wysoką częstotliwością łączenie rejestrów ze sobą umożliwia uzyskanie szerokiego spektrum informacyjnego dla całej populacji kraju integracja źródeł administracyjnych z badaniami przeprowadzanymi przez organy statystyki publicznej 25
Wykorzystanie rejestrów administracyjnych w statystyce publicznej Tabela 1. Argumenty za oraz przeciw wykorzystania rejestrów administracyjnych w statystyce publicznej Argumenty ZA Niskie koszty pozyskania danych Szybkośd pozyskiwania danych Wysokie pokrycie informacyjne Pokrycie całej populacji Źródło: Opracowanie własne na podstawie Wallgren, Wallgren 2007 Argumenty PRZECIW Jakośd wyników jest gorsza niż w badaniach tradycyjnych Opóźnienia w przekazywaniu rejestrów od gestorów do organów statystyki publicznej Różne definicje zmiennych, problemy z kompatybilnością danych, brak kontroli nad poprawnością statystyczną Niebezpieczeostwo ujawnienia wrażliwych danych osobowych 26
Rejestr ZUS Zbiór danych jednostkowych o płatnikach składek oraz ubezpieczonych w Zakładzie Ubezpieczeo Społecznych Moment referencyjny: 31 stycznia 2010 Zmienne dotyczą: danych osobowych adresu zamieszkania wykonywanego zawodu rodzaju ubezpieczenia itp. Surowy zbiór zawiera 17 364 001 odpersonalizowanych rekordów 27
Rejestr ZUS Wyczyszczony zbiór danych zawierał: 16 214 456 unikatowych rekordów zmienne: kod terytorialny płed wiek status na rynku pracy 28
Struktura aktywności ekonomicznej ludności według rejestru ZUS i BAEL Wykres 1. Struktura ludności aktywnej zawodowo w Polsce w I kwartale 2010 na podstawie ZUS i BAEL (w tys. osób) 14000 12000 11104 12008 10000 8000 6000 4000 2000 0 1821 2994 37 573 1601 1155 204 2063 1839 985 ZUS BAEL I kw. 2010 Źródło: opracowanie własne Różnice wynikają m.in. z różnic definicyjnych oraz nieuwzględnienia w rejestrze ZUS osób ubezpieczonych w KRUS 29
Struktura aktywności ekonomicznej ludności według rejestru ZUS Wykres 2. Wskaźnik zatrudnienia w Polsce w przekroju powiatów, stan na 31.01.2010 wg rejestru ZUS Wykres 3. Stopa bezrobocia w Polsce w przekroju powiatów, stan na 31.01.2010 wg rejestru ZUS Źródło: opracowanie własne Źródło: opracowanie własne 30
Struktura aktywności ekonomicznej ludności według rejestru ZUS Wykres 4. Stopa bezrobocia wśród kobiet w przekroju powiatów, stan na 31.01.2010 wg rejestru ZUS Wykres 5. Stopa bezrobocia wśród ludności w wieku do 29 lat w przekroju powiatów, stan na 31.01.2010 wg rejestru ZUS Źródło: opracowanie własne Źródło: opracowanie własne 31
Struktura aktywności ekonomicznej ludności według rejestru ZUS Wykres 6. Stopa bezrobocia wśród kobiet w wieku do 29 lat w przekroju powiatów, stan na 31.01.2010 wg rejestru ZUS Wykres 7. Stopa bezrobocia wśród mężczyzn w wieku 45 lat i więcej w przekroju powiatów, stan na 31.01.2010 wg rejestru ZUS Źródło: opracowanie własne Źródło: opracowanie własne 32
ZUS - podsumowanie Rejestr ZUS zawiera informacje o aktywności ekonomicznej ludności Dane z rejestru umożliwiają szacowanie wyników na niskim poziomie agregacji przestrzennej i merytorycznej Rejestr ZUS, odpowiednio wyczyszczony, może byd dobrym źródłem informacyjnym dla statystyki publicznej 33
ZUS - podsumowanie Rejestr ZUS nie zawiera informacji o całej populacji ludności aktywnej zawodowo Ze względu na powyższe, liczba ludności aktywnej zawodowo jest niższa, a stopa bezrobocia jest wyższa niż w BAEL W celu pokrycia całej populacji należy dołączyd inne źródła, np. rejestr KRUS Rejestr ZUS nie zawiera informacji o ludności biernej zawodowo Rejestr ZUS nie pokrywa całej zawartości informacyjnej innych źródeł (np. BAEL) i w związku z tym może służyd jedynie jako źródło pomocnicze 34
Rejestr NFZ Zakres podmiotowy rejestru: osoby posiadające obywatelstwo paostwa członkowskiego Unii Europejskiej lub paostwa członkowskiego Europejskiego Porozumienia o Wolnym Handlu (EFTA); osoby nieposiadające obywatelstwa paostwa członkowskiego Unii Europejskiej lub paostwa członkowskiego Europejskiego Porozumienia o Wolnym Handlu (EFTA) na podstawie odrębnych przepisów szczegółowych; Zakres przedmiotowy rejestru obejmuje dwie grupy ubezpieczonych: Centralny Rejestr Członków Rodziny Ubezpieczonych Uprawnionych do Ubezpieczenia Zdrowotnego (ZUS); Centralny Wykaz Ubezpieczonych (NFZ)
Struktura zbioru Zbiór zawiera informacje o 38 740 372 osobach opisanych przez 44 zmienne, wśród których wyróżnid można: Płed; Datę urodzenia; Miejsce zameldowania/zamieszkania (do poziomu gminy włącznie); Tytuł uprawnienia do ubezpieczenia; Informacje o numerze PESEL i NIP (odpersonalizowane). 6 zmiennych nie posiadało braków danych 19 zmiennych posiadało do 10% braków danych 19 zmiennych posiadało ponad 10% braków danych (w tym 5 powyżej 80%)
Zastosowanie danych Wykres 4. Struktura zbioru NFZ ze względu na formę aktywności na podstawie kodów ubezpieczenia 18000000 16000000 14000000 16 938 465 15 861 337 14 037 044 12000000 10000000 8000000 6000000 4000000 2 901 421 2000000 0 Aktywni zawodowo pracujący Aktywni zawodowo bezrobotni Aktywni zawodowo ogółem Bierni zawodowo Źródło: opracowanie własne na podstawie rejestru NFZ oraz US Warszawa (2008)
Zastosowanie danych Wykres 5. Porównanie liczby pracujących, bezrobotnych i biernych zawodowo (w tys. osób) z rejestru NFZ oraz IV kwartału 2009 z badania BAEL BAEL NFZ 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 Aktywni zawodowo pracujący Aktywni zawodowo bezrobotni Aktywni zawodowo ogółem Bierni zawodowo Źródło: opracowanie własne na podstawie rejestru NFZ i BAEL
Zastosowanie danych Wykres 7. Stopa bezrobocia w Polsce w 2009 roku w przekroju powiatów wg rejestru NFZ Wykres 8. Odsetek ludności aktywnej ekonomicznie w Polsce w 2009 roku w przekroju powiatów wg rejestru NFZ Źródło: opracowanie własne na podstawie rejestru NFZ Źródło: opracowanie własne na podstawie rejestru NFZ
NFZ - podsumowanie Rejestr NFZ zawiera informacje o aktywności ekonomicznej ludności Dane z rejestru umożliwiają szacowanie wyników na niskim poziomie agregacji przestrzennej i merytorycznej Rejestr NFZ, odpowiednio wyczyszczony, może byd dobrym źródłem informacyjnym dla statystyki publicznej Rejestr NFZ wydaje się zawierad informacje o całej ludności aktywnej zawodowo. Na podstawie danych z rejestru NFZ można podjąd próbę szacowania każdej formy aktywności. Rejestr NFZ nie pokrywa całej zawartości informacyjnej innych źródeł (np. BAEL) i w związku z tym może służyd jedynie jako źródło pomocnicze
DZIĘKUJĘ ZA UWAGĘ