STATYSTYKA PUBLICZNA Warsztaty, cz. V www.stat.gov.pl dr Kazimierz Kruszka k.kruszka@stat.gov.pl k.kruszka@neostrada.pl
V. Jakie bariery i pułapki mogą pojawić się przy korzystaniu z danych statystycznych? Metadane statystyczne Porównywalność danych Reprezentatywność wyników badań statystycznych Błędy w analizie oraz w interpretacji i prezentacji danych
Metadane statystyczne (1) Metadene to dane o danych ( informacja o informacji ). Z reguły są to definicje i opisy danych. Metadane powinny ułatwić użytkownikom zrozumienie zakresu informacyjnego poszczególnych zbiorów danych oraz ich ocenę pod względem indywidualnych potrzeb, a także stwarzać możliwość wyszukiwania odpowiednich danych. Forma ujęcia metadanych jest w praktyce bardzo zróżnicowana, poczynając od tradycyjnych opisów cząstkowych (np. tzw. uwagi ogólne i metodyczne w publikacjach statystycznych), przez rozmaite katalogi (np. biblioteczne), po systemy metadanych. W Polsce rozwija się System Metadanych Statystycznych (SMS) w ramach Systemu Informacyjnego Statystyki Publicznej (SISP).
Metadane statystyczne (2) Podział metadanych statystycznych (wg propozycji Eurostatu) Metadane badania metadane opisujące badania statystyczne. Metadane definicyjne metadane opisujące pojęcia i główne założenia, np. klasyfikacje, elementy słownika pojęć, pytania i zestawy pytań (precedensy). Metadane metodyczne metadane odwołujące się do metodyki procesu produkcji statystyki, np. dobór próby, metody zbierania danych, procesy edycji. Metadane systemowe metadane wykorzystywane podczas przetwarzania danych, np. identyfikujące publikacje, zbiory i bazy danych, daty modyfikacji, rozmiary zbiorów, metody dostępu do baz danych, mapowania pomiędzy nazwami logicznymi i fizycznymi, notki dla poszczególnych komórek. Metadane operacyjne metadane powstające w wyniku implementacji procedur, np. czasy realizacji zapytań, częstotliwość błędów systematycznych. Metadane jakościowe wskaźniki opisujące jakość statystyki (użyteczność, dokładność, terminowość i punktualność, dostępność i przejrzystość porównywalność, spójność). http://www.stat.gov.pl/gus/definicje_plk_html.htm
Porównywalność danych Istotą statystyki jest porównanie (S. Waszak) Porównania różnicowe (o ile?) i stosunkowe (ile razy?) Porównywalność formalna i merytoryczna Porównania w czasie (dynamiczne) Porównania w przestrzeni (geograficzne) Porównania między dziedzinami
Reprezentatywność wyników badań statystycznych Populacja i próba Próba reprezentacyjna Poziom istotności i poziom ufności Precyzja wyniku oszacowania Przykłady badań reprezentacyjnych w statystyce publicznej Budżety gospodarstw domowych Budżety czasu Aktywność ekonomiczna ludności (BAEL) Elementy spisów powszechnych Rozkłady dochodów i wynagrodzeń
Błędy w analizie oraz w interpretacji i prezentacji danych Każda liczba w statystyce jest obciążona błędem. Rzecz w tym, by znać jego rodzaj, rozmiary i miejsce powstania. Błędy przypadkowe i systematyczne Błędy w doborze metod oraz interpretacji wyników analizy statystycznej - Nieadekwatność metody - Niewłaściwa interpretacja wartości średnich - Nadwymiarowość wniosków z analizy Błędy w tabelarycznej i graficznej prezentacji danych Konieczność publikowania metadanych Nieodzowność kontroli w każdym etapie badania statystycznego
ANEKS do cz. V Pytania kontrolne 1. Średnie wynagrodzenie w pewnym przedsiębiorstwie wynosiło 2344 zł. Jak to należy rozumieć? 2. Stopa bezrobocia w pewnym powiecie w styczniu 2011 r. wynosiła 25%. Czy można powiedzieć, że co czwarty mieszkaniec tego powiatu był bezrobotny? 3. Co można powiedzieć o podanych dalej dwóch tablicach i dwóch wykresach?
Tabl. 1. Niektóre charakterystyki warunków mieszkaniowych w latach 1990 i 2000
Tabl. 1. Wybrane charakterystyki ludności Poznania w latach 1990 i 2000 1990 2000 WYSZCZEGÓLNIENIE Ludność w tys. 590,1 574,9 Urodzenia żywe 6356 4619 Zgony 6978 5910 Przyrost naturalny 622 1291 Saldo ruchu wędrówkowego 2008 359 Współczynniki: przyrostu naturalnego 1,1 2,3 małżeństw 6 5,4 rozwodów 1,7 1,9 feminizacji 113 115
śr. wojew. = 107,1 Średnia stopa bezrobocia Zróżnicowanie stopy bezrobocia i jej dynamiki w powiatach Wielkopolski w latach 2000-2004 30 25 złotowski wągrowiecki czarnkowsko-trzcianecki jarociński chodzieski koniński słupecki pleszewski kolski gnieźnieński 20 krotoszyński turecki ostrowski Konin gostyński obornicki międzychodzki pilski wrzesiński średzki 15 śr. wojew. = 15,2 wolsztyński Kalisz ostrzeszowski rawicki kaliski nowotomyski Leszno leszczyński kościański szamotulski śremski 10 kępiński grodziski poznański Poznań 5 95 100 105 110 115 120 125 Średnia dynamika (%)
DZIĘKUJĘ I ŻYCZĘ SUKCESÓW W ZMAGANIACH ZE STATYSTYKĄ