Wagi poststratyfikacyjne w Europejskim Sondażu Społecznym:

Podobne dokumenty
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wnioskowanie statystyczne. Statystyka w 5

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Pobieranie prób i rozkład z próby

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Praktyczne aspekty doboru próby. Dariusz Przybysz Warszawa, 2 czerwca 2015

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Estymacja punktowa i przedziałowa

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Metody Statystyczne. Metody Statystyczne.

Spis treści 3 SPIS TREŚCI

Rozkłady statystyk z próby. Statystyka

W1. Wprowadzenie. Statystyka opisowa

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Rozkłady statystyk z próby

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Monte Carlo, bootstrap, jacknife

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Metody probabilistyczne

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Analiza niepewności pomiarów

Prawdopodobieństwo i statystyka

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Model EWD dla II etapu edukacyjnego.

Grupowanie materiału statystycznego

STATYSTYKA MATEMATYCZNA

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

5. WNIOSKOWANIE PSYCHOMETRYCZNE

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

METODY STATYSTYCZNE. Studia stacjonarne, semestr zimowy 2017/2018. Motto III: In God we trust. All others must bring data (z internetu)

Metody doboru próby do badań. Dr Kalina Grzesiuk

STATYSTYKA wykład 5-6

W8. Metody doboru próby w badaniach rynkowych

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Oszacowanie i rozkład t

Wykład 2: Tworzenie danych

Metody probabilistyczne

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych

SYSTEMATYCZNOŚĆ BRAKÓW DANYCH W BADANIACH SONDAŻOWYCH. Jakub Rutkowski

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

METODY STATYSTYCZNE W BIOLOGII

Weryfikacja hipotez statystycznych

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Przykład zastosowania optymalnej alokacji w estymacji frakcji

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Statystyka w przykładach

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

laboratoria 24 zaliczenie z oceną

STATYSTYKA

WYKŁAD 5 TEORIA ESTYMACJI II

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Dokładne i graniczne rozkłady statystyk z próby

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Ważne rozkłady i twierdzenia c.d.

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

STATYSTYKA MATEMATYCZNA

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Komputerowa Analiza Danych Doświadczalnych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Trafność egzaminów w kontekście metody EWD

Estymacja parametrów rozkładu cechy

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

DOBÓR PRÓBY. Czyli kogo badać?

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Data wydruku: Dla rocznika: 2015/2016. Opis przedmiotu

O ŚREDNIEJ STATYSTYCZNEJ

Transkrypt:

Metodologiczne Inspiracje 2014 Badania ilościowe w naukach społecznych Wyzwania i problemy Wagi poststratyfikacyjne w Europejskim Sondażu Społecznym: możliwości i ograniczenia prawidłowego wykorzystania w analizach statystycznych Tomasz Żółtak Instytut Badań Edukacyjnych, IFiS PAN

Motywacje Publikacja oficjalnych wag poststratyfikacyjnych do badania ESS w kwietniu 2014 r. Dosyć uboga dokumentacja. Brak informacji o tym, że zastosowanie poststratyfikacji wpływa na wielkość błędów standardowych. Nie opublikowano danych koniecznych, aby móc uwzględnić wpływ poststratyfikacji na wielkości błędów standardowych. Dane te można uzyskać po zwróceniu się do autorów badania. Podziękowania dla Any Slavec i Vasji Vehovara za udostępnienie danych. Publikacja przez IFiS informacji pozwalających uwzględnić złożony dobór polskiej próby ESS przy szacowaniu błędów standardowych we wrześniu 2014 r.

Plan wystąpienia Reprezentatywność proceduralna i przedmiotowa Różne techniki poststratyfikacji Na co wpływa poststratyfikacja? Wpływ poststratyfikacji na oszacowania błędów standardowych w badaniu ESS 6 Wpływ uwzględnienia złożonego schematu doboru próby na oszacowania błędów standardowych w polskiej próbie badania ESS 6 Podsumowanie

Reprezentatywność proceduralna i przedmiotowa Teoria reprezentatywności proceduralnej: Reprezentatywność jako zachowanie pewnych formalne własności przez metodę losowego doboru próby. Odchylenia statystyk z próby od wartości populacyjnych są tu niejako naturalne są konsekwencją randomizacji. Stanowi podstawę do zastosowania odpowiednich metod wnioskowania statystycznego. Teoria reprezentatywności przedmiotowej: Reprezentatywność jako zgodność pewnych statystyk (rozkładów) z próby ze znanymi rozkładami populacyjnymi. Intuicyjnie zgodna z oczekiwaniami wielu badaczy i odbiorców badań. Nie operuje pojęciem błędu pomiaru brak podstaw do prowadzenia wnioskowania statystycznego.

Reprezentatywność proceduralna i przedmiotowa Co do zasady chcemy to połączyć oczekując, że: Zachowana będzie zgodność pewnych statystyk (rozkładów) z próby ze znanymi rozkładami populacyjnymi. Będziemy mieć podstawy do prowadzenia wnioskowania statystycznego. Czy to się daje zrobić? Na gruncie teorii reprezentatywności proceduralnej możemy znaleźć dwa problemy zbieżne z teorią reprezentatywności przedmiotowej: Wykorzystanie znanych informacji o populacji do zmniejszenia wariancji estymatorów. Korekta ew. obciążenia estymatorów w sytuacji występowania braków danych (niepełnej realizacji próby).

Reprezentatywność proceduralna i przedmiotowa Rozbieżności, o których zwykle nie pamiętamy Teoria reprezentatywności przedmiotowej Zakładamy, że uzgodnienie pewnych statystyk z próby ze znanymi wartościami populacyjnymi automatycznie podnosi jakość całej prób (również innych zmiennych). Skupiona na konkretnej próbie (pojedynczej realizacji). Teoria reprezentatywności proceduralnej Wpływ korygowania statystyk z próby jest bardzo lokalny może być bardzo różny dla różnych zmiennych i nie zawsze jest jednoznacznie pozytywny. Skupiona na własnościach estymatorów w ramach zbioru wszystkich możliwych prób.

Reprezentatywność proceduralna i przedmiotowa Jak rozumiemy słowo obciążenie (bias)? Teoria reprezentatywności przedmiotowej Obciążenie jako rozbieżność pomiędzy statystyką z próby i jej wartością populacyjną. Obciążenie jako różnica pomiędzy respondentami chętnymi a niechętnymi do współpracy. (za: Jaak Billiet, Hideko Matsuo, Koen Beullens, Vasja Vehovar. (2009). Non- Response Bias in Cross-National Surveys: Designs for Detection and Adjustment in the ESS. ASK Research & Methods Vol. 18(1): 3 43) Teoria reprezentatywności proceduralnej Obciążenie jako różnica pomiędzy wartością oczekiwaną estymatora (tj. statystyką określoną w zbiorze wszystkich możliwych prób) a wartością statystyki w populacji.

Reprezentatywność proceduralna i przedmiotowa Jak rozumiemy słowo obciążenie (bias)? Teoria reprezentatywności przedmiotowej Obciążenie jako rozbieżność pomiędzy statystyką z próby i jej wartością populacyjną. Czy wartość statystyki w pojedynczej próbie jest dobrą podstawą do przewidywania wartości oczekiwanej estymatora? Teoria reprezentatywności proceduralnej Obciążenie jako różnica pomiędzy wartością oczekiwaną estymatora (tj. statystyką określoną w zbiorze wszystkich możliwych prób) a wartością statystyki w populacji.

Reprezentatywność proceduralna i przedmiotowa Jak rozumiemy słowo obciążenie (bias)? Teoria reprezentatywności przedmiotowej Obciążenie jako rozbieżność pomiędzy statystyką z próby i jej wartością populacyjną. Czy wartość statystyki w pojedynczej próbie jest dobrą podstawą do przewidywania wartości oczekiwanej estymatora? Teoria reprezentatywności proceduralnej Obciążenie jako różnica pomiędzy wartością oczekiwaną estymatora (tj. statystyką określoną w zbiorze wszystkich możliwych prób) a wartością statystyki w populacji. Co jest obciążone/obciążone: estymator czy próba?

Niebciążoność a wariancja estymatora gęstość prawdopodobieństwa 1,0 0,8 0,6 0,4 0,2 Który estymator jest najlepszy? 0,0 3,8 4,2 4,6 5,0 5,4 5,8 6,2 est. nieobc. wartość estymatora est. obciążony 1 est. obciążony 2 wartość populacyjna wartość oczekiwana est. obciążonych 1 i 2 estymator obciążenie wariancja błąd średniokwadratowy nieobciążony 0 0,25 0,25 obciążony 1 0,2 0,16 0,20 obciążony 2 0,2 0,25 0,29

Niebciążoność a wariancja estymatora gęstość prawdopodobieństwa 1,0 Spośród dwóch estymatorów 0,8 obciążonego i nieobciążonego ten drugi jest 0,6 z pewnością lepszy tylko wtedy, gdy ma nie większą 0,4 wariancję, niż estymator obciążony, 0,2 z którym jest porównywany. 0,0 3,8 4,2 4,6 5,0 5,4 5,8 6,2 est. nieobc. wartość estymatora est. obciążony 1 est. obciążony 2 wartość populacyjna twierdzenia graniczne) wartość oczekiwana est. obciążonych 1 i 2 (oczywiście zakładając, że dla obu estymatorów działają estymator obciążenie wariancja błąd średniokwadratowy nieobciążony 0 0,25 0,25 obciążony 1 0,2 0,16 0,20 obciążony 2 0,2 0,25 0,29

Poststratyfikacja i pokrewne techniki Poststratyfikacja Przypisz obserwacjom wagi w ten sposób, aby ważony rozkład częstości zmiennej w próbie był taki sam, jak znany rozkład populacyjny (wszystkie wartości, jakie przyjmuje zmienna w populacji powinny pojawić się równieżw próbie). Wagi wieńcowe (raking) Kalibracja (calibration)

Poststratyfikacja i pokrewne techniki Poststratyfikacja Wagi wieńcowe (raking) Procedura poststratyfikacji kolejno ze względu na rozkład brzegowy każdej z kilku zmiennych zapętlana i kontynuowana do osiągnięcia zbieżności (zmian w wagach nie większych niż założony próg). Pozwala uniknąć problemów z zerowymi liczebnościami w rozkładach łącznych kilku zmiennych w próbie. Kalibracja (calibration)

Poststratyfikacja i pokrewne techniki Poststratyfikacja Wagi wieńcowe (raking) Kalibracja (calibration) Przypisz obserwacjom wagi w ten sposób, aby wartość statystyki z próby (ważona) była równa znanej wartości parametru danej zmiennej w populacji, jednocześnie minimalizując funkcję opisującą różnice wag przed i po ważeniu. Może być postrzegana jako uogólnienie poststratyfikacji. Różne warianty w zależności od wyboru funkcji opisującej różnice wag.

Cele poststratyfikacji (i technik pokrewnych) Redukcja obciążenia estymatorów związanego z odmowami odpowiedzi. Osiągana, jeśli zmienna wykorzystywana do poststratyfikacji jest w związku (im silniejszym, tym lepiej): z prawdopodobieństwem odmowy odpowiedzi, lub ze zmienną, której parametry estymujemy (zwiększenie precyzji choć stricte formalnie nie jest to redukcja obciążenia). Zwiększenie precyzji szacowania (zmniejszenie wariancji estymatorów). Osiągana, jeśli zmienna wykorzystywana do poststratyfikacji jest w związku (im silniejszym, tym lepiej): ze zmienną, której parametry estymujemy.

Redukcja obciążenia estymatorów związanego z odmowami odpowiedzi Łatwo jest: Znaleźć zmienne, które pozwalają uzyskać redukcję obciążenia (choć niekoniecznie dużą). Uwzględnić ważenie w analizach (wystarczy estymując parametry przypisać jednostkom wyliczone wagi). Problemy: Redukcja obciążenia nie musi iść w parze ze zwiększeniem precyzji szacowania (a czasem może wręcz przyczyniać się do zmniejszenia precyzji). W praktyce trudno ocenić, jaka jest skala redukcji obciążenia.

Zwiększenie precyzji szacowania Pozytywy: Można dosyć dokładnie ocenić, jaki jest wpływ ważenia na precyzję szacowania. Problemy: Wpływ ważenia bardzo zróżnicowany w zależności od zmiennej, której parametry są szacowane. Ważenie ze względu na zmienne słabo powiązane ze zmienną, której parametry są szacowane może wręcz zmniejszać precyzję szacowania. Aby uwzględnić wpływ ważenia na precyzję trzeba zastosować specjalne techniki szacowania błędów standardowych.

Zwiększenie precyzji szacowania Uwzględnienie wpływu ważenia na precyzję szacowania wymaga: Informacji o wartościach wag przed (jeśli zastosowano złożony schemat doboru próby) i po poststratyfikacji. Zastosowania odpowiednich technik statystycznych (oprogramowania).

Wpływ poststratyfikacji na oszacowania błędów standardowych w badaniu ESS 6 Dane z ESS 6 (2012). Uwzględniono dwa kraje (Dania, Szwecja), w których próba losowa dobrana została w sposób prosty. Brak problemów z uwzględnieniem złożonego schematu doboru próby. Poziom realizacji: Dania: 49,06%. Szwecja: 52,44%. Oficjalna poststratyfikacja (raking) ESS ze względu na: Dania: łączny rozkład płci, kategorii wieku i edukacji oraz podział na 5 regionów. Szwecja: łączny rozkład płci, kategorii wieku i edukacji oraz podział na 8 regionów.

Wpływ poststratyfikacji na oszacowania błędów standardowych w badaniu ESS 6 Analizowany był wpływ na precyzję oszacowań następujących sposobów analizy: bez poststratyfikacji, naiwna poststratyfikacja, uwzględniająca wagi przy wyliczaniu wartości estymatorów punktowych, ale nieuwzględniająca wpływu zróżnicowania wag na wariancję estymatorów, pełna poststratyfikacja, uwzględniająca również wpływ na wariancję estymatorów (przy użyciu pakietu survey, w programie R).

Wpływ poststratyfikacji na oszacowania błędów standardowych w badaniu ESS 6 zmienna wiek lata nauki zaufanie do parlamentu (0-10) samookreślenie na skali lewicaprawica (0-10) głosowanie na socjaldemokrację (0 nie, 1 -tak) poststratyfikacja Dania Szwecja średnia bł. std. (1) średnia bł. std. (1) bez 48,70 0,47 47,83 0,44 naiwna 0,47 1,00 0,44 1,00 50,07 46,94 pełna 0,18 0,39 0,15 0,34 bez 13,01 0,128 12,85 0,079 naiwna 0,126 0,98 0,082 1,05 12,61 13,01 pełna 0,114 0,89 0,048 0,62 bez 6,10 0,055 5,93 0,054 naiwna 0,055 1,01 0,054 1,00 6,01 5,96 pełna 0,057 1,03 0,053 0,99 bez 5,34 0,060 5,31 0,053 naiwna 0,060 1,00 0,053 1,00 5,40 5,33 pełna 0,063 1,06 0,055 1,04 bez 0,22 0,010 0,25 0,010 naiwna 0,010 1,02 0,010 0,98 0,23 0,23 pełna 0,011 1,10 0,010 0,97 (1) = bł. std.(przy poststratyfikacji) / bł. std. (bez poststratyfikacji)

Wpływ uwzględnienia złożonego schematu doboru próby w polskiej próbie badania ESS 6 Dobór próby ESS w Polsce: Warstwowo łącznie 150 warst: Alokacja do warstw proporcjonalna do liczby ludności i odwrotnie proporcjonalna do przewidywanego poziomu realizacji. W 86 warstwach miastach powyżej 50 tys. mieszkańców dobór prosty, bez zwracania. W 64 warstwach wyznaczanych przez przecięcie województwa z rodzajem gminy (miejska, wiejska, część wiejska gminy m-w, część wiejska gminy m-w) dobór dwustopniowy z losowaniem: miejscowości bezzwrtonie z prawdopodobieństwem proporcjonalnym do liczby ludności w ramach miejscowości proste losowanie bez zwracania wiązek czteroosobowych. Oszacowany wskaźnik efektywności schematu deffp = 1,02. Poziom realizacji: 74,87%.

Wpływ uwzględnienia złożonego schematu doboru próby w polskiej próbie badania ESS 6 zmienna wiek lata nauki zaufanie do parlamentu (0-10) samookreślenie na skali lewicaprawica (0-10) głosowanie na socjaldemokrację metoda estymacji Polska średnia bł. std. (1) (2) jak dla doboru prostego 0,44 46,10 z uwzgl. schematu 0,42 0,96 ze schematem i poststrat. 47,29 0,18 0,40 0,42 jak dla doboru prostego 0,081 12,23 z uwzgl. schematu 0,078 0,96 ze schematem i poststrat. 12,16 0,075 0,92 0,96 jak dla doboru prostego 0,055 2,95 z uwzgl. schematu 0,056 1,03 ze schematem i poststrat. 2,95 0,057 1,04 1,01 jak dla doboru prostego 0,060 5,67 z uwzgl. schematu 0,060 1,01 ze schematem i poststrat. 5,67 0,062 1,03 1,03 jak dla doboru prostego 0,005 0,04 z uwzgl. schematu 0,004 0,95 ze schematem i poststrat. 0,04 0,004 0,97 1,02 (1) = bł. std.(~) / bł. std. (jak dla doboru prostego) (2) = bł. std.(z uwzgl. schematu) / bł. std. (z uwzgl. schematu i poststrat.)

Podsumowanie Poststratyfikacja nie zawsze pozwala poprawić jakość przewidywania wartości populacyjnych. Czasem należy wręcz podejrzewać, że pogarsza (wzrost wariancji estymatorów). Ogólnie rzecz biorąc wpływ poststratyfikacji na wyniki analiz danych ESS jest niewielki zarówno w kategoriach zmiany oszacowań punktowych jak i ich błędów standardowych - jeśli pominąć zmienne bezpośrednio związane ze zmiennymi wykorzystanymi do poststratyfikacji. Czy warto uwzględniać poststratyfikację w analizach ESS? Potwierdza się wysoka efektywność polskiego schematu doboru próby do badania ESS.

Dziękuję za uwagę! t.zoltak@ibe.edu.pl