Międzyosobowa zgodność odpowiedzi w badaniach ankietowych Zróżnicowanie poglądów w perspektywie wewnątrz- i międzykrajowej Tadeusz Krauze (Hofstra University) Przemek Powałko (IFiS PAN) Kazimierz M. Słomczyński (IFiS PAN, The Ohio State University) Metodologiczne Inspiracje 2016: Badania Ilościowe w Naukach Społecznych Wyzwania i Problemy 28-30 września 2016, Jabłonna
Główne tematy Kontekst badania Zróżnicowanie opinii publicznej Pojęcie Pomiar Struktura 2
Kontekst badania Makroskop globalne dane na określony temat (np. zdrowie, edukacja, opinia publiczna) dla dużej liczby państw Dane z projektu Wartości demokratyczne a zachowania protestacyjne: harmonizacja danych, porównywalność pomiaru i modelowanie wielopoziomowe w perspektywie międzykrajowej 1721 sondaży z lat 1966-2013 142 kraje/terytoria 2.2 miliony respondentów średnio 228 pytań w kwestionariuszu 3
Różnice i zróżnicowania Różnice na poziomie mikro niezgodność odpowiedzi pary respondentów (i, j) na pytanie k Różnice na poziomie mezo pojęcie kontroweryjności pytania k i pojęcie odległości między respondentami i, j Różnice na poziomie makro niezgodność między wszystkimi respondentami na wszystkie pytania (dyssensus) 4
Pomiar zróżnicowania (diagram przemienny) Niezgodność odpowiedzi pary respondentów (i, j) na pytanie k d(i, j, k) d(,, k) Kontrowersyjność pytania k Odległość między parą respondentów (i, j) d(i, j, ) d(,, ) Niezgodność wszystkich par respondentów na wszystkie pytania (dyssensus) konwencja sumacyjna: a( ) = n i=1 a(i) 5
Wskaźnik niezgodności d(i, j, k) Definicja: gdzie d i, j, k = ind(x i, k x j, k ) i, j = 1,, m numer respondenta; m liczba respondentów k = 1,, n numer pytania; n liczba pytań x(i, k) odpowiedź respondenta i na pytanie k 0, jeżeli z = 0 ind z = 1, jeżeli z 0 d i, j, k oznacza zgodność (0) lub niezgodność (1) odpowiedzi pary respondentów (i, j) na pytanie k 6
Analiza odległości d(i, j, ) d(i, j, ) spełnia aksjomaty odległości Zastrzeżenie: i j d i, j, 0 011 111 d(i, j, ) są sumą jedynek ciągu zerojedynkowego mającego n wyrazów; takie ciągi są punktami w n-wymiarowej przestrzeni Hamminga H n 001 010 101 110 000 100 7
Rozkład odległości f(r) Dla r = 0,, n, funkcja f(r) = i, j : d i, j, = r f 0 > 0 NUR (non-unique record) f n > 0 POR (polar-opposite record) Po eliminacji zmiennych technicznych i metryczkowych, w zbiorze 1721 sondaży znaleziono 5893 NUR-ów (nieprecyzyjnie mówiąc: duplikatów) Bycie NUR-em jest relacją przechodnią, podczas gdy bycie POR-em nie jest 8
f(r) f(r) Przykładowe rozkłady odległości ESS/6 IS (m=752, n=67) ESS/6 RU (m=2484, n=67) 25000 250000 20000 200000 15000 150000 10000 100000 5000 50000 0 0 10 20 30 40 50 60 0 0 10 20 30 40 50 60 r r 9
Kontrowersyjność pytań d(,, k) Miara kontrowersyjności pytania k jest liczbą niezgodnych odpowiedzi na pytanie k wśród wszystkich par respondentów (i, j) Wskaźnik kontrowersyjności pytania k c(k) = d,, k m m 1 Możliwość uporządkowania pytań ze względu na kontrowersyjność; krzywa Lorenza; indeks Giniego 10
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 fplvdm gvspcdm cttresa clsprty freehms chpldm fairelc implvdm meprinf imsmetn rghmgpr gvexpdc dclvlf ctstogv lchshcp impcntr imdfetn medcrgv oppcrgv polintr gincdif gvctzpv lfwrs nhpftr grdfinc imvtctz stflife votedir trstplc gptpelc stfedu dfprtal oppcrgvc pplfair fairelcc imwbcnt lrscale medcrgvc pplhlp dmcntov imueclt ppltrst dspplvt imbgeco trstun dspplvtc meprinfc pltaviec rghmgprc stfdem stfhlth trstplt trstprt pltavie stfeco trstlgl trstprl cttresac dfprtalc euftf gvctzpvc stfgov trstep grdfincc gvexpdcc votedirc gptpelcc c(k) Zmienne Kontrowersyjność 67 pytań w ESS/6 Islandia 0.0 0.2 0.4 0.6 0.8 1.0 Krzywa Lorenza (Gini=0.11) 11
Maksymalny dyssensus Największa możliwa liczba niezgodnych odpowiedzi na pytanie k D max (k) = m 2 [ s v u 2 + v u + 1 2 ] gdzie s liczba możliwych odpowiedzi na pytanie k m = su + v = s v u + v u + 1 gdzie 0 v < s D max ( ) nazywamy maksymalnym dyssensusem sondażu 12
Całkowity dyssensus w sondażu d(,, ) d(,, ) = suma kontrowersyjności wszystkich pytań w sondażu d(,, ) = suma odległości wszystkich par respondentów Znormalizowana wartość dyssensusu całkowitego D = 1 m m 1 n d(,, ) Przykładowo w ESS/6 dla Islandii D=0.76, dla Rosji D=0.81 13
D Całkowity dyssensus - przykład ESS/6 (n=67) 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 CY SE DE NO DK IS PL BG ES CH FI NL KS SI IL EE PT BE GB RU IE CZ SK 14
Odległość a kontrowersyjność Twierdzenie: W sondażu mającym m respondentów i n pytań, przeciętna odległość wszystkich respondentów jest równa przeciętnej" kontrowersyjności wszystkich pytań. Obie te wielkości są równe całkowitemu dyssensusowi D. 15
Pojęcie struktury zróżnicowania Struktura jako szczególny zbiór otoczeń (sąsiedztw) respondenta Otoczenie zbiór respondentów o podobnych poglądach Stopień podobieństwa poglądów promień otoczenia 16
Struktura zróżnicowania Otoczenie (sąsiedztwo) o promieniu r respondenta i N i, r = j : d i, j, r ESS/6 Islandia r=50 Problem pokrycia zbioru (set covering problem) Przykładowa reprezentacja macierzy wymiaru m m: jedynki oznaczone na czerwono ESS/6 Islandia r=37 17
promień r MIN, AVG, MAX promień r w 23 krajach ESS/6 60 50 40 30 20 10 0 RU BG PL CZ KS BE DK IE EE IL PT SK GB CH SE ES CY DE FI NO NL SI IS r min r avg r max 18
Dziękujemy, zapraszamy do dyskusji. 19