ANALIZY WIELOZMIENNOWE WPROWADZENIE DO TEMATYKI BUDOWY INDEKSÓW I SKAL W trakcie prowadzenia badania, a potem analizowania jego wyników dość często posługujemy się zmiennymi wielowymiarowymi. A raczej nie samymi zmiennymi, ale ich zoperacjonalizowanym odwzorowaniem, czyli złożonymi wskaźnikami i odpowiadającymi im pytaniami kwestionariusza. W praktyce wygląda to tak: Zmienna jednowymiarowa Wskaźnik prosty Kwestionariusz 1 pytanie Wiek Rok urodzenia - deklaracja Chciał(a)bym teraz poprosić Pana(ią) dla celów statystycznych o datę Pana(i) urodzenia? Zmienna wielowymiarowa Wskaźnik złożony Kwestionariusz wiele pytań Zaufanie do religii opinia o Deklaracja dotycząca tego, czy Czy się Pan(i) zgadza czy też nie jej roli w życiu człowieka religia może pomóc w zgadza, że praktykowanie religii określonych sytuacjach życiowych: - odnalezienie wewnętrznego spokoju i szczęścia; - zawieranie przyjaźni; - uzyskanie pocieszenia w kłopotach lub chwilach smutku; pomaga ludziom w... a. odnalezieniu wewnętrznego spokoju i szczęścia b. zawieraniu przyjaźni c. uzyskaniu pocieszenia w kłopotach lub chwilach smutku d. spotykaniu właściwych ludzi - spotykanie właściwych ludzi. Gdybyśmy więc chcieli sprawdzić, czy np. kobiety i mężczyźni różnią się pod względem zaufania do religii (opinii o jej roli w życiu człowieka) to dotychczas poznane sposoby analizy statystycznej nam nie wystarczą. W każdym poznanym teście (chi-kwadrat, t-studenta, Manna-Whitenya, Kruskala-Wallisa, ANOVA) po stronie zmiennej zależnej i niezależnej mogło być tylko po jednej zmiennej. Tymczasem tutaj zmienna zależna (nastawienie do religii) składa się z 4 mniejszych zmiennych. Nie pomoże nam też analiza regresji, bo tam wiele mogło być zmiennych niezależnych zależna była tylko jedna. Rozwiązania są dwa: Budowa indeksu Budowa skali z wykorzystaniem analizy czynnikowej i analizy rzetelności. 1
Dla przypomnienia, podobieństwa i różnice pomiędzy indeksem i skalą. Podobieństwa: Indeksy i skale są porządkowymi miernikami zmiennych. Porządkują jednostki analizy w kategoriach konkretnych zmiennych. Mogą być stworzone jedynie dla zmiennych ilościowych (interwałowych i ilorazowych); Wynik danej osoby na przykład na skali lub indeksie religijności stanowi wskazanie co do względnej religijności tej osoby w porównaniu z innymi badanymi. Są złożonymi miernikami zmiennych wynik jest uzależniony od odpowiedzi na kilka (kilkanaście) pytań. Różnice: skala: Taki zestaw powiązanych ze sobą merytorycznie i statystycznie twierdzeń, by przy ich pomocy dało się zmierzyć natężenie danej zmiennej (opinii, postawy) u badanych; Skalę uzyskuje się poprzez operacje matematyczne, a jej wynikiem jest pewna liczba odwzorowujaca natężenie badanej zmiennej. Uwzględnia intensywność obrazowania danej zmiennej przez różne pytania; Podczas budowy skali uwzględniany jest stopień skorelowania zmiennych cząstkowych. Różnice: indeks: Mniej precyzyjne od skal; Formułowane na bardziej liberalnych zasadach; Wskaźniki (pytania) wchodzące w skład indeksu nie muszą być aż tak ściśle ze sobą powiązane merytorycznie i statystycznie; Wynik powstaje dzięki operacjom matematycznym: dodawaniu, mnożeniu, dzieleniu; Z jednej strony mniej precyzyjne, z drugiej czasem łatwiejsze w konstrukcji i przez to nadużywane. 2
BUDOWA INDEKSU Przykład: Filtr: rok 2010 Zmienna niezależna: o q8 płeć Zmienna zależna wielowymiarowa, składająca się z pytań: o re34a Czy praktykowanie religii może pomóc w: odnalezieniu wewnętrznego spokoju i szczęścia; o re34b Czy praktykowanie religii może pomóc w: zawieraniu przyjaźni; o re34c Czy praktykowanie religii może pomóc w: uzyskaniu pocieszenia w kłopotach lub chwilach smutku; o re34d Czy praktykowanie religii może pomóc w: spotykaniu właściwych ludzi. Indeks zbudujemy więc na podstawie pytań re34a-re34d. Przed przystąpieniem do budowy indeksu należy upewnić się, czy: a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie lub brak występowania cechy, np. tak/nie); b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta, symetryczna, z wyraźnym środkiem); c) wszystkie pytania mają takie same kafeterie; d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej. Ad. a) Wybrane przez nas zmienne są mierzone na poziomie ilościowym. Ad. b) i c) Kafeteria wszystkich wybranych przez nas pytań wygląda następująco: Zdecydowanie się zgadzam (kod 1) Zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Nie zgadzam się (kod 4) Zdecydowanie się nie zgadzam (kod 5) Trudno powiedzieć (kod 8) Interwałość kafeterii zakłóca odpowiedź trudno powiedzieć, która musi zostać przekodowana jako brak danych. 3
Ad d) Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia zmiennej: re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia : re34b Religia sprzyja zawieraniu przyjaźni : re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku : re34d Religia sprzyja spotykaniu właściwych ludzi : o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii. We wszystkich wybranych pytaniach jest ten sam porządek. Gdyby któreś pytanie wyłamywało się, to trzeba by było je przekodować odwracając kolejność kodów odpowiedzi (wtedy zdecydowanie się zgadzam miało by kod 5) w naszym przypadku nie ma jednak potrzeby przekodowywania. Analiza porządku odpowiedzi pokazuje nam też jak będziemy analizować wynik indeksu. Skoro we wszystkich pytaniach, które wejdą w skład indeksu im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii, to identycznie będzie w indeksie. Tam też im wyższy wynik respondenta, tym mniejsze zaufanie do religii. Gdybyśmy chcieli aby interpretacja indeksu była bardziej intuicyjna (im wyższy kod, tym większe zaufanie) to dla wszystkich pytań należałoby odwrócić porządek odpowiedzi przez rekodowanie (wtedy zdecydowanie się zgadzam miało by kod 5). Budowa indeksu wariant 1. PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI w polu zmienna wynikowa podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind klikając na typ i etykieta możemy od razy nadać zmiennej etykietę, np. Zaufanie do religii indeks w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w oknie dialogowym i listą zmiennych po lewej stronie: re34a + re34b + re34c + re34d Syntax: COMPUTE re34_ind=re34a + re34b + re34c + re34d. VARIABLE LABELS re34_ind 'Zaufanie do religii - indeks'. EXECUTE. Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna nasz indeks. Ma on postać ilościową, nie wymaga definiowania wartości. 4
Po zmianie miejsc dziesiętnych na 0 i wyliczeniu częstości dla indeksu mamy tabelę: Zaufanie do religii - indeks Częstość Procent Procent ważnych Procent skumulowany 4 123 9,7 10,7 10,7 5 32 2,5 2,8 13,4 6 54 4,3 4,7 18,1 7 69 5,5 6,0 24,1 8 313 24,8 27,1 51,2 9 106 8,4 9,2 60,4 10 142 11,2 12,3 72,7 11 80 6,4 7,0 79,7 Ważne 12 123 9,8 10,7 90,3 13 29 2,3 2,5 92,8 14 31 2,5 2,7 95,5 15 17 1,4 1,5 97,0 16 26 2,0 2,2 99,2 17 2,2,2 99,4 18 1,1,1 99,5 20 5,4,5 100,0 Ogółem 1154 91,4 100,0 Braki danych Systemowe braki danych 109 8,6 Ogółem 1263 100,0 Jak widać wartości indeksu mieszczą się między 4 a 20. Wartość 4 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się zgadzam ta odpowiedź miała kod 1, więc 1+1+1+1 dało wynik 4. Wartość 20 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się nie zgadzam ta odpowiedź miała kod 5, więc 5+5+5+5 dało wynik 20. Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości minimalnej 4 ), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do wartości maksymalnej 20 ), tym niższe zaufanie do religii. Kłopot może sprawić analiza wartości pośrednich. Bo co oznacza np. wynik indeksu 13? Można sobie z tym poradzić tworząc na użytek interpretacji przedziały, np. o 4 8 = duże zaufanie do religii o 9 14 = umiarkowane zaufanie do religii o 15 20 = małe zaufanie do religii. Powyższe przedziały to tylko propozycja tak naprawdę możliwości jest bardzo wiele i decyzja, jak to zrobić zależy tylko i wyłącznie od analityka. 5
Budowa indeksu wariant 2. PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI w polu zmienna wynikowa podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind_2 klikając na typ i etykieta możemy od razy nadać zmiennej etykietę, np. Zaufanie do religii indeks w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w oknie dialogowym i listą zmiennych po lewej stronie: (re34a + re34b + re34c + re34d)/4 Syntax: COMPUTE re34_ind_2=(re34a + re34b + re34c + re34d)/4. VARIABLE LABELS re34_ind_2 'Zaufanie do religii - indeks'. EXECUTE. Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna nasz indeks w wersji 2. Ma on postać ilościową, nie wymaga definiowania wartości. Po wyliczeniu częstości dla indeksu mamy tabelę: Zaufanie do religii - indeks Częstość Procent Procent ważnych Procent skumulowany 1,00 123 9,7 10,7 10,7 1,25 32 2,5 2,8 13,4 1,50 54 4,3 4,7 18,1 1,75 69 5,5 6,0 24,1 2,00 313 24,8 27,1 51,2 2,25 106 8,4 9,2 60,4 2,50 142 11,2 12,3 72,7 2,75 80 6,4 7,0 79,7 Ważne 3,00 123 9,8 10,7 90,3 3,25 29 2,3 2,5 92,8 3,50 31 2,5 2,7 95,5 3,75 17 1,4 1,5 97,0 4,00 26 2,0 2,2 99,2 4,25 2,2,2 99,4 4,50 1,1,1 99,5 5,00 5,4,5 100,0 Ogółem 1154 91,4 100,0 Braki danych Systemowe braki danych 109 8,6 Ogółem 1263 100,0 6
Tym razem wartości indeksu mieszczą się między 1 a 5 czyli tak, jak to było w kafeteriach pytań cząstkowych. Wartość 1 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się zgadzam ta odpowiedź miała kod 1, więc (1+1+1+1)/4 dało wynik 1. Wartość 5 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się nie zgadzam ta odpowiedź miała kod 5, więc (5+5+5+5)/4 dało wynik 5. Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości minimalnej 1 ), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do wartości maksymalnej 5 ), tym niższe zaufanie do religii. Tym razem analiza wartości pośrednich jest trochę prostsza, bo możemy odnieść je do oryginalnej kafeterii pytań cząstkowych, czyli np.: o 1 (i okolice) = bardzo duże zaufanie do religii o 2 (i okolice) = duże zaufanie do religii o 3 (i okolice) = umiarkowane zaufanie do religii o 4 (i okolice) = małe zaufanie do religii o 5 (i okolice) = bardzo małe zaufanie do religii Dla określenia czym są wskazane przed chwilą okolice można posłużyć się matematyczną zasadą zaokrąglania liczb. Lub scedować to na SPSS jeśli w zakładce zmienne bazy dla tej właśnie zmiennej dziesiętne ustawimy na 0, to program sam dokona zaokrągleń i w efekcie dostaniemy coś takiego: Zaufanie do religii - indeks Częstość Procent Procent ważnych Procent skumulowany 1 123 9,7 10,7 10,7 1 32 2,5 2,8 13,4 2 54 4,3 4,7 18,1 2 69 5,5 6,0 24,1 2 313 24,8 27,1 51,2 2 106 8,4 9,2 60,4 3 142 11,2 12,3 72,7 Ważne 3 80 6,4 7,0 79,7 3 123 9,8 10,7 90,3 3 29 2,3 2,5 92,8 4 31 2,5 2,7 95,5 4 17 1,4 1,5 97,0 4 26 2,0 2,2 99,2 4 2,2,2 99,4 5 1,1,1 99,5 7
5 5,4,5 100,0 Ogółem 1154 91,4 100,0 Braki danych Systemowe braki danych 109 8,6 Ogółem 1263 100,0 Oba przedstawione warianty tworzenia indeksu są sobie równorzędne. Decyzja o posługiwaniu się jednym z nich należy zawsze do analityka. Wynik indeksu jest liczbą, co oznacza, że jest to zmienna na poziomie ilościowym i można dla niej wyliczyć wszystkie statystyki opisowe. Indeks może być również z powodzeniem stosowany zarówno jako zmienna zależna (częściej), jak i niezależna (rzadziej). W naszym przykładzie potraktujemy indeks jako zmienną zależną i sprawdzimy, czy kobiety i mężczyźni różnią się pod względem zaufania do religii (opinii o jej roli w życiu człowieka). Nie ma znaczenia, czy wykorzystamy wariant 1 czy 2 indeksu wynik zawsze będzie taki sam. Test t-studenta t(1152) = 2,649; p<0,05 wykazał, że płeć różnicuje zaufanie do religii. Kobiety (średnia 2,19) częściej niż mężczyźni (średnia 2,30) deklarowały większe zaufanie do religii, wskazując, że jej praktykowanie może pomóc w wybranych sytuacjach życiowych. 8
ANALIZA CZYNNIKOWA Zbudowanie indeksu było bardzo proste: ot, trzeba tylko sprawdzić parę rzeczy, dodać do siebie kody odpowiednich pytań, a potem zinterpretować uzyskane wartości. Tyle, że przy okazji pominęliśmy kilka ważnych kwestii: Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie? Czy wszystkie podpytania mierzyły tak naprawdę to samo? Czy wszystkie podpytania były jednakowo ważne dla wskaźnika? Analiza czynnikowa pomaga rozwiać powyższe wątpliwości i w rezultacie dzięki niej można stworzyć o wiele bardziej precyzyjny niż indeks wskaźnik: skalę. Przykład: Dane dla roku 2010 Chcemy utworzyć skalę stosunku do religii (opinii o religii) Wybieramy z dostępnych danych następujące zmienne: o re11b Zbyt ufamy nauce, za mało religii o re11c Religia-więcej konfliktów niż pokoju o re11d Osoby religijne często zbyt nietolerancyjne o re19a Bóg zajmuje się osobiście każdą istotą o re19c Życie ma sens bo istnieje Bóg o re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia o re34b Religia sprzyja zawieraniu przyjaźni o re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku o re34d Religia sprzyja spotykaniu właściwych ludzi Przy wyborze zmiennych należy zwrócić uwagę na te same kwestie co, przy indeksie: a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie lub brak występowania cechy, np. tak/nie); b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta, symetryczna, z wyraźnym środkiem); c) wszystkie pytania mają takie same kafeterie chodzi przede wszystkim o liczbę itemów: jeśli jest różna należy najpierw dokonać standaryzacji zmiennych; d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej. 9
Ad. a) Wszystkie wybrane przez nas zmienne są mierzone na poziomie ilościowym. Ad b) We wszystkich wybranych pytaniach kafeterie są interwałowe, o ile odpowiedź trudno powiedzieć przekoduje się jako brak danych: Zdecydowanie się zgadzam (kod 1) Zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Nie zgadzam się (kod 4) Zdecydowanie się nie zgadzam (kod 5) Trudno powiedzieć (kod 8) Ad c) Wszystkie wybrane pytania mają takie same kafeterie pod względem uporządkowania (wszystkie są likertowskie) i liczby itemów (wszystkie mają po 5 itemów). Gdyby było inaczej (np. kilka kafeterii byłoby 5-elementowych a kilka 7-elementowych) to zamiast redukować większą kafeterię do mniejszej liczby itemów, lepiej dokonać standaryzacji wszytskich branych pod uwagę zmiennych (czyli przełożenia kodów na wartości z rozkładu normalnego): ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE -> ZAPISZ STANDARYZOWANE WARTOŚCI JAKO ZMIENNE Syntax (np. dla zmiennej re19a) DESCRIPTIVES VARIABLES=re19a /SAVE /STATISTICS=MEAN STDDEV MIN MAX. Po wywołaniu polecenia policzą się statystyki opisowe, ale ważniejsze jest, że na końcu naszej listy zmiennych w bazie pojawi się nowa zmienna Zre19a (nazwa nadana przez SPSS zawsze przy standaryzacji jest tak samo: do oryginalnej nazwy zmiennej program dodaje na początku dużą literę Z ). Wartości nowej zmiennej odniesione są do rozkładu tej zmiennej: im bliżej 0 tym bliżej średniej, a wartości mniejsze/większe od zera wskazują na oddalanie się od średniej o wartość odchylenia standardowego (wartości z minusem do te mniejsze od średniej; wartości z plusem to te większe od średniej). 10
Ad d) Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia zmiennej: re11b Zbyt ufamy nauce, za mało religii : re11c Religia-więcej konfliktów niż pokoju : o im wyższy kod odpowiedzi, tym większe zaufanie do religii; re11d Osoby religijne często zbyt nietolerancyjne : o im wyższy kod odpowiedzi, tym większe zaufanie do religii; re19a Bóg zajmuje się osobiście każdą istotą : re19c Życie ma sens bo istnieje Bóg : re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia : re34b Religia sprzyja zawieraniu przyjaźni : re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku : re34d Religia sprzyja spotykaniu właściwych ludzi : W naszym przypadku dwa pytania na 9 wybranych mają inny porządek odpowiedzi: tam wskazywanie odpowiedzi wysokokodowanych będzie wskazywało na większe zaufanie do religii. Ponieważ te odmienne pytania są w mniejszości, to przekodujemy je wg wzoru: Stary porządek kafeterii Zdecydowanie się zgadzam (kod 1) Zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Nie zgadzam się (kod 4) Zdecydowanie się nie zgadzam (kod 5) Nowy porządek kafeterii Zdecydowanie się nie zgadzam (kod 1) Nie zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Zgadzam się (kod 4) Zdecydowanie się zgadzam (kod 5) UWAGA: rekodujemy korzystając z opcji rekoduj na inne zmienne (by nie tracić oryginałów) i pamiętamy, by przy definiowaniu wartości źródłowych i wynikowych rekodowania zaznaczyć opcję systemowy lub zdefiniowany brak danych -> systemowy brak danych. 11
Po zrekodowaniu zmiennych re11c i re11d nasza lista wybranych zmiennych przedstawia się następująco: re11b Zbyt ufamy nauce, za mało religii : re11c_rek Religia-więcej konfliktów niż pokoju - rekodowane : re11d_rek Osoby religijne często zbyt nietolerancyjne - rekodowane : re19a Bóg zajmuje się osobiście każdą istotą : re19c Życie ma sens bo istnieje Bóg : re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia : re34b Religia sprzyja zawieraniu przyjaźni : re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku : re34d Religia sprzyja spotykaniu właściwych ludzi : Możemy teraz przystąpić do wykonywania analizy czynnikowej. Analiza pokaże nam: czy wszystkie wybrane przez nas zmiennej są powiązane nie tylko merytorycznie, ale i statystycznie; jak bardzo dla tworzonej przez nas skali jest istotna każda ze zmiennych; czy w ramach wybranego zestawu zmiennych są czynniki czyli podskale powiązanych ze sobą statystycznie zmiennych ANALIZA -> REDUKCJA WYMIARÓW -> ANALIZA CZYNNIKOWA do okienka po prawej stronie przerzucamy wszystkie interesujące nas zmienne; pole pod spodem Zmienna filtrująca to nie zmienna niezależna! Tutaj nie ma takowej! To możliwość ograniczenia analizy tylko do osób, które na pewne pytanie udzieliły konkretnej wypowiedzi (np. tylko kobiety albo tylko bardzo religijni itp.) to zwykły filtr! Analiza czynnikowa wymaga zdefiniowania szeregu dodatkowych opcji są one ukryte po przyciskami po prawej stronie okna dialogowego. 12
1. WYODRĘBNIANIE a) Metoda: Głównych składowych (domyślna) o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent wariancji wyjściowych zmiennych. b) Analiza: Macierz korelacji gdy analizujemy dane surowe, niestandaryzowane; Macierz kowariancji gdy analizujemy dane po standaryzacji. Ponieważ nie robiliśmy standaryzacji, to zostawiamy zaznaczoną domyślnie macierz korelacji. c) Pokaż Nierotowane rozwiązania czynnikowe zostawiamy domyślnie zaznaczone. Wykres osypiska (metoda Catella) gdybyśmy chcieli o liczbie czynników (czyli tych potencjalnych podskal decydować na podstawie metody wykresu osypiska my tutaj nie chcemy, a zainteresowanych odsyłam do literatury) d) Wyodrębnianie Na podstawie wartości własnej większej niż (metoda Kaisera) - zostawiamy domyślnie wpisaną liczbę 1 o Liczbę czynników wyliczy nam SPSS; o Wartość własna określa procent wyjaśnianych przez dany czynnik wariancji; o Jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu oznacza, że nie wchodzi w reakcję z innymi zmiennymi i sam tworzy podskalę, co oznacza, że można go analizować osobno, bez bawienia się analizą czynnikową. Ustalona liczba czynników o Opcja alternatywna do poprzedniej, gdy sami decydujemy ile czynników ma ustalić SPSS; o Do wykorzystania, gdy: Analizowaliśmy wykres osypiska i wiemy ile chcemy czynników; Analizowaliśmy już raz przeprowadzoną analizę czynnikową, gdzie SPSS pokazał nam, że można na podstawie własności własnej większej niż 1 wyodrębnić np. 4 czynniki, a my chcemy zmusić go by pokazał nam rozwiązanie z np. 3 czynnikami. e) Maksimum iteracji dla uzyskania zbieżności zostawiamy domyślnie ustawiona na 25. 13
2. ROTACJA Rotacja rozwiązań czynnikowych pozwala zwiększyć dopasowanie modelu i porządkuje prezentację wyników (co ułatwia ich późniejszą interpretację) a) Metoda - najpopularniejsze: Varimax o Rotacja ortogonalna; o Zakłada brak korelacji pomiędzy czynnikami (podskale nie są ze sobą powiązane); o Przydaje się, gdy przygotowujemy predyktory do analizy regresji (tam jest zalecenie, by predyktory nie korelowały ze sobą); o Trzeba zdawać sobie sprawę, że będzie to trochę sztuczne rozwiązanie rzeczywistość społeczna jest zbyt skomplikowana, by móc oczekiwać całkowitego braku pomiędzy występującymi w niej zjawiskami. Prosta Oblimin o Rotacja nieortogonalna (ukośna); o Zakłada, że istnieje korelacja pomiędzy czynnikami; o Pokazuje czy i jak silna jest to zależność (może się zdarzyć, że wskaże brak zależności, a wtedy dobrze policzyć analizę czynnikową jeszcze raz, wybierając rotację Varimax); o Wybierając ją zostawiamy domyślnie wpisane wartości Delta i Kappa. b) Reszta opcji pozostawiona domyślnie. UWAGA: Policzymy analizę czynnikową dwukrotnie: najpierw z rotacją Varimax, a potem z rotacją Oblimin. 3. OPCJE a) Brak danych Zostawiamy domyślnie zaznaczone wyłączanie wszystkich obserwacji z brakami ; Oznacza to, że jeśli ktoś na którekolwiek z branych przez nas pod uwagę pytań udzielił odpowiedzi równoznacznej z brakiem danych (np. trudno powiedzieć), to jego odpowiedzi nie będą uwzględniane przy wyliczeniach analizy czynnikowej. b) Format wyświetlania współczynników Sortuj według wartości ładunków czynnikowych 14
o Zaznaczamy; o To jest opcja, która porządkuje tabelę wyników i ułatwia interpretację. Ukryj małe współczynniki o Zaznaczamy; o W pole wartość bezwzględna poniżej wpisujemy 0,4 ; o Przyjmuje się, że jest to minimalna wartość z jaką czynnik ładuje zmienną czyli liczba pokazująca jak mocno dana zmienna przynależy do danego czynnika. 4. STATYSTYKI a) Statystyki Statystyki opisowe zaznaczamy, mogą się przydać przy interpretacji; Rozwiązania wstępne zostawiamy zaznaczone domyślnie b) Macierz korelacji z dostępnych opcji zaznaczamy: K-M-O i test sferyczności Bartletta o K-M-O to miara adekwatności doboru próby o To stosunek korelacji zmiennych do ich korelacji częściowej, czyli wielkość unikalnego związku; o Najlepiej, gdy ma wartość bliską 1; o Za minimum przyjmuje się 0,5 jeśli jest poniżej, to analiza czynnikowa nie jest wiarygodna (zmienne są słabo ze sobą pokorelowane); 5. OCENY W tym momencie nie zaznaczamy tu żadnej z opcji. a) Zapisz jako zmienne Metoda: Anderson-Rubin Każdy wyodrębniony czynnik zostanie zapisany jako nowa zmienna Wartości będą wystandaryzowane do rozkładu normalnego Należy je interpretować w kategoriach odległości od średniej: o Ujemne niski wynik na skali (poniżej średniej) o Okolice zera wynik przeciętny (średni) o Dodatnie wysoki wynik na skali (powyżej średniej) Tak utworzone zmienne mogą być traktowane jako niezależne lub zależne w innych obliczeniach; 15
Syntax: FACTOR /VARIABLES re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d /MISSING LISTWISE /ANALYSIS re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d /PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION /FORMAT SORT BLANK(0.4) /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PC /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION. Gdzie w linii kodu: /VARIABLES lista nazw zmiennych /MISSING LISTWISE - wyłączanie wszystkich obserwacji z brakami /ANALYSIS - lista zmiennych przy liczeniu statystyk opisowych /PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION - pokazuje rozwiązania początkowe (nierotowane) oraz miarę K-M-O /FORMAT SORT BLANK(0.4) - zdefiniowana wartość minimalna ładunku czynnikowego pokazywanego w tabeli i sortowanie wg wartości ładunków czynnikowych /CRITERIA MINEIGEN(1) ITERATE(25) - kryterium Kaisera z własnością własną min. 1 /EXTRACTION PC nazwa metody: głównych składowych /CRITERIA ITERATE(25) - metoda oparta na korelacji /ROTATION VARIMAX wybrana rotacja: Varimax (jeśli wybralibyśmy Oblimin to byłyby dwie linie: /CRITERIA ITERATE(25) DELTA(0) /ROTATION OBLIMIN /METHOD=CORRELATION. metoda oparta na macierzy korelacji (jeśli wybralibyśmy macierz kowariancji, to linia wyglądałaby: /METHOD=COVARIANCE Jeśli chcielibyśmy zapisać czynniki jako zmienne to w przedostatniej linii trzeba by było dopisać nową linijkę kodu: /SAVE AR(ALL) 16
Po wywołaniu polecenia (analiza czynnikowa z rotacją Varimax) otrzymujemy następujące tabele: a) Statystyki opisowe Średnia Odchylenie standardowe Analizowane obserwacje N Zbyt ufamy nauce, za mało religii 3,55 1,000 973 Religia-więcej konfliktów niż pokoju 3,26 1,052 973 Osoby religijne często zbyt nietolerancyjne 3,58 1,060 973 Bóg zajmuje się osobiście każdą istotą 2,37 1,130 973 Życie ma sens bo istnieje Bóg 3,00 1,133 973 odnalezieniu wewnętrznego spokoju i szczęścia 1,99,796 973 zawieraniu przyjaźni 2,51,971 973 uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,96,803 973 spotykaniu właściwych ludzi 2,56,995 973 Tabela informuje nas: O średniej wartości odpowiedzi (a pamiętamy, że im niższa wartość tym większe zaufanie do religii) O odchyleniu standardowym (im wyższe, tym większe rozbieżności w odpowiedziach badanych) Analizowanych obserwacjach (wiemy dla ilu osób została policzona analiza czynnikowa) b) Testy Kaisera-Mayera-Olkina i Bartletta Miara KMO adekwatności doboru próby,768 Przybliżone chi-kwadrat 3352,786 Test sferyczności Bartletta df 36 Istotność,000 Wartość miary K-M-O to 0,768: Jest powyżej 0,5 czyli nasza analiza czynnikowa jest wiarygodna Do wartości 1 trochę brakuje, ale to nic nie szkodzi. Test sferyczności Bartletta Jest istotny: p<0,05 Co oznacza, że macierz korelacji zawiera istotne współczynniki korelacji innymi słowy: brane przez nas pod uwagę zmienne są ze sobą powiązane (a to bardzo dobrze) Jeśli obie miary (K-M-O i test Bartletta) dadzą niesatysfakcjonujące wyniki, to należy przemyśleć rekonstrukcję zestawu zmiennych może jest tam zmienna, która psuje, bo jest nieskorelowana z pozostałymi? 17
c) Zasoby zmienności wspólnej Początkowe Po wyodrębnieniu Zbyt ufamy nauce, za mało religii 1,000,615 Religia-więcej konfliktów niż pokoju 1,000,768 Osoby religijne często zbyt nietolerancyjne 1,000,727 Bóg zajmuje się osobiście każdą istotą 1,000,567 Życie ma sens bo istnieje Bóg 1,000,678 odnalezieniu wewnętrznego spokoju i szczęścia 1,000,714 zawieraniu przyjaźni 1,000,671 uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,000,724 spotykaniu właściwych ludzi 1,000,708 Metoda wyodrębniania czynników głównych składowych. Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych czynnikach; Im więcej, tym lepiej oznacza to, że zmienna dobrze wpisuje się w tworzone czynniki. d) Całkowita wyjaśniona wariancja Składowa Początkowe wartości własne Sumy kwadratów ładunków po wyodrębnieniu Sumy kwadratów ładunków po rotacji Ogółem % wariancji % skum. Ogółem % wariancji % skum. Ogółem % wariancji % skumulowany 1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30,983 2 1,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51,002 3 1,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576 4,778 8,639 77,215 5,685 7,609 84,824 6,485 5,386 90,210 7,402 4,462 94,671 8,286 3,183 97,854 9,193 2,146 100,000 Metoda wyodrębniania czynników głównych składowych. Tabela informuje nas: Ile wyodrębniono czynników o wartości własnej większej niż 1 na podstawie ostatniej części tabeli (sumy kwadratów ładunków po rotacji) widać, że są to trzy czynniki (tu nazwane składowymi za względu na to, że metodą wyodrębniania była metoda głównych składowych); Ile procent wariancji wyjaśniają w sumie te trzy czynniki: u nas to 68,576% wariancji. To ponad 2/3 wszystkich analizowanych przez nas przypadków, a więc całkiem sporo. 18
e) Macierz składowych a Składowa 1 2 3 spotykaniu właściwych ludzi,811 zawieraniu przyjaźni,774 odnalezieniu wewnętrznego spokoju i szczęścia,749 uzyskaniu pocieszenia w kłopotach lub chwilach smutku,719 Bóg zajmuje się osobiście każdą istotą,680 Życie ma sens bo istnieje Bóg,653,482 Osoby religijne często zbyt nietolerancyjne,744 Religia-więcej konfliktów niż pokoju,412,696 Zbyt ufamy nauce, za mało religii,435,653 Metoda wyodrębniania czynników - Głównych składowych. a. 3 liczba wyodrębnionych składowych. Nierotowana macierz składowych (wyodrębnionych czynników) pomijamy. f) Macierz rotowanych składowych a Składowa 1 2 3 uzyskaniu pocieszenia w kłopotach lub chwilach smutku,846 odnalezieniu wewnętrznego spokoju i szczęścia,831 spotykaniu właściwych ludzi,766 zawieraniu przyjaźni,763 Zbyt ufamy nauce, za mało religii,779 Życie ma sens bo istnieje Bóg,763 Bóg zajmuje się osobiście każdą istotą,610 Religia-więcej konfliktów niż pokoju,862 Osoby religijne często zbyt nietolerancyjne,834 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Varimax z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 4 iteracjach. Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych. Mamy trzy wyodrębnione czynniki: o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia; o Czynnik nr 2 to podpytania dotyczące wielkości Boga (opinii nt. Boga); o Czynnik nr 3 to podpytania dotyczące religii jako pewnego zjawiska społecznego. Każdy z czynników to osobna podskala. Zgodnie z założeniem rotacji Varimax te podskale uznajemy za nieskorelowane ze sobą. 19
Teraz wykonamy analizę czynnikową z rotacją Oblimin czyli przy założeniu korelacji pomiędzy czynnikami. a) Statystyki opisowe interpretacja jak poprzednio. b) Miara K-M-O i test sferyczności Bartletta interpretacja jak poprzednio. c) Zasoby zmienności wspólnej interpretacja jak poprzednio. d) Całkowita wyjaśniona wariancja Składowa Początkowe wartości własne Sumy kwadratów ładunków po wyodrębnieniu Sumy kwadratów ładunków po rotacji a Ogółem % wariancji % skumulowany Ogółem % wariancji % skumulowany Ogółem 1 3,736 41,514 41,514 3,736 41,514 41,514 3,292 2 1,353 15,033 56,547 1,353 15,033 56,547 1,897 3 1,083 12,028 68,576 1,083 12,028 68,576 2,308 4,778 8,639 77,215 5,685 7,609 84,824 6,485 5,386 90,210 7,402 4,462 94,671 8,286 3,183 97,854 9,193 2,146 100,000 Metoda wyodrębniania czynników głównych składowych. a. Dodawanie sum kwadratów ładunków w celu otrzymania ogólnej wariancji nie jest możliwe, gdy składowe są skorelowane. Tabela informuje nas: O liczbie wyodrębnionych czynników: 3. O procencie wariancji wyjaśniającym w sumie te trzy czynniki: 68,576%. Tak więc podobnie jak w przypadku rotacji Varimax mamy wyodrębnione trzy czynniki i taki sam procent wyjaśnionych wariancji. 20
e) Macierz składowych a Składowa 1 2 3 spotykaniu właściwych ludzi,811 zawieraniu przyjaźni,774 odnalezieniu wewnętrznego spokoju i szczęścia,749 uzyskaniu pocieszenia w kłopotach lub chwilach smutku,719 Bóg zajmuje się osobiście każdą istotą,680 Życie ma sens bo istnieje Bóg,653,482 Osoby religijne często zbyt nietolerancyjne,744 Religia-więcej konfliktów niż pokoju,412,696 Zbyt ufamy nauce, za mało religii,435,653 Metoda wyodrębniania czynników - Głównych składowych. a. 3 liczba wyodrębnionych składowych. Nierotowana macierz składowych (wyodrębnionych czynników) pomijamy. f) Macierz modelowa a Składowa 1 2 3 uzyskaniu pocieszenia w kłopotach lub chwilach smutku,894 odnalezieniu wewnętrznego spokoju i szczęścia,862 zawieraniu przyjaźni,759 spotykaniu właściwych ludzi,750 Religia-więcej konfliktów niż pokoju,876 Osoby religijne często zbyt nietolerancyjne,850 Zbyt ufamy nauce, za mało religii,823 Życie ma sens bo istnieje Bóg,745 Bóg zajmuje się osobiście każdą istotą,553 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 5 iteracjach. Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych. Mamy trzy wyodrębnione czynniki: o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia; o Czynnik nr 2 to podpytania dotyczące religii jako pewnego zjawiska społecznego; o Czynnik nr 3 to podpytania dotyczące wielkości Boga (opinii nt. Boga). Każdy z czynników to osobna podskala. Zgodnie z założeniem rotacji Oblimin te podskale uznajemy za skorelowane ze sobą. 21
g) Macierz korelacji składowych Składowa 1 2 3 1 1,000,261,380 2,261 1,000,210 3,380,210 1,000 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. Pokazuje korelacje pomiędzy poszczególnymi czynnikami: o Czynnik 1 i 2 korelacja 0,261 czyli słaba; o Czynnik 1 i 3 korelacja 0,38 czyli umiarkowana; o Czynnik 2 i 3 korelacja 0,21 czyli słaba. Nie są to korelacje zbyt wysokie, ale mimo wszystko pokazują, że czynniki są współzależne. Na podstawie przeprowadzonej analizy czynnikowej (niezależnie od metody rotacji) wiemy, że następująca lista zmiennych: re11b Zbyt ufamy nauce, za mało religii re11c_rek Religia-więcej konfliktów niż pokoju re11d_rek Osoby religijne często zbyt nietolerancyjne re19a Bóg zajmuje się osobiście każdą istotą re19c Życie ma sens bo istnieje Bóg re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia re34b Religia sprzyja zawieraniu przyjaźni re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku re34d Religia sprzyja spotykaniu właściwych ludzi nie tworzy jednej spójnej skali (jednego spójnego wskaźnika). Mamy tak naprawdę trzy skale, które za każdym razem mierzą trochę inne rzeczy: zaufania do religii (re34a, re34b, re34c, re34d) o im wyższy wynik na skali tym mniejsze zaufanie stosunku do Boga (re11b, re19a, re19c) o im wyższy wynik na skali tym silniejsza negacja Boga opinii o religii jako zjawisku społecznym (re11c_rek, re11d_rek) o im wyższy wynik na skali tym silniejsza opinia negatywna nt. religii jako zjawiska społecznego 22
Zanim jednak utworzymy te skale (na razie wiemy, że można je wyróżnić, ale jako osobne zmienne jeszcze nie istnieją), warto sprawdzić ich rzetelność czyli jak bardzo są spójne i czy usunięcie któregokolwiek itemu nie poprawiłoby jakości skali. ANALIZA -> SKALOWANIE -> ANALIZA RZETELNOŚCI 1. Przykład: dla skali zaufania do religii (re34a, re34b, re34c, re34d) interesujące nas zmienne przerzucamy do okienka po prawej w statystyki zaznaczamy: o pozycja testowa o skala przy wykluczeniu pozycji Syntax: RELIABILITY /VARIABLES=re34a re34b re34c re34d /SCALE('ALL VARIABLES') ALL /MODEL=ALPHA /STATISTICS=DESCRIPTIVE /SUMMARY=TOTAL. Po wywołaniu polecenia otrzymujemy kilka tabel, z których interpretujemy tylko dwie: a) Statystyki rzetelności Alfa Cronbacha Liczba pozycji,851 4 wartość Alfa Cronbacha jest miarą rzetelności skali: o minimum powinno być 0,5 poniżej skala jest kiepska o najlepiej by było w okolicach 0,7 o ale im bliżej 1 tym lepiej 23
b) Statystyki pozycji Ogółem Średnia skali po Wariancja skali Korelacja Alfa Cronbacha usunięciu po usunięciu pozycji Ogółem po usunięciu pozycji pozycji pozycji odnalezieniu wewnętrznego spokoju i szczęścia 6,99 5,748,662,824 zawieraniu przyjaźni 6,46 4,818,721,798 uzyskaniu pocieszenia w kłopotach lub chwilach smutku 7,01 5,705,663,823 spotykaniu właściwych ludzi 6,43 4,712,737,791 interesuje nas tylko wynik z ostatniej kolumny; pokazuje on, jaką wartość przyjęłaby miara Alfa Cronbacha, gdyby ze skali usunięto daną zmienną; patrzymy, czy w którymkolwiek przypadku Alfa byłaby większa gdyby tak było, to warto ze skali usunąć psującą ją zmienną; w naszym przypadku usunięcie którejkolwiek ze zmiennych nie zwiększy wartości Alfa skala jest więc dobra w takiej postaci, w jakiej jest. 2. A teraz przyjmijmy, że nie mamy wiedzy, którą dostarczyła nam analiza czynnikowa. Wybraliśmy zestaw 9 zmiennych, które wg nas mogą tworzyć skalę: re11b Zbyt ufamy nauce, za mało religii re11c_rek Religia-więcej konfliktów niż pokoju re11d_rek Osoby religijne często zbyt nietolerancyjne re19a Bóg zajmuje się osobiście każdą istotą re19c Życie ma sens bo istnieje Bóg re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia re34b Religia sprzyja zawieraniu przyjaźni re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku re34d Religia sprzyja spotykaniu właściwych ludzi Wykonujemy analizę rzetelności, żeby zobaczyć, jak dobra jest to skala. Syntax: RELIABILITY /VARIABLES=re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d /SCALE('ALL VARIABLES') ALL /MODEL=ALPHA /STATISTICS=DESCRIPTIVE /SUMMARY=TOTAL. 24
Po wywołaniu polecenia zaglądamy do tabeli z Alfą Cronbacha: Statystyki rzetelności Alfa Cronbacha Liczba pozycji,804 9 Nie jest źle: Alfa ma wartość 0,804, czyli jest zdecydowanie powyżej zakładanego progu minimum (0,5). Zobaczmy, czy taką skalę da się poprawić: Statystyki pozycji Ogółem Średnia skali po Wariancja skali Korelacja Alfa Cronbacha usunięciu po usunięciu pozycji Ogółem po usunięciu pozycji pozycji pozycji Zbyt ufamy nauce, za mało religii 21,23 27,120,333,806 Religia-więcej konfliktów niż pokoju 21,52 26,686,349,805 Osoby religijne często zbyt nietolerancyjne 21,20 26,668,346,805 Bóg zajmuje się osobiście każdą istotą 22,41 23,949,575,774 Życie ma sens bo istnieje Bóg 21,78 24,148,552,778 odnalezieniu wewnętrznego spokoju i szczęścia 22,79 26,197,583,778 zawieraniu przyjaźni 22,27 24,733,612,770 uzyskaniu pocieszenia w kłopotach lub chwilach smutku 22,81 26,475,540,782 spotykaniu właściwych ludzi 22,22 24,112,664,763 wyrzucenie pierwszych trzech zmiennych mogłoby nam lekko podnieść wartość Alfa: o 0,001-0,002 czyli naprawdę niewiele to zmiana w zasadzie nieistotna; wyrzucenie którejkolwiek z pozostałych zmiennych wartość Alfa zmniejszy czyli skala będzie słabsza. UWAGA: analiza rzetelności nie pokazała nam wyraźnie, że zestaw 9 wybranych zmiennych rozpada się na podskale; gdybyśmy kierowali się tylko i wyłącznie jej wynikiem, to zbudowaliśmy wskaźnik z wszystkich 9 zmiennych; biorąc więc pod uwagę taki scenariusz warto jednak najpierw wykonywać analizę czynnikową, która sięga głębiej w dane i jest w stanie ujawnić ukryte w nich struktury; analiza rzetelności może więc: o albo pomóc w dopracowaniu wyników analizy czynnikowej; o albo zasugerować jedynie, że wśród wybranych zmiennych mamy podskale z całkowitą pewnością jednak ich nie ujawni to zrobi dopiero analiza czynnikowa. 25
Wróćmy do wyodrębnionej skali zaufania do religii. Przypomnijmy, że składa się ona z czterech zmiennych: re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia re34b Religia sprzyja zawieraniu przyjaźni re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku re34d Religia sprzyja spotykaniu właściwych ludzi I w bazie te zmienne wciąż widnieją osobno. Jak zamienić je na jeden wskaźnik-skalę? Sposób 1 Na podstawie zmiennych, które wchodzą w skład wyodrębnionej skali budujemy wskaźnik sumaryczny, którego wartość będzie wartością uzyskaną przez respondenta na skali; Innymi słowy: dokonujemy tej samej operacji co przy indeksie: dodajemy do siebie wybrane pytania, które tworzą skalę; Wynik uzyskany przez respondenta interpretujemy tak samo, jak to robiliśmy w przypadku indeksu: zgodnie z natężeniem wartości zmiennych w kafeteriach; Uzyskany wskaźnik możemy wykorzystywać jako zmienną niezależna lub zależną; Co w takim razie jest inaczej niż wtedy, gdy robiliśmy indeks? o Tym razem mamy mocne podstawy, by sądzić, że zmienne wchodzące w skład wskaźnikaskali są ze sobą powiązane merytorycznie i statystycznie. o W przypadku, gdy od razu budowaliśmy indeks (dodawaliśmy do siebie pytania) my tylko zakładaliśmy, że tak jest dowodów jednak nie było. Dostarczyła ich dopiero analiza czynnikowa. Wadą tego sposobu budowy wskaźnika-skali jest to, że: o wszystkie pytania traktujemy jako jednakowo ważne dla skali a to nieprawda. Analiza czynnikowa pokazywała nam, że czynniki w różny sposób ładują konkretne zmienne. Zaletą tego sposobu jest prostota: i wykonania, i interpretacji wyniku. Sposób 2 Wykonujemy jeszcze raz analizę czynnikową z rotacją Oblimin (bo wiemy już, że czynniki są ze sobą skorelowane) Tym razem w OCENY zaznaczamy o Zapisz jako zmienne o Metoda: Anderson-Rubin 26
Analiza czynnikowa wykonała się ponownie, a to co jest nowego znajdziemy w bazie na końcu pojawiły się trzy nowe zmienne: o FAC1_1 A-R factor score 1 for analysis 1 o FAC2_1 A-R factor score 2 for analysis 1 o FAC3_1 A-R factor score 3 for analysis 1 Za tymi nazwami ukrywają się wyniki respondentów dla poszczególnych podskal: o FAC1_1 - zaufania do religii o FAC2_1 - opinii o religii jako zjawisku społecznym o FAC3_1 stosunku do Boga Można w bazie zmienić ich nazwy na te przyjaźniejsze do operowania nimi; Jeśli zajrzymy do zakładki dane to zobaczymy, że wartości nowych zmiennych są trochę inne to dlatego, że są zestandaryzowane do rozkładu normalnego. I tak, jeśli respondent uzyskał: o FAC1_1 - zaufania do religii: -0,40498 -> to jego wynik jest poniżej średniej (znak - ) o około pół odchylenia standardowego (0,5), co oznacza, że uzyskał raczej niski wynik na skali i jest osobą ufającą religii; o FAC2_1 - opinii o religii jako zjawisku społecznym: -1,76189 -> to jego wynik jest poniżej średniej (znak - ) o prawie 2 odchylenia standardowe (1,7), co oznacza, że uzyskał bardzo niski wynik na skali i jest osobą bardzo mocno aprobującą Boga; o FAC3_1 stosunku do Boga: 0,34743 -> to jego wynik jest powyżej średniej (znak + ) i około 1/3 odchylenia standardowego (0,3), co oznacza, że uzyskał raczej wysoki wynik na skali i nie ma raczej dobrego zdania o religii jako zjawisku społecznych. Podobnie możemy interpretować wyniki skal nie tylko dla pojedynczych respondentów, ale i dla całych grup; Nowo uzyskane zmienne mogą służyć w dalszych analizach jako zmienne niezależne lub zależne. o Gdybyśmy zrobili analizę czynnikową z rotacją Varimax i jednoczesnym zapisaniem wyników jako nowych zmiennych, to mielibyśmy gotowe predyktory do analizy regresji. Wadą takiego sposobu budowy wskaźnika-skali jest kłopot z interpretacją jego wartości jest to trochę mało intuicyjne i trzeba pamiętać, że odnosimy się do rozkładu normalnego; Zaletą jest z kolei o wiele bardziej precyzyjny wynik niż w przypadku budowy na zasadzie indeksowej. 27