ANALIZY WIELOZMIENNOWE

Wielkość: px
Rozpocząć pokaz od strony:

Download "ANALIZY WIELOZMIENNOWE"

Transkrypt

1 ANALIZY WIELOZMIENNOWE WPROWADZENIE DO TEMATYKI BUDOWY INDEKSÓW I SKAL W trakcie prowadzenia badania, a potem analizowania jego wyników dość często posługujemy się zmiennymi wielowymiarowymi. A raczej nie samymi zmiennymi, ale ich zoperacjonalizowanym odwzorowaniem, czyli złożonymi wskaźnikami i odpowiadającymi im pytaniami kwestionariusza. W praktyce wygląda to tak: Zmienna jednowymiarowa Wskaźnik prosty Kwestionariusz 1 pytanie Wiek Rok urodzenia - deklaracja Chciał(a)bym teraz poprosić Pana(ią) dla celów statystycznych o datę Pana(i) urodzenia? Zmienna wielowymiarowa Wskaźnik złożony Kwestionariusz wiele pytań Zaufanie do religii opinia o Deklaracja dotycząca tego, czy Czy się Pan(i) zgadza czy też nie jej roli w życiu człowieka religia może pomóc w zgadza, że praktykowanie religii określonych sytuacjach życiowych: - odnalezienie wewnętrznego spokoju i szczęścia; - zawieranie przyjaźni; - uzyskanie pocieszenia w kłopotach lub chwilach smutku; pomaga ludziom w... a. odnalezieniu wewnętrznego spokoju i szczęścia b. zawieraniu przyjaźni c. uzyskaniu pocieszenia w kłopotach lub chwilach smutku d. spotykaniu właściwych ludzi - spotykanie właściwych ludzi. Gdybyśmy więc chcieli sprawdzić, czy np. kobiety i mężczyźni różnią się pod względem zaufania do religii (opinii o jej roli w życiu człowieka) to dotychczas poznane sposoby analizy statystycznej nam nie wystarczą. W każdym poznanym teście (chi-kwadrat, t-studenta, Manna-Whitenya, Kruskala-Wallisa, ANOVA) po stronie zmiennej zależnej i niezależnej mogło być tylko po jednej zmiennej. Tymczasem tutaj zmienna zależna (nastawienie do religii) składa się z 4 mniejszych zmiennych. Nie pomoże nam też analiza regresji, bo tam wiele mogło być zmiennych niezależnych zależna była tylko jedna. Rozwiązania są dwa: Budowa indeksu Budowa skali z wykorzystaniem analizy czynnikowej i analizy rzetelności. 1

2 Dla przypomnienia, podobieństwa i różnice pomiędzy indeksem i skalą. Podobieństwa: Indeksy i skale są porządkowymi miernikami zmiennych. Porządkują jednostki analizy w kategoriach konkretnych zmiennych. Mogą być stworzone jedynie dla zmiennych ilościowych (interwałowych i ilorazowych); Wynik danej osoby na przykład na skali lub indeksie religijności stanowi wskazanie co do względnej religijności tej osoby w porównaniu z innymi badanymi. Są złożonymi miernikami zmiennych wynik jest uzależniony od odpowiedzi na kilka (kilkanaście) pytań. Różnice: skala: Taki zestaw powiązanych ze sobą merytorycznie i statystycznie twierdzeń, by przy ich pomocy dało się zmierzyć natężenie danej zmiennej (opinii, postawy) u badanych; Skalę uzyskuje się poprzez operacje matematyczne, a jej wynikiem jest pewna liczba odwzorowujaca natężenie badanej zmiennej. Uwzględnia intensywność obrazowania danej zmiennej przez różne pytania; Podczas budowy skali uwzględniany jest stopień skorelowania zmiennych cząstkowych. Różnice: indeks: Mniej precyzyjne od skal; Formułowane na bardziej liberalnych zasadach; Wskaźniki (pytania) wchodzące w skład indeksu nie muszą być aż tak ściśle ze sobą powiązane merytorycznie i statystycznie; Wynik powstaje dzięki operacjom matematycznym: dodawaniu, mnożeniu, dzieleniu; Z jednej strony mniej precyzyjne, z drugiej czasem łatwiejsze w konstrukcji i przez to nadużywane. 2

3 BUDOWA INDEKSU Przykład: Filtr: rok 2010 Zmienna niezależna: o q8 płeć Zmienna zależna wielowymiarowa, składająca się z pytań: o re34a Czy praktykowanie religii może pomóc w: odnalezieniu wewnętrznego spokoju i szczęścia; o re34b Czy praktykowanie religii może pomóc w: zawieraniu przyjaźni; o re34c Czy praktykowanie religii może pomóc w: uzyskaniu pocieszenia w kłopotach lub chwilach smutku; o re34d Czy praktykowanie religii może pomóc w: spotykaniu właściwych ludzi. Indeks zbudujemy więc na podstawie pytań re34a-re34d. Przed przystąpieniem do budowy indeksu należy upewnić się, czy: a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie lub brak występowania cechy, np. tak/nie); b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta, symetryczna, z wyraźnym środkiem); c) wszystkie pytania mają takie same kafeterie; d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej. Ad. a) Wybrane przez nas zmienne są mierzone na poziomie ilościowym. Ad. b) i c) Kafeteria wszystkich wybranych przez nas pytań wygląda następująco: Zdecydowanie się zgadzam (kod 1) Zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Nie zgadzam się (kod 4) Zdecydowanie się nie zgadzam (kod 5) Trudno powiedzieć (kod 8) Interwałość kafeterii zakłóca odpowiedź trudno powiedzieć, która musi zostać przekodowana jako brak danych. 3

4 Ad d) Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia zmiennej: re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia : re34b Religia sprzyja zawieraniu przyjaźni : re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku : re34d Religia sprzyja spotykaniu właściwych ludzi : o im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii. We wszystkich wybranych pytaniach jest ten sam porządek. Gdyby któreś pytanie wyłamywało się, to trzeba by było je przekodować odwracając kolejność kodów odpowiedzi (wtedy zdecydowanie się zgadzam miało by kod 5) w naszym przypadku nie ma jednak potrzeby przekodowywania. Analiza porządku odpowiedzi pokazuje nam też jak będziemy analizować wynik indeksu. Skoro we wszystkich pytaniach, które wejdą w skład indeksu im wyższy kod odpowiedzi, tym mniejsze zaufanie do religii, to identycznie będzie w indeksie. Tam też im wyższy wynik respondenta, tym mniejsze zaufanie do religii. Gdybyśmy chcieli aby interpretacja indeksu była bardziej intuicyjna (im wyższy kod, tym większe zaufanie) to dla wszystkich pytań należałoby odwrócić porządek odpowiedzi przez rekodowanie (wtedy zdecydowanie się zgadzam miało by kod 5). Budowa indeksu wariant 1. PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI w polu zmienna wynikowa podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind klikając na typ i etykieta możemy od razy nadać zmiennej etykietę, np. Zaufanie do religii indeks w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w oknie dialogowym i listą zmiennych po lewej stronie: re34a + re34b + re34c + re34d Syntax: COMPUTE re34_ind=re34a + re34b + re34c + re34d. VARIABLE LABELS re34_ind 'Zaufanie do religii - indeks'. EXECUTE. Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna nasz indeks. Ma on postać ilościową, nie wymaga definiowania wartości. 4

5 Po zmianie miejsc dziesiętnych na 0 i wyliczeniu częstości dla indeksu mamy tabelę: Zaufanie do religii - indeks Częstość Procent Procent ważnych Procent skumulowany ,7 10,7 10, ,5 2,8 13, ,3 4,7 18, ,5 6,0 24, ,8 27,1 51, ,4 9,2 60, ,2 12,3 72, ,4 7,0 79,7 Ważne ,8 10,7 90, ,3 2,5 92, ,5 2,7 95, ,4 1,5 97, ,0 2,2 99,2 17 2,2,2 99,4 18 1,1,1 99,5 20 5,4,5 100,0 Ogółem ,4 100,0 Braki danych Systemowe braki danych 109 8,6 Ogółem ,0 Jak widać wartości indeksu mieszczą się między 4 a 20. Wartość 4 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się zgadzam ta odpowiedź miała kod 1, więc dało wynik 4. Wartość 20 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się nie zgadzam ta odpowiedź miała kod 5, więc dało wynik 20. Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości minimalnej 4 ), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do wartości maksymalnej 20 ), tym niższe zaufanie do religii. Kłopot może sprawić analiza wartości pośrednich. Bo co oznacza np. wynik indeksu 13? Można sobie z tym poradzić tworząc na użytek interpretacji przedziały, np. o 4 8 = duże zaufanie do religii o 9 14 = umiarkowane zaufanie do religii o = małe zaufanie do religii. Powyższe przedziały to tylko propozycja tak naprawdę możliwości jest bardzo wiele i decyzja, jak to zrobić zależy tylko i wyłącznie od analityka. 5

6 Budowa indeksu wariant 2. PRZEKSZTAŁCENIA -> OBLICZ WARTOSCI w polu zmienna wynikowa podajemy nazwę naszej nowej zmiennej-indeksu, np. re34_ind_2 klikając na typ i etykieta możemy od razy nadać zmiennej etykietę, np. Zaufanie do religii indeks w polu wyrażenie numeryczne wpisujemy, posługując się klawiaturą komputera lub klawiaturą w oknie dialogowym i listą zmiennych po lewej stronie: (re34a + re34b + re34c + re34d)/4 Syntax: COMPUTE re34_ind_2=(re34a + re34b + re34c + re34d)/4. VARIABLE LABELS re34_ind_2 'Zaufanie do religii - indeks'. EXECUTE. Po wywołaniu polecenia w bazie na samym końcu listy zmiennych pojawi się nowa zmienna nasz indeks w wersji 2. Ma on postać ilościową, nie wymaga definiowania wartości. Po wyliczeniu częstości dla indeksu mamy tabelę: Zaufanie do religii - indeks Częstość Procent Procent ważnych Procent skumulowany 1, ,7 10,7 10,7 1, ,5 2,8 13,4 1, ,3 4,7 18,1 1, ,5 6,0 24,1 2, ,8 27,1 51,2 2, ,4 9,2 60,4 2, ,2 12,3 72,7 2, ,4 7,0 79,7 Ważne 3, ,8 10,7 90,3 3, ,3 2,5 92,8 3, ,5 2,7 95,5 3, ,4 1,5 97,0 4, ,0 2,2 99,2 4,25 2,2,2 99,4 4,50 1,1,1 99,5 5,00 5,4,5 100,0 Ogółem ,4 100,0 Braki danych Systemowe braki danych 109 8,6 Ogółem ,0 6

7 Tym razem wartości indeksu mieszczą się między 1 a 5 czyli tak, jak to było w kafeteriach pytań cząstkowych. Wartość 1 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się zgadzam ta odpowiedź miała kod 1, więc ( )/4 dało wynik 1. Wartość 5 uzyskali ci respondenci, którzy na każde z czterech pytań cząstkowych odpowiedzieli zdecydowanie się nie zgadzam ta odpowiedź miała kod 5, więc ( )/4 dało wynik 5. Z analizy kierunku natężenia zmiennej wiemy, że im niższy wynik indeksu (czyli im bliżej wartości minimalnej 1 ), tym wyższe zaufanie do religii. A im wyższy wynik indeksu (czyli im bliżej do wartości maksymalnej 5 ), tym niższe zaufanie do religii. Tym razem analiza wartości pośrednich jest trochę prostsza, bo możemy odnieść je do oryginalnej kafeterii pytań cząstkowych, czyli np.: o 1 (i okolice) = bardzo duże zaufanie do religii o 2 (i okolice) = duże zaufanie do religii o 3 (i okolice) = umiarkowane zaufanie do religii o 4 (i okolice) = małe zaufanie do religii o 5 (i okolice) = bardzo małe zaufanie do religii Dla określenia czym są wskazane przed chwilą okolice można posłużyć się matematyczną zasadą zaokrąglania liczb. Lub scedować to na SPSS jeśli w zakładce zmienne bazy dla tej właśnie zmiennej dziesiętne ustawimy na 0, to program sam dokona zaokrągleń i w efekcie dostaniemy coś takiego: Zaufanie do religii - indeks Częstość Procent Procent ważnych Procent skumulowany ,7 10,7 10, ,5 2,8 13, ,3 4,7 18, ,5 6,0 24, ,8 27,1 51, ,4 9,2 60, ,2 12,3 72,7 Ważne ,4 7,0 79, ,8 10,7 90, ,3 2,5 92, ,5 2,7 95, ,4 1,5 97, ,0 2,2 99,2 4 2,2,2 99,4 5 1,1,1 99,5 7

8 5 5,4,5 100,0 Ogółem ,4 100,0 Braki danych Systemowe braki danych 109 8,6 Ogółem ,0 Oba przedstawione warianty tworzenia indeksu są sobie równorzędne. Decyzja o posługiwaniu się jednym z nich należy zawsze do analityka. Wynik indeksu jest liczbą, co oznacza, że jest to zmienna na poziomie ilościowym i można dla niej wyliczyć wszystkie statystyki opisowe. Indeks może być również z powodzeniem stosowany zarówno jako zmienna zależna (częściej), jak i niezależna (rzadziej). W naszym przykładzie potraktujemy indeks jako zmienną zależną i sprawdzimy, czy kobiety i mężczyźni różnią się pod względem zaufania do religii (opinii o jej roli w życiu człowieka). Nie ma znaczenia, czy wykorzystamy wariant 1 czy 2 indeksu wynik zawsze będzie taki sam. Test t-studenta t(1152) = 2,649; p<0,05 wykazał, że płeć różnicuje zaufanie do religii. Kobiety (średnia 2,19) częściej niż mężczyźni (średnia 2,30) deklarowały większe zaufanie do religii, wskazując, że jej praktykowanie może pomóc w wybranych sytuacjach życiowych. 8

9 ANALIZA CZYNNIKOWA Zbudowanie indeksu było bardzo proste: ot, trzeba tylko sprawdzić parę rzeczy, dodać do siebie kody odpowiednich pytań, a potem zinterpretować uzyskane wartości. Tyle, że przy okazji pominęliśmy kilka ważnych kwestii: Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie? Czy wszystkie podpytania mierzyły tak naprawdę to samo? Czy wszystkie podpytania były jednakowo ważne dla wskaźnika? Analiza czynnikowa pomaga rozwiać powyższe wątpliwości i w rezultacie dzięki niej można stworzyć o wiele bardziej precyzyjny niż indeks wskaźnik: skalę. Przykład: Dane dla roku 2010 Chcemy utworzyć skalę stosunku do religii (opinii o religii) Wybieramy z dostępnych danych następujące zmienne: o re11b Zbyt ufamy nauce, za mało religii o re11c Religia-więcej konfliktów niż pokoju o re11d Osoby religijne często zbyt nietolerancyjne o re19a Bóg zajmuje się osobiście każdą istotą o re19c Życie ma sens bo istnieje Bóg o re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia o re34b Religia sprzyja zawieraniu przyjaźni o re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku o re34d Religia sprzyja spotykaniu właściwych ludzi Przy wyborze zmiennych należy zwrócić uwagę na te same kwestie co, przy indeksie: a) wybrane zmienne są ilościowe lub zero-jedynkowe (dychotomiczne, wskazujące na występowanie lub brak występowania cechy, np. tak/nie); b) w przypadku kafeterii likertowskich jest zachowana interwałowość (kafeteria jest nieparzysta, symetryczna, z wyraźnym środkiem); c) wszystkie pytania mają takie same kafeterie chodzi przede wszystkim o liczbę itemów: jeśli jest różna należy najpierw dokonać standaryzacji zmiennych; d) porządek odpowiedzi uwzględnia jeden kierunek natężenia zmiennej. 9

10 Ad. a) Wszystkie wybrane przez nas zmienne są mierzone na poziomie ilościowym. Ad b) We wszystkich wybranych pytaniach kafeterie są interwałowe, o ile odpowiedź trudno powiedzieć przekoduje się jako brak danych: Zdecydowanie się zgadzam (kod 1) Zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Nie zgadzam się (kod 4) Zdecydowanie się nie zgadzam (kod 5) Trudno powiedzieć (kod 8) Ad c) Wszystkie wybrane pytania mają takie same kafeterie pod względem uporządkowania (wszystkie są likertowskie) i liczby itemów (wszystkie mają po 5 itemów). Gdyby było inaczej (np. kilka kafeterii byłoby 5-elementowych a kilka 7-elementowych) to zamiast redukować większą kafeterię do mniejszej liczby itemów, lepiej dokonać standaryzacji wszytskich branych pod uwagę zmiennych (czyli przełożenia kodów na wartości z rozkładu normalnego): ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE -> ZAPISZ STANDARYZOWANE WARTOŚCI JAKO ZMIENNE Syntax (np. dla zmiennej re19a) DESCRIPTIVES VARIABLES=re19a /SAVE /STATISTICS=MEAN STDDEV MIN MAX. Po wywołaniu polecenia policzą się statystyki opisowe, ale ważniejsze jest, że na końcu naszej listy zmiennych w bazie pojawi się nowa zmienna Zre19a (nazwa nadana przez SPSS zawsze przy standaryzacji jest tak samo: do oryginalnej nazwy zmiennej program dodaje na początku dużą literę Z ). Wartości nowej zmiennej odniesione są do rozkładu tej zmiennej: im bliżej 0 tym bliżej średniej, a wartości mniejsze/większe od zera wskazują na oddalanie się od średniej o wartość odchylenia standardowego (wartości z minusem do te mniejsze od średniej; wartości z plusem to te większe od średniej). 10

11 Ad d) Sprawdzamy, czy kolejność odpowiedzi będzie w każdym pytaniu wskazywała ten sam kierunek natężenia zmiennej: re11b Zbyt ufamy nauce, za mało religii : re11c Religia-więcej konfliktów niż pokoju : o im wyższy kod odpowiedzi, tym większe zaufanie do religii; re11d Osoby religijne często zbyt nietolerancyjne : o im wyższy kod odpowiedzi, tym większe zaufanie do religii; re19a Bóg zajmuje się osobiście każdą istotą : re19c Życie ma sens bo istnieje Bóg : re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia : re34b Religia sprzyja zawieraniu przyjaźni : re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku : re34d Religia sprzyja spotykaniu właściwych ludzi : W naszym przypadku dwa pytania na 9 wybranych mają inny porządek odpowiedzi: tam wskazywanie odpowiedzi wysokokodowanych będzie wskazywało na większe zaufanie do religii. Ponieważ te odmienne pytania są w mniejszości, to przekodujemy je wg wzoru: Stary porządek kafeterii Zdecydowanie się zgadzam (kod 1) Zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Nie zgadzam się (kod 4) Zdecydowanie się nie zgadzam (kod 5) Nowy porządek kafeterii Zdecydowanie się nie zgadzam (kod 1) Nie zgadzam się (kod 2) Ani się zgadzam, ani nie zgadzam (kod 3) Zgadzam się (kod 4) Zdecydowanie się zgadzam (kod 5) UWAGA: rekodujemy korzystając z opcji rekoduj na inne zmienne (by nie tracić oryginałów) i pamiętamy, by przy definiowaniu wartości źródłowych i wynikowych rekodowania zaznaczyć opcję systemowy lub zdefiniowany brak danych -> systemowy brak danych. 11

12 Po zrekodowaniu zmiennych re11c i re11d nasza lista wybranych zmiennych przedstawia się następująco: re11b Zbyt ufamy nauce, za mało religii : re11c_rek Religia-więcej konfliktów niż pokoju - rekodowane : re11d_rek Osoby religijne często zbyt nietolerancyjne - rekodowane : re19a Bóg zajmuje się osobiście każdą istotą : re19c Życie ma sens bo istnieje Bóg : re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia : re34b Religia sprzyja zawieraniu przyjaźni : re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku : re34d Religia sprzyja spotykaniu właściwych ludzi : Możemy teraz przystąpić do wykonywania analizy czynnikowej. Analiza pokaże nam: czy wszystkie wybrane przez nas zmiennej są powiązane nie tylko merytorycznie, ale i statystycznie; jak bardzo dla tworzonej przez nas skali jest istotna każda ze zmiennych; czy w ramach wybranego zestawu zmiennych są czynniki czyli podskale powiązanych ze sobą statystycznie zmiennych ANALIZA -> REDUKCJA WYMIARÓW -> ANALIZA CZYNNIKOWA do okienka po prawej stronie przerzucamy wszystkie interesujące nas zmienne; pole pod spodem Zmienna filtrująca to nie zmienna niezależna! Tutaj nie ma takowej! To możliwość ograniczenia analizy tylko do osób, które na pewne pytanie udzieliły konkretnej wypowiedzi (np. tylko kobiety albo tylko bardzo religijni itp.) to zwykły filtr! Analiza czynnikowa wymaga zdefiniowania szeregu dodatkowych opcji są one ukryte po przyciskami po prawej stronie okna dialogowego. 12

13 1. WYODRĘBNIANIE a) Metoda: Głównych składowych (domyślna) o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent wariancji wyjściowych zmiennych. b) Analiza: Macierz korelacji gdy analizujemy dane surowe, niestandaryzowane; Macierz kowariancji gdy analizujemy dane po standaryzacji. Ponieważ nie robiliśmy standaryzacji, to zostawiamy zaznaczoną domyślnie macierz korelacji. c) Pokaż Nierotowane rozwiązania czynnikowe zostawiamy domyślnie zaznaczone. Wykres osypiska (metoda Catella) gdybyśmy chcieli o liczbie czynników (czyli tych potencjalnych podskal decydować na podstawie metody wykresu osypiska my tutaj nie chcemy, a zainteresowanych odsyłam do literatury) d) Wyodrębnianie Na podstawie wartości własnej większej niż (metoda Kaisera) - zostawiamy domyślnie wpisaną liczbę 1 o Liczbę czynników wyliczy nam SPSS; o Wartość własna określa procent wyjaśnianych przez dany czynnik wariancji; o Jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu oznacza, że nie wchodzi w reakcję z innymi zmiennymi i sam tworzy podskalę, co oznacza, że można go analizować osobno, bez bawienia się analizą czynnikową. Ustalona liczba czynników o Opcja alternatywna do poprzedniej, gdy sami decydujemy ile czynników ma ustalić SPSS; o Do wykorzystania, gdy: Analizowaliśmy wykres osypiska i wiemy ile chcemy czynników; Analizowaliśmy już raz przeprowadzoną analizę czynnikową, gdzie SPSS pokazał nam, że można na podstawie własności własnej większej niż 1 wyodrębnić np. 4 czynniki, a my chcemy zmusić go by pokazał nam rozwiązanie z np. 3 czynnikami. e) Maksimum iteracji dla uzyskania zbieżności zostawiamy domyślnie ustawiona na

14 2. ROTACJA Rotacja rozwiązań czynnikowych pozwala zwiększyć dopasowanie modelu i porządkuje prezentację wyników (co ułatwia ich późniejszą interpretację) a) Metoda - najpopularniejsze: Varimax o Rotacja ortogonalna; o Zakłada brak korelacji pomiędzy czynnikami (podskale nie są ze sobą powiązane); o Przydaje się, gdy przygotowujemy predyktory do analizy regresji (tam jest zalecenie, by predyktory nie korelowały ze sobą); o Trzeba zdawać sobie sprawę, że będzie to trochę sztuczne rozwiązanie rzeczywistość społeczna jest zbyt skomplikowana, by móc oczekiwać całkowitego braku pomiędzy występującymi w niej zjawiskami. Prosta Oblimin o Rotacja nieortogonalna (ukośna); o Zakłada, że istnieje korelacja pomiędzy czynnikami; o Pokazuje czy i jak silna jest to zależność (może się zdarzyć, że wskaże brak zależności, a wtedy dobrze policzyć analizę czynnikową jeszcze raz, wybierając rotację Varimax); o Wybierając ją zostawiamy domyślnie wpisane wartości Delta i Kappa. b) Reszta opcji pozostawiona domyślnie. UWAGA: Policzymy analizę czynnikową dwukrotnie: najpierw z rotacją Varimax, a potem z rotacją Oblimin. 3. OPCJE a) Brak danych Zostawiamy domyślnie zaznaczone wyłączanie wszystkich obserwacji z brakami ; Oznacza to, że jeśli ktoś na którekolwiek z branych przez nas pod uwagę pytań udzielił odpowiedzi równoznacznej z brakiem danych (np. trudno powiedzieć), to jego odpowiedzi nie będą uwzględniane przy wyliczeniach analizy czynnikowej. b) Format wyświetlania współczynników Sortuj według wartości ładunków czynnikowych 14

15 o Zaznaczamy; o To jest opcja, która porządkuje tabelę wyników i ułatwia interpretację. Ukryj małe współczynniki o Zaznaczamy; o W pole wartość bezwzględna poniżej wpisujemy 0,4 ; o Przyjmuje się, że jest to minimalna wartość z jaką czynnik ładuje zmienną czyli liczba pokazująca jak mocno dana zmienna przynależy do danego czynnika. 4. STATYSTYKI a) Statystyki Statystyki opisowe zaznaczamy, mogą się przydać przy interpretacji; Rozwiązania wstępne zostawiamy zaznaczone domyślnie b) Macierz korelacji z dostępnych opcji zaznaczamy: K-M-O i test sferyczności Bartletta o K-M-O to miara adekwatności doboru próby o To stosunek korelacji zmiennych do ich korelacji częściowej, czyli wielkość unikalnego związku; o Najlepiej, gdy ma wartość bliską 1; o Za minimum przyjmuje się 0,5 jeśli jest poniżej, to analiza czynnikowa nie jest wiarygodna (zmienne są słabo ze sobą pokorelowane); 5. OCENY W tym momencie nie zaznaczamy tu żadnej z opcji. a) Zapisz jako zmienne Metoda: Anderson-Rubin Każdy wyodrębniony czynnik zostanie zapisany jako nowa zmienna Wartości będą wystandaryzowane do rozkładu normalnego Należy je interpretować w kategoriach odległości od średniej: o Ujemne niski wynik na skali (poniżej średniej) o Okolice zera wynik przeciętny (średni) o Dodatnie wysoki wynik na skali (powyżej średniej) Tak utworzone zmienne mogą być traktowane jako niezależne lub zależne w innych obliczeniach; 15

16 Syntax: FACTOR /VARIABLES re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d /MISSING LISTWISE /ANALYSIS re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d /PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION /FORMAT SORT BLANK(0.4) /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PC /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION. Gdzie w linii kodu: /VARIABLES lista nazw zmiennych /MISSING LISTWISE - wyłączanie wszystkich obserwacji z brakami /ANALYSIS - lista zmiennych przy liczeniu statystyk opisowych /PRINT UNIVARIATE INITIAL KMO EXTRACTION ROTATION - pokazuje rozwiązania początkowe (nierotowane) oraz miarę K-M-O /FORMAT SORT BLANK(0.4) - zdefiniowana wartość minimalna ładunku czynnikowego pokazywanego w tabeli i sortowanie wg wartości ładunków czynnikowych /CRITERIA MINEIGEN(1) ITERATE(25) - kryterium Kaisera z własnością własną min. 1 /EXTRACTION PC nazwa metody: głównych składowych /CRITERIA ITERATE(25) - metoda oparta na korelacji /ROTATION VARIMAX wybrana rotacja: Varimax (jeśli wybralibyśmy Oblimin to byłyby dwie linie: /CRITERIA ITERATE(25) DELTA(0) /ROTATION OBLIMIN /METHOD=CORRELATION. metoda oparta na macierzy korelacji (jeśli wybralibyśmy macierz kowariancji, to linia wyglądałaby: /METHOD=COVARIANCE Jeśli chcielibyśmy zapisać czynniki jako zmienne to w przedostatniej linii trzeba by było dopisać nową linijkę kodu: /SAVE AR(ALL) 16

17 Po wywołaniu polecenia (analiza czynnikowa z rotacją Varimax) otrzymujemy następujące tabele: a) Statystyki opisowe Średnia Odchylenie standardowe Analizowane obserwacje N Zbyt ufamy nauce, za mało religii 3,55 1, Religia-więcej konfliktów niż pokoju 3,26 1, Osoby religijne często zbyt nietolerancyjne 3,58 1, Bóg zajmuje się osobiście każdą istotą 2,37 1, Życie ma sens bo istnieje Bóg 3,00 1, odnalezieniu wewnętrznego spokoju i szczęścia 1,99, zawieraniu przyjaźni 2,51, uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,96, spotykaniu właściwych ludzi 2,56, Tabela informuje nas: O średniej wartości odpowiedzi (a pamiętamy, że im niższa wartość tym większe zaufanie do religii) O odchyleniu standardowym (im wyższe, tym większe rozbieżności w odpowiedziach badanych) Analizowanych obserwacjach (wiemy dla ilu osób została policzona analiza czynnikowa) b) Testy Kaisera-Mayera-Olkina i Bartletta Miara KMO adekwatności doboru próby,768 Przybliżone chi-kwadrat 3352,786 Test sferyczności Bartletta df 36 Istotność,000 Wartość miary K-M-O to 0,768: Jest powyżej 0,5 czyli nasza analiza czynnikowa jest wiarygodna Do wartości 1 trochę brakuje, ale to nic nie szkodzi. Test sferyczności Bartletta Jest istotny: p<0,05 Co oznacza, że macierz korelacji zawiera istotne współczynniki korelacji innymi słowy: brane przez nas pod uwagę zmienne są ze sobą powiązane (a to bardzo dobrze) Jeśli obie miary (K-M-O i test Bartletta) dadzą niesatysfakcjonujące wyniki, to należy przemyśleć rekonstrukcję zestawu zmiennych może jest tam zmienna, która psuje, bo jest nieskorelowana z pozostałymi? 17

18 c) Zasoby zmienności wspólnej Początkowe Po wyodrębnieniu Zbyt ufamy nauce, za mało religii 1,000,615 Religia-więcej konfliktów niż pokoju 1,000,768 Osoby religijne często zbyt nietolerancyjne 1,000,727 Bóg zajmuje się osobiście każdą istotą 1,000,567 Życie ma sens bo istnieje Bóg 1,000,678 odnalezieniu wewnętrznego spokoju i szczęścia 1,000,714 zawieraniu przyjaźni 1,000,671 uzyskaniu pocieszenia w kłopotach lub chwilach smutku 1,000,724 spotykaniu właściwych ludzi 1,000,708 Metoda wyodrębniania czynników głównych składowych. Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych czynnikach; Im więcej, tym lepiej oznacza to, że zmienna dobrze wpisuje się w tworzone czynniki. d) Całkowita wyjaśniona wariancja Składowa Początkowe wartości własne Sumy kwadratów ładunków po wyodrębnieniu Sumy kwadratów ładunków po rotacji Ogółem % wariancji % skum. Ogółem % wariancji % skum. Ogółem % wariancji % skumulowany 1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30, ,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51, ,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576 4,778 8,639 77,215 5,685 7,609 84,824 6,485 5,386 90,210 7,402 4,462 94,671 8,286 3,183 97,854 9,193 2, ,000 Metoda wyodrębniania czynników głównych składowych. Tabela informuje nas: Ile wyodrębniono czynników o wartości własnej większej niż 1 na podstawie ostatniej części tabeli (sumy kwadratów ładunków po rotacji) widać, że są to trzy czynniki (tu nazwane składowymi za względu na to, że metodą wyodrębniania była metoda głównych składowych); Ile procent wariancji wyjaśniają w sumie te trzy czynniki: u nas to 68,576% wariancji. To ponad 2/3 wszystkich analizowanych przez nas przypadków, a więc całkiem sporo. 18

19 e) Macierz składowych a Składowa spotykaniu właściwych ludzi,811 zawieraniu przyjaźni,774 odnalezieniu wewnętrznego spokoju i szczęścia,749 uzyskaniu pocieszenia w kłopotach lub chwilach smutku,719 Bóg zajmuje się osobiście każdą istotą,680 Życie ma sens bo istnieje Bóg,653,482 Osoby religijne często zbyt nietolerancyjne,744 Religia-więcej konfliktów niż pokoju,412,696 Zbyt ufamy nauce, za mało religii,435,653 Metoda wyodrębniania czynników - Głównych składowych. a. 3 liczba wyodrębnionych składowych. Nierotowana macierz składowych (wyodrębnionych czynników) pomijamy. f) Macierz rotowanych składowych a Składowa uzyskaniu pocieszenia w kłopotach lub chwilach smutku,846 odnalezieniu wewnętrznego spokoju i szczęścia,831 spotykaniu właściwych ludzi,766 zawieraniu przyjaźni,763 Zbyt ufamy nauce, za mało religii,779 Życie ma sens bo istnieje Bóg,763 Bóg zajmuje się osobiście każdą istotą,610 Religia-więcej konfliktów niż pokoju,862 Osoby religijne często zbyt nietolerancyjne,834 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Varimax z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 4 iteracjach. Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych. Mamy trzy wyodrębnione czynniki: o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia; o Czynnik nr 2 to podpytania dotyczące wielkości Boga (opinii nt. Boga); o Czynnik nr 3 to podpytania dotyczące religii jako pewnego zjawiska społecznego. Każdy z czynników to osobna podskala. Zgodnie z założeniem rotacji Varimax te podskale uznajemy za nieskorelowane ze sobą. 19

20 Teraz wykonamy analizę czynnikową z rotacją Oblimin czyli przy założeniu korelacji pomiędzy czynnikami. a) Statystyki opisowe interpretacja jak poprzednio. b) Miara K-M-O i test sferyczności Bartletta interpretacja jak poprzednio. c) Zasoby zmienności wspólnej interpretacja jak poprzednio. d) Całkowita wyjaśniona wariancja Składowa Początkowe wartości własne Sumy kwadratów ładunków po wyodrębnieniu Sumy kwadratów ładunków po rotacji a Ogółem % wariancji % skumulowany Ogółem % wariancji % skumulowany Ogółem 1 3,736 41,514 41,514 3,736 41,514 41,514 3, ,353 15,033 56,547 1,353 15,033 56,547 1, ,083 12,028 68,576 1,083 12,028 68,576 2,308 4,778 8,639 77,215 5,685 7,609 84,824 6,485 5,386 90,210 7,402 4,462 94,671 8,286 3,183 97,854 9,193 2, ,000 Metoda wyodrębniania czynników głównych składowych. a. Dodawanie sum kwadratów ładunków w celu otrzymania ogólnej wariancji nie jest możliwe, gdy składowe są skorelowane. Tabela informuje nas: O liczbie wyodrębnionych czynników: 3. O procencie wariancji wyjaśniającym w sumie te trzy czynniki: 68,576%. Tak więc podobnie jak w przypadku rotacji Varimax mamy wyodrębnione trzy czynniki i taki sam procent wyjaśnionych wariancji. 20

21 e) Macierz składowych a Składowa spotykaniu właściwych ludzi,811 zawieraniu przyjaźni,774 odnalezieniu wewnętrznego spokoju i szczęścia,749 uzyskaniu pocieszenia w kłopotach lub chwilach smutku,719 Bóg zajmuje się osobiście każdą istotą,680 Życie ma sens bo istnieje Bóg,653,482 Osoby religijne często zbyt nietolerancyjne,744 Religia-więcej konfliktów niż pokoju,412,696 Zbyt ufamy nauce, za mało religii,435,653 Metoda wyodrębniania czynników - Głównych składowych. a. 3 liczba wyodrębnionych składowych. Nierotowana macierz składowych (wyodrębnionych czynników) pomijamy. f) Macierz modelowa a Składowa uzyskaniu pocieszenia w kłopotach lub chwilach smutku,894 odnalezieniu wewnętrznego spokoju i szczęścia,862 zawieraniu przyjaźni,759 spotykaniu właściwych ludzi,750 Religia-więcej konfliktów niż pokoju,876 Osoby religijne często zbyt nietolerancyjne,850 Zbyt ufamy nauce, za mało religii,823 Życie ma sens bo istnieje Bóg,745 Bóg zajmuje się osobiście każdą istotą,553 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 5 iteracjach. Macierz po rotacji, uszeregowaniu czynników i ukryciu niskich wartości ładunków czynnikowych. Mamy trzy wyodrębnione czynniki: o Czynnik nr 1 to podpytania dotyczące tego, w czym może pomóc religia; o Czynnik nr 2 to podpytania dotyczące religii jako pewnego zjawiska społecznego; o Czynnik nr 3 to podpytania dotyczące wielkości Boga (opinii nt. Boga). Każdy z czynników to osobna podskala. Zgodnie z założeniem rotacji Oblimin te podskale uznajemy za skorelowane ze sobą. 21

22 g) Macierz korelacji składowych Składowa ,000,261,380 2,261 1,000,210 3,380,210 1,000 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. Pokazuje korelacje pomiędzy poszczególnymi czynnikami: o Czynnik 1 i 2 korelacja 0,261 czyli słaba; o Czynnik 1 i 3 korelacja 0,38 czyli umiarkowana; o Czynnik 2 i 3 korelacja 0,21 czyli słaba. Nie są to korelacje zbyt wysokie, ale mimo wszystko pokazują, że czynniki są współzależne. Na podstawie przeprowadzonej analizy czynnikowej (niezależnie od metody rotacji) wiemy, że następująca lista zmiennych: re11b Zbyt ufamy nauce, za mało religii re11c_rek Religia-więcej konfliktów niż pokoju re11d_rek Osoby religijne często zbyt nietolerancyjne re19a Bóg zajmuje się osobiście każdą istotą re19c Życie ma sens bo istnieje Bóg re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia re34b Religia sprzyja zawieraniu przyjaźni re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku re34d Religia sprzyja spotykaniu właściwych ludzi nie tworzy jednej spójnej skali (jednego spójnego wskaźnika). Mamy tak naprawdę trzy skale, które za każdym razem mierzą trochę inne rzeczy: zaufania do religii (re34a, re34b, re34c, re34d) o im wyższy wynik na skali tym mniejsze zaufanie stosunku do Boga (re11b, re19a, re19c) o im wyższy wynik na skali tym silniejsza negacja Boga opinii o religii jako zjawisku społecznym (re11c_rek, re11d_rek) o im wyższy wynik na skali tym silniejsza opinia negatywna nt. religii jako zjawiska społecznego 22

23 Zanim jednak utworzymy te skale (na razie wiemy, że można je wyróżnić, ale jako osobne zmienne jeszcze nie istnieją), warto sprawdzić ich rzetelność czyli jak bardzo są spójne i czy usunięcie któregokolwiek itemu nie poprawiłoby jakości skali. ANALIZA -> SKALOWANIE -> ANALIZA RZETELNOŚCI 1. Przykład: dla skali zaufania do religii (re34a, re34b, re34c, re34d) interesujące nas zmienne przerzucamy do okienka po prawej w statystyki zaznaczamy: o pozycja testowa o skala przy wykluczeniu pozycji Syntax: RELIABILITY /VARIABLES=re34a re34b re34c re34d /SCALE('ALL VARIABLES') ALL /MODEL=ALPHA /STATISTICS=DESCRIPTIVE /SUMMARY=TOTAL. Po wywołaniu polecenia otrzymujemy kilka tabel, z których interpretujemy tylko dwie: a) Statystyki rzetelności Alfa Cronbacha Liczba pozycji,851 4 wartość Alfa Cronbacha jest miarą rzetelności skali: o minimum powinno być 0,5 poniżej skala jest kiepska o najlepiej by było w okolicach 0,7 o ale im bliżej 1 tym lepiej 23

24 b) Statystyki pozycji Ogółem Średnia skali po Wariancja skali Korelacja Alfa Cronbacha usunięciu po usunięciu pozycji Ogółem po usunięciu pozycji pozycji pozycji odnalezieniu wewnętrznego spokoju i szczęścia 6,99 5,748,662,824 zawieraniu przyjaźni 6,46 4,818,721,798 uzyskaniu pocieszenia w kłopotach lub chwilach smutku 7,01 5,705,663,823 spotykaniu właściwych ludzi 6,43 4,712,737,791 interesuje nas tylko wynik z ostatniej kolumny; pokazuje on, jaką wartość przyjęłaby miara Alfa Cronbacha, gdyby ze skali usunięto daną zmienną; patrzymy, czy w którymkolwiek przypadku Alfa byłaby większa gdyby tak było, to warto ze skali usunąć psującą ją zmienną; w naszym przypadku usunięcie którejkolwiek ze zmiennych nie zwiększy wartości Alfa skala jest więc dobra w takiej postaci, w jakiej jest. 2. A teraz przyjmijmy, że nie mamy wiedzy, którą dostarczyła nam analiza czynnikowa. Wybraliśmy zestaw 9 zmiennych, które wg nas mogą tworzyć skalę: re11b Zbyt ufamy nauce, za mało religii re11c_rek Religia-więcej konfliktów niż pokoju re11d_rek Osoby religijne często zbyt nietolerancyjne re19a Bóg zajmuje się osobiście każdą istotą re19c Życie ma sens bo istnieje Bóg re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia re34b Religia sprzyja zawieraniu przyjaźni re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku re34d Religia sprzyja spotykaniu właściwych ludzi Wykonujemy analizę rzetelności, żeby zobaczyć, jak dobra jest to skala. Syntax: RELIABILITY /VARIABLES=re11b re11c_rek re11d_rek re19a re19c re34a re34b re34c re34d /SCALE('ALL VARIABLES') ALL /MODEL=ALPHA /STATISTICS=DESCRIPTIVE /SUMMARY=TOTAL. 24

25 Po wywołaniu polecenia zaglądamy do tabeli z Alfą Cronbacha: Statystyki rzetelności Alfa Cronbacha Liczba pozycji,804 9 Nie jest źle: Alfa ma wartość 0,804, czyli jest zdecydowanie powyżej zakładanego progu minimum (0,5). Zobaczmy, czy taką skalę da się poprawić: Statystyki pozycji Ogółem Średnia skali po Wariancja skali Korelacja Alfa Cronbacha usunięciu po usunięciu pozycji Ogółem po usunięciu pozycji pozycji pozycji Zbyt ufamy nauce, za mało religii 21,23 27,120,333,806 Religia-więcej konfliktów niż pokoju 21,52 26,686,349,805 Osoby religijne często zbyt nietolerancyjne 21,20 26,668,346,805 Bóg zajmuje się osobiście każdą istotą 22,41 23,949,575,774 Życie ma sens bo istnieje Bóg 21,78 24,148,552,778 odnalezieniu wewnętrznego spokoju i szczęścia 22,79 26,197,583,778 zawieraniu przyjaźni 22,27 24,733,612,770 uzyskaniu pocieszenia w kłopotach lub chwilach smutku 22,81 26,475,540,782 spotykaniu właściwych ludzi 22,22 24,112,664,763 wyrzucenie pierwszych trzech zmiennych mogłoby nam lekko podnieść wartość Alfa: o 0,001-0,002 czyli naprawdę niewiele to zmiana w zasadzie nieistotna; wyrzucenie którejkolwiek z pozostałych zmiennych wartość Alfa zmniejszy czyli skala będzie słabsza. UWAGA: analiza rzetelności nie pokazała nam wyraźnie, że zestaw 9 wybranych zmiennych rozpada się na podskale; gdybyśmy kierowali się tylko i wyłącznie jej wynikiem, to zbudowaliśmy wskaźnik z wszystkich 9 zmiennych; biorąc więc pod uwagę taki scenariusz warto jednak najpierw wykonywać analizę czynnikową, która sięga głębiej w dane i jest w stanie ujawnić ukryte w nich struktury; analiza rzetelności może więc: o albo pomóc w dopracowaniu wyników analizy czynnikowej; o albo zasugerować jedynie, że wśród wybranych zmiennych mamy podskale z całkowitą pewnością jednak ich nie ujawni to zrobi dopiero analiza czynnikowa. 25

26 Wróćmy do wyodrębnionej skali zaufania do religii. Przypomnijmy, że składa się ona z czterech zmiennych: re34a Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia re34b Religia sprzyja zawieraniu przyjaźni re34c Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku re34d Religia sprzyja spotykaniu właściwych ludzi I w bazie te zmienne wciąż widnieją osobno. Jak zamienić je na jeden wskaźnik-skalę? Sposób 1 Na podstawie zmiennych, które wchodzą w skład wyodrębnionej skali budujemy wskaźnik sumaryczny, którego wartość będzie wartością uzyskaną przez respondenta na skali; Innymi słowy: dokonujemy tej samej operacji co przy indeksie: dodajemy do siebie wybrane pytania, które tworzą skalę; Wynik uzyskany przez respondenta interpretujemy tak samo, jak to robiliśmy w przypadku indeksu: zgodnie z natężeniem wartości zmiennych w kafeteriach; Uzyskany wskaźnik możemy wykorzystywać jako zmienną niezależna lub zależną; Co w takim razie jest inaczej niż wtedy, gdy robiliśmy indeks? o Tym razem mamy mocne podstawy, by sądzić, że zmienne wchodzące w skład wskaźnikaskali są ze sobą powiązane merytorycznie i statystycznie. o W przypadku, gdy od razu budowaliśmy indeks (dodawaliśmy do siebie pytania) my tylko zakładaliśmy, że tak jest dowodów jednak nie było. Dostarczyła ich dopiero analiza czynnikowa. Wadą tego sposobu budowy wskaźnika-skali jest to, że: o wszystkie pytania traktujemy jako jednakowo ważne dla skali a to nieprawda. Analiza czynnikowa pokazywała nam, że czynniki w różny sposób ładują konkretne zmienne. Zaletą tego sposobu jest prostota: i wykonania, i interpretacji wyniku. Sposób 2 Wykonujemy jeszcze raz analizę czynnikową z rotacją Oblimin (bo wiemy już, że czynniki są ze sobą skorelowane) Tym razem w OCENY zaznaczamy o Zapisz jako zmienne o Metoda: Anderson-Rubin 26

27 Analiza czynnikowa wykonała się ponownie, a to co jest nowego znajdziemy w bazie na końcu pojawiły się trzy nowe zmienne: o FAC1_1 A-R factor score 1 for analysis 1 o FAC2_1 A-R factor score 2 for analysis 1 o FAC3_1 A-R factor score 3 for analysis 1 Za tymi nazwami ukrywają się wyniki respondentów dla poszczególnych podskal: o FAC1_1 - zaufania do religii o FAC2_1 - opinii o religii jako zjawisku społecznym o FAC3_1 stosunku do Boga Można w bazie zmienić ich nazwy na te przyjaźniejsze do operowania nimi; Jeśli zajrzymy do zakładki dane to zobaczymy, że wartości nowych zmiennych są trochę inne to dlatego, że są zestandaryzowane do rozkładu normalnego. I tak, jeśli respondent uzyskał: o FAC1_1 - zaufania do religii: -0, > to jego wynik jest poniżej średniej (znak - ) o około pół odchylenia standardowego (0,5), co oznacza, że uzyskał raczej niski wynik na skali i jest osobą ufającą religii; o FAC2_1 - opinii o religii jako zjawisku społecznym: -1, > to jego wynik jest poniżej średniej (znak - ) o prawie 2 odchylenia standardowe (1,7), co oznacza, że uzyskał bardzo niski wynik na skali i jest osobą bardzo mocno aprobującą Boga; o FAC3_1 stosunku do Boga: 0, > to jego wynik jest powyżej średniej (znak + ) i około 1/3 odchylenia standardowego (0,3), co oznacza, że uzyskał raczej wysoki wynik na skali i nie ma raczej dobrego zdania o religii jako zjawisku społecznych. Podobnie możemy interpretować wyniki skal nie tylko dla pojedynczych respondentów, ale i dla całych grup; Nowo uzyskane zmienne mogą służyć w dalszych analizach jako zmienne niezależne lub zależne. o Gdybyśmy zrobili analizę czynnikową z rotacją Varimax i jednoczesnym zapisaniem wyników jako nowych zmiennych, to mielibyśmy gotowe predyktory do analizy regresji. Wadą takiego sposobu budowy wskaźnika-skali jest kłopot z interpretacją jego wartości jest to trochę mało intuicyjne i trzeba pamiętać, że odnosimy się do rozkładu normalnego; Zaletą jest z kolei o wiele bardziej precyzyjny wynik niż w przypadku budowy na zasadzie indeksowej. 27

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy

Bardziej szczegółowo

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór. L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy

Bardziej szczegółowo

ANALIZY WIELOZMIENNOWE

ANALIZY WIELOZMIENNOWE ANALIZY WIELOZMIENNOWE ANALIZA REGRESJI Charakterystyka: Rozszerzenie analizy korelacji o badanie zależności pomiędzy wieloma zmiennymi jednocześnie; Podstawowe zastosowanie (ale przez nas w tym momencie

Bardziej szczegółowo

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Celem poniższej analizy było stworzenie skali mierzącej problematyczne zachowania finansowej. Takie zachowania zdefiniowano jako

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

Wskaźniki a tablice Wskaźniki i tablice są ze sobą w języku C++ ściśle związane. Aby się o tym przekonać wykonajmy cwiczenie.

Wskaźniki a tablice Wskaźniki i tablice są ze sobą w języku C++ ściśle związane. Aby się o tym przekonać wykonajmy cwiczenie. Część XXII C++ w Wskaźniki a tablice Wskaźniki i tablice są ze sobą w języku C++ ściśle związane. Aby się o tym przekonać wykonajmy cwiczenie. Ćwiczenie 1 1. Utwórz nowy projekt w Dev C++ i zapisz go na

Bardziej szczegółowo

Przypomnienie: Ćwiczenie 1.

Przypomnienie: Ćwiczenie 1. Strona1 Przypomnienie: Zmienne statystyczne można podzielić na: 1. Ilościowe, czyli mierzalne (przedstawiane liczbowo) w tym: skokowe inaczej dyskretne (przyjmują skończoną lub co najwyżej przeliczalną

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka Wprowadzenie do SPSS PRACA SOCJALNA Rok 1 Czym jest SPSS? SPSS to bardzo rozbudowany program. Pozwala sprawnie pracować ze zbiorami danych, analizować własne

Bardziej szczegółowo

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Poniżej prezentujemy przykładowe pytania z rozwiązaniami dotyczącymi dwuczynnikowej analizy wariancji w schemacie 2x2. Wszystkie rozwiązania są

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna 1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu cecha (właściwość), którą posiadają jednostki badanej zbiorowości, przyjmującą co najmniej dwie wartości. Zmienna to właściwość pod względem której elementy zbioru różnią się między sobą Przyjmuje dowolne

Bardziej szczegółowo

Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim

Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim Zasady rzetelnego pomiaru efektywności transferu wiedzy w e-learningu akademickim Wojciech BIZON Wydział Ekonomiczny Uniwersytet Gdański 1 Problem w długim horyzoncie czasowym do rozwiązania: w jaki sposób

Bardziej szczegółowo

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu cecha (właściwość), którą posiadają jednostki badanej zbiorowości, przyjmującą co najmniej dwie wartości. Zmienna to właściwość pod względem której elementy zbioru różnią się między sobą Przyjmuje dowolne

Bardziej szczegółowo

Przygotowanie danych

Przygotowanie danych 2 Przygotowanie danych 2 Przygotowanie danych Przed opracowaniem statystycznym należy uporządkować dane. Czynność ta ułatwia opracowywanie danych. Od czasu, kiedy pojawiły się komputery, procedury porządkowania

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo

Niestandardowa tabela częstości

Niestandardowa tabela częstości raportowanie Niestandardowa tabela częstości Przemysław Budzewski Predictive Solutions Do czego dążymy W Generalnym Sondażu Społecznym USA w 1991 roku badaniu poddano respondentów należących do szeregu

Bardziej szczegółowo

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Celem poniższej analizy było stworzenie skali mierzącej problematyczne zachowania finansowe. Takie zachowania zdefiniowano jako zachowania

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35 Statystyka Wykład 7 Magdalena Alama-Bućko 16 kwietnia 2017 Magdalena Alama-Bućko Statystyka 16 kwietnia 2017 1 / 35 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD

Bardziej szczegółowo

KORELACJE (zmienne ilościowe i porządkowe)

KORELACJE (zmienne ilościowe i porządkowe) OBLICZENIE WSPÓŁCZYNNIKA KORELACJI R-Persona, Rho-Spearmana, tau-b Kendala Aby policzyć korelacje między zmiennymi ilościowymi/porządkowymi (R-Persona, Rho-Spearmana, tau-b Kendala): - wybieramy menu Analiza>Korelacje>Parami

Bardziej szczegółowo

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych

Bardziej szczegółowo

ANALIZA CZYNNIKOWA Przykład 1

ANALIZA CZYNNIKOWA Przykład 1 ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Analiza współzależności zjawisk

Analiza współzależności zjawisk Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

10. Podstawowe wskaźniki psychometryczne

10. Podstawowe wskaźniki psychometryczne 10. Podstawowe wskaźniki psychometryczne q analiza własności pozycji testowych q metody szacowania mocy dyskryminacyjnej q stronniczość pozycji testowych q własności pozycji testowych a kształt rozkładu

Bardziej szczegółowo

Metoda Karnaugh. B A BC A

Metoda Karnaugh. B A BC A Metoda Karnaugh. Powszechnie uważa się, iż układ o mniejszej liczbie elementów jest tańszy i bardziej niezawodny, a spośród dwóch układów o takiej samej liczbie elementów logicznych lepszy jest ten, który

Bardziej szczegółowo

Co to jest niewiadoma? Co to są liczby ujemne?

Co to jest niewiadoma? Co to są liczby ujemne? Co to jest niewiadoma? Co to są liczby ujemne? Można to łatwo wyjaśnić przy pomocy Edukrążków! Witold Szwajkowski Copyright: Edutronika Sp. z o.o. www.edutronika.pl 1 Jak wyjaśnić, co to jest niewiadoma?

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z

Bardziej szczegółowo

(x j x)(y j ȳ) r xy =

(x j x)(y j ȳ) r xy = KORELACJA. WSPÓŁCZYNNIKI KORELACJI Gdy w badaniu mamy kilka cech, często interesujemy się stopniem powiązania tych cech między sobą. Pod słowem korelacja rozumiemy współzależność. Mówimy np. o korelacji

Bardziej szczegółowo

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona Nieparametryczne odpowiedniki testów T-Studenta stosujemy gdy zmienne mierzone są na skalach porządkowych (nie można liczyć średniej) lub kiedy mierzone są na skalach ilościowych, a nie są spełnione wymagania

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA Dobór metody prezentacji danych Dobór metody prezentacji danych zależy od: charakteru danych

Bardziej szczegółowo

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY definicja rzetelności błąd pomiaru: systematyczny i losowy Psychometria Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. rozkład X + błąd losowy rozkład X rozkład X + błąd systematyczny

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

13. Równania różniczkowe - portrety fazowe

13. Równania różniczkowe - portrety fazowe 13. Równania różniczkowe - portrety fazowe Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie rzegorz Kosiorowski (Uniwersytet Ekonomiczny 13. wrównania Krakowie) różniczkowe - portrety fazowe 1 /

Bardziej szczegółowo

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Kontekstowe wskaźniki efektywności nauczania - warsztaty Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Jak przekształcać zmienne jakościowe?

Jak przekształcać zmienne jakościowe? Data Preparation Jak przekształcać zmienne jakościowe? Marta Płonka Predictive Solutions W ostatnim artykule zobaczyliśmy, jak sprawdzić, czy między wybranymi przez nas predyktorami a zmienną przewidywaną

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

ANALIZA REGRESJI SPSS

ANALIZA REGRESJI SPSS NLIZ REGRESJI SPSS Metody badań geografii społeczno-ekonomicznej KORELCJ REGRESJ O ile celem korelacji jest zmierzenie siły związku liniowego między (najczęściej dwoma) zmiennymi, o tyle w regresji związek

Bardziej szczegółowo

TABELKA ANOVA (jednoczynnikowa)

TABELKA ANOVA (jednoczynnikowa) TABELKA ANOVA (jednoczynnikowa) Jednoczynnikowa ANOVA nazwa zmiennej zależnej Między grupami Suma kwadratów df Średni kwadrat F Istotność k 1 SSMG / dfmg MSMG / MSWG brane z tablic Wewnątrz grup 2 z 3

Bardziej szczegółowo

Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4

Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4 Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4 Uwaga! Każde ćwiczenie rozpoczynamy od stworzenia w katalogu Moje dokumenty swojego własnego katalogu roboczego, w którym będziecie Państwo zapisywać swoje pliki.

Bardziej szczegółowo

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22 Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Wykład 3: Prezentacja danych statystycznych

Wykład 3: Prezentacja danych statystycznych Wykład 3: Prezentacja danych statystycznych Dobór metody prezentacji danych Dobór metody prezentacji danych zależy od: charakteru danych statystycznych (inne metody wybierzemy dla danych przekrojowych,

Bardziej szczegółowo

Jak korzystać z przeglądarki danych ESS SoftReport

Jak korzystać z przeglądarki danych ESS SoftReport Jak korzystać z przeglądarki danych ESS SoftReport Instalacja 1. Do korzystania z przeglądarki konieczne jest zainstalowanie programu ESS SoftReport. W tym celu należy wejść na stronę internetową http://www.ifispan.waw.pl/ess

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.

Bardziej szczegółowo

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej: Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane

Bardziej szczegółowo

08. Normalizacja wyników testu

08. Normalizacja wyników testu 08. Normalizacja wyników testu q Pojęcie normy q Rodzaje norm q Znormalizowana skala ciągła ( z ) q Znormalizowane skale skokowe q Kryteria wyboru właściwej skali standardowej vpojęcie normy Norma -wzór,

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2017/2018 STATYSTYKA

Bardziej szczegółowo

Luty 2001 Algorytmy (7) 2000/2001 s-rg@siwy.il.pw.edu.pl

Luty 2001 Algorytmy (7) 2000/2001 s-rg@siwy.il.pw.edu.pl System dziesiętny 7 * 10 4 + 3 * 10 3 + 0 * 10 2 + 5 *10 1 + 1 * 10 0 = 73051 Liczba 10 w tym zapisie nazywa się podstawą systemu liczenia. Jeśli liczba 73051 byłaby zapisana w systemie ósemkowym, co powinniśmy

Bardziej szczegółowo

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1 Temat: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00 0,20) Słaba

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Programowanie w języku C++ Agnieszka Nowak Brzezińska Laboratorium nr 2

Programowanie w języku C++ Agnieszka Nowak Brzezińska Laboratorium nr 2 Programowanie w języku C++ Agnieszka Nowak Brzezińska Laboratorium nr 2 1 program Kontynuujemy program który wczytuje dystans i ilości paliwa zużytego na trasie, ale z kontrolą danych. A więc jeśli coś

Bardziej szczegółowo

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych.

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych. bieżąca w wyświetla wartości w kolejnych wierszach lub kolejnych kolumnach jako wartości skumulowane (w drugim wierszu wyświetla sumę wartości odpowiadających wierszom od do ; w wierszy od wiersza do,

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Badania eksperymentalne

Badania eksperymentalne Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH: WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH: Zasada podstawowa: Wykorzystujemy możliwie najmniej skomplikowaną formę wykresu, jeżeli to możliwe unikamy wykresów 3D (zaciemnianie treści), uwaga na kolory

Bardziej szczegółowo

1. Liczby naturalne, podzielność, silnie, reszty z dzielenia

1. Liczby naturalne, podzielność, silnie, reszty z dzielenia 1. Liczby naturalne, podzielność, silnie, reszty z dzielenia kwadratów i sześcianów przez małe liczby, cechy podzielności przez 2, 4, 8, 5, 25, 125, 3, 9. 26 września 2009 r. Uwaga: Przyjmujemy, że 0 nie

Bardziej szczegółowo

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki

Bardziej szczegółowo

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Co na dzisiejszym wykładzie: definicje, sposoby wyznaczania i interpretacja STATYSTYK OPISOWYCH prezentacja

Bardziej szczegółowo

CELE ANALIZY CZYNNIKOWEJ

CELE ANALIZY CZYNNIKOWEJ ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Bardziej szczegółowo

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny Zjawisko dopasowania w sytuacji komunikacyjnej Patrycja Świeczkowska Michał Woźny 0.0.0 pomiar nastroju Przeprowadzone badania miały na celu ustalenie, w jaki sposób rozmówcy dopasowują się do siebie nawzajem.

Bardziej szczegółowo

7.4 Automatyczne stawianie prognoz

7.4 Automatyczne stawianie prognoz szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38 Statystyka Wykład 8 Magdalena Alama-Bućko 23 kwietnia 2017 Magdalena Alama-Bućko Statystyka 23 kwietnia 2017 1 / 38 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego Metody Analiz Przestrzennych Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego mgr Marcin Semczuk Zakład Przedsiębiorczości i Gospodarki Przestrzennej Instytut

Bardziej szczegółowo

Podstawą w systemie dwójkowym jest liczba 2 a w systemie dziesiętnym liczba 10.

Podstawą w systemie dwójkowym jest liczba 2 a w systemie dziesiętnym liczba 10. ZAMIANA LICZB MIĘDZY SYSTEMAMI DWÓJKOWYM I DZIESIĘTNYM Aby zamienić liczbę z systemu dwójkowego (binarnego) na dziesiętny (decymalny) należy najpierw przypomnieć sobie jak są tworzone liczby w ww systemach

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Zapisz i autoryzuj płatności w folderze

Zapisz i autoryzuj płatności w folderze Krótki opis Celem tego dokumentu jest opisanie jak zapisać i zautoryzować płatności w folderach miedzy innymi: Tworzenie folderów Zapisanie jednej lub wielu płatności w pliku Sprawdzanie statusu płatności

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych PROJEKT: Analiza kluczowych parametrów turbin wiatrowych Projekt jest wykonywany z wykorzystaniem pakietu statystycznego STATISTICA. Praca odbywa się w grupach 2-3 osobowych. Aby zaliczyć projekt, należy

Bardziej szczegółowo

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6 Zawartość Wstęp... 1 Instalacja... 2 Konfiguracja... 2 Uruchomienie i praca z raportem... 6 Wstęp Rozwiązanie przygotowane z myślą o użytkownikach którzy potrzebują narzędzie do podziału, rozkładu, rozbiórki

Bardziej szczegółowo