STATYSTYKA OPISOWA 1. CZĘSTOŚCI

Podobne dokumenty
MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

W1. Wprowadzenie. Statystyka opisowa

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 5: Statystyki opisowe (część 2)

Wykład 4: Statystyki opisowe (część 1)

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Pozyskiwanie wiedzy z danych

Próba własności i parametry

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Parametry statystyczne

1 Podstawy rachunku prawdopodobieństwa

Statystyczne metody analizy danych

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Laboratorium 3 - statystyka opisowa

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Miary statystyczne w badaniach pedagogicznych

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka. Opisowa analiza zjawisk masowych

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Niestandardowa tabela częstości

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka opisowa. Robert Pietrzykowski.

Opisowa analiza struktury zjawisk statystycznych

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Ćwiczenia 1-2 Analiza rozkładu empirycznego

You created this PDF from an application that is not licensed to print to novapdf printer (

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Podstawy statystyki - ćwiczenia r.

Analiza Statystyczna

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

4.2. Statystyczne opracowanie zebranego materiału

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Badania marketingowe 2016_12. Krzysztof Cybulski Katedra Marketingu Wydział Zarządzania Uniwersytet Warszawski

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Przygotowanie danych

Podstawowe definicje statystyczne

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Statystyki opisowe i szeregi rozdzielcze

Testy nieparametryczne

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Podstawy obsługi SPSS

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Badanie zależności skala nominalna

Sposoby prezentacji problemów w statystyce

Graficzna prezentacja danych statystycznych

Jak przekształcać zmienne jakościowe?

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Wprowadzenie do zagadnień statystycznych

Statystyka matematyczna dla leśników

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Ćw. IV. Tabele przestawne

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Metody wykrywania odchyleo w danych. Metody wykrywania braków w danych. Korelacja. PED lab 4

Inteligentna analiza danych

Analiza struktury i przeciętnego poziomu cechy

Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4

IBM SPSS Custom Tables 24 IBM

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

ANALIZY WIELOZMIENNOWE

Dane i ich struktura Skale pomiarowe i ich przekształcanie. Mariusz Dacko

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

INFORMACJE O WYNIKACH EGZAMINU ZAWODOWEGO W KWALIFIKACJI M.11. EKSPLOATACJA ZŁÓŻ PODZIEMNYCH

Transkrypt:

STATYSTYKA OPISOWA 1. CZĘSTOŚCI Częstości to inaczej rozkład wartości zmiennej pokazuje nam jak układały się odpowiedzi w wybranej grupie respondentów. Ponieważ analizujemy tylko jedną zmienną, to nie wiemy nic o ewentualnych zależnościach rozkładu od innych zmiennych. Przykład: Rozkład częstości zmiennej ls12e Polski rząd powinien wydawać więcej pieniędzy na sport ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI z lewego panelu do prawego przenieść wybraną zmienną i OK. FREQUENCIES VARIABLES=ls12e /ORDER=ANALYSIS. W ten sposób otrzymamy tabelę częstości, w której kolejne wiersze ułożone są wg kodu zmiennych (wartości rosnące) jest to opcja domyślna. Ten sposób uporządkowania wartości zmiennych można w razie potrzeby (bo np. tabelka ma być czytelniejsza) zmienić za pomocą opcji CZĘSTOŚCI: FORMAT na Wartości rosnące FREQUENCIES VARIABLES=ls12e /ORDER=ANALYSIS. Wartości malejące FREQUENCIES VARIABLES=ls12e /FORMAT=DVALUE /ORDER=ANALYSIS. Liczebności rosnące FREQUENCIES VARIABLES=ls12e /FORMAT=AFREQ /ORDER=ANALYSIS. 1

Liczebności malejące FREQUENCIES VARIABLES=ls12e /FORMAT=DFREQ /ORDER=ANALYSIS. Wygenerowana przykładowa tabela wygląda tak: Najpierw podstawowe informacje o analizowanym zbiorze odpowiedzi: ile zostało uznane za ważne, a ile było określone jako braki danych Statystyki Polski rząd powinien wydawać więcej pieniędzy na sport N Ważne 1292 Braki danych 16205 Następnie sama tabela częstości Polski rząd powinien wydawać więcej pieniędzy na sport Częstość Procent Procent ważnych Procent skumulowany Zdecydowanie się zgadzam 302 1,7 23,3 23,3 Zgadzam się 451 2,6 34,9 58,2 Ani się zgadzam ani nie zgadzam 261 1,5 20,2 78,4 Ważne Nie zgadzam się 118,7 9,1 87,6 Zdecydowanie się nie zgadzam 30,2 2,3 89,9 TRUDNO POWIEDZIEĆ 131,7 10,1 100,0 Ogółem 1292 7,4 100,0 BRAK DANYCH 1,0 Braki danych ND:PYT NIE ZADANE 16204 92,6 Ogółem 16205 92,6 Ogółem 17497 100,0 WAŻNE: to, co wyżej jest tabelą surową; wklejana do docelowego tekstu raportu tabela surowa powinna być pozbawiona kolumn procent i procent skumulowany oraz wierszy brak danych, Nd:pyt nie zadane oraz dwóch ostatnich ogółem. Zostaje cała reszta (tu: zaznaczona na szaro). I tylko tę część interpretujemy, najczęściej wskazując na najmniej i najbardziej liczne kategorie odpowiedzi. Nie trzeba opisywać wszystkich odsetek tylko te, które są istotne dla naszych analiz. 2

W tym przykładzie odpowiedź trudno powiedzieć jest uwzględniona w odpowiedziach ważnych. Robi się tak wówczas, gdy z punktu widzenia naszych analiz jest to istotna informacja: ile osób nie potrafiło/nie chciało odpowiedzieć na pytanie. Może to być wskaźnik: o Brak wiedzy -> rzecz jest mało znana o Niechęci do udzielania odpowiedzi -> bo rzecz jest wstydliwa, niepoprawna politycznie, tabu etc. o Dziwnego pytania -> respondenci nie rozumieją i uciekają w trudno powiedzieć Obliczenie częstości może przydać się w jeszcze jednym wypadku gdy chcemy sprawdzić, czy dana zmienna może być zmienną niezależną i zależną. Oczywiście nie chodzi tu o jej przydatność merytoryczną, ale analityczną. Dobra analitycznie zmienna niezależna to taka, która dzieli nam badanych na kilka grup, ale w miarę równych liczebnie -> w wielu procedurach analitycznych równoliczność grup jest jednym z warunków wstępnych ich wykonania. zależna to taka, która rzeczywiście różnicuje badanych -> jeśli większość z nich wpada do jednej kategorii to nie będzie zróżnicowania opinii. Taką właśnie sytuację można zaobserwować poniżej. Zmienna re22 W jakim wyznaniu/religii resp był wychowany i jej rozkład dla roku 2010: W jakim wyznaniu/religii resp był wychowany Częstość Procent Procent ważnych Procent skumulowany W religii katolickiej 1236 97,9 98,2 98,2 Protestanckiej 2,1,1 98,4 Prawosławnej 6,5,5 98,9 Ważne Świadków Jehowy 3,2,2 99,1 W żadnym wyznaniu 10,8,8 99,9 Nie wiem 1,1,1 100,0 Ogółem 1258 99,6 100,0 Braki danych BRAK DANYCH 5,4 Ogółem 1263 100,0 Zdecydowana większość respondentów (98%) deklarowała wychowanie w religii katolickiej. Taka zmienna nie nadaje się ani na niezależną, ani na zależną. 3

2. TABELE KRZYŻOWE Tabele krzyżowe to podstawowy sposób prezentacji rozkładów zmiennych względem siebie. Krzyżować możemy dwie zmienne lub więcej jednak każda kolejna zmienna powyżej drugiej będzie wprowadzała do tabeli nową warstwę i tym samym, niestety, zamazywała rozkład odpowiedzi i utrudniała interpretację. Przykład: Tabela krzyżowa zmiennych: q41a1 Stan cywilny #2 (od 2002r.) q49a Liczba wszystkich dzieci respondenta -> rekodowanie, gdzie liczba dzieci 4 i więcej trafiła do jednego przedziału dodatkowo zastosowany został filtr i dane są tylko dla roku 2010 ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE Syntax CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT /COUNT ROUND CELL. Przy tworzeniu tabel warto trzymać się niepisanej zasady, że zmienna niezależna jest umieszczona w wierszach, a zależna w kolumnach (w syntax: niezależna BY zależna) Program tworząc tabele pomija tych respondentów, którzy przynajmniej w jednej zmiennej mają odpowiedź uznaną za brak danych. W ten sposób otrzymujemy zwykłą tabelę z rozkładem liczebności: 4

Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały Liczebność liczba dzieci - przedziały Ogółem nie ma dzieci 1 dziecko 2 dzieci 3 dzieci 4 dzieci i więcej Kawaler/panna 336 19 1 4 0 360 Konkubinat 22 14 16 3 2 57 Stan cywilny Żonaty/zamężna 63 161 255 101 36 616 #2 (od 2002r.) Rozwiedziony(a) 14 30 27 8 3 82 Separacja 1 7 5 2 1 16 Wdowiec/wdowa 12 30 47 20 11 120 Ogółem 448 261 351 138 53 1251 Taka tabela jest mało użyteczna analitycznie, bo poszczególne liczebności trudno interpretować bez kontekstu. Np. Kawalerów/panien z jednym dzieckiem jest 19, a osób z jednym potomstwem i żyjących w konkubinacie 14. Czy ta różnica jest ważna? Czy jest duża albo mała? Osób, które mają jedno dziecko i są albo po rozwodzie, albo w stanie wdowieństwa jest po tyle samo: 30. Czy ta 30-stka w obu kategoriach znaczy to samo? By uniknąć takich wątpliwości tabele krzyżowe tworzy się i interpretuje z uwzględnieniem odsetek. ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> W WIERSZU Syntax: CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT ROW /COUNT ROUND CELL. 5

Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały Stan cywilny #2 (od 2002r.) Ogółem Kawaler/panna Konkubinat Żonaty/zamężna Rozwiedziony(a) Separacja Wdowiec/wdowa liczba dzieci - przedziały Ogółem nie ma dzieci 1 dziecko 2 dzieci 3 dzieci 4 dzieci i więcej Liczebność 336 19 1 4 0 360 % z Stan cywilny #2 (od 2002r.) 93,3% 5,3% 0,3% 1,1% 0,0% 100,0% Liczebność 22 14 16 3 2 57 % z Stan cywilny #2 (od 2002r.) 38,6% 24,6% 28,1% 5,3% 3,5% 100,0% Liczebność 63 161 255 101 36 616 % z Stan cywilny #2 (od 2002r.) 10,2% 26,1% 41,4% 16,4% 5,8% 100,0% Liczebność 14 30 27 8 3 82 % z Stan cywilny #2 (od 2002r.) 17,1% 36,6% 32,9% 9,8% 3,7% 100,0% Liczebność 1 7 5 2 1 16 % z Stan cywilny #2 (od 2002r.) 6,3% 43,8% 31,3% 12,5% 6,3% 100,0% Liczebność 12 30 47 20 11 120 % z Stan cywilny #2 (od 2002r.) 10,0% 25,0% 39,2% 16,7% 9,2% 100,0% Liczebność 448 261 351 138 53 1251 % z Stan cywilny #2 (od 2002r.) 35,8% 20,9% 28,1% 11,0% 4,2% 100,0% Przy procentowaniu wierszami, 100% odnosi się do zmiennej niezależnej. Czytamy zgodnie z zasadą [wiersz] [->] [kolumna], np.: Wśród kawalerów/panien 5,3% respondentów deklarowało posiadanie jednego dziecka. Z kolei wśród osób żyjących w konkubinacie prawie 20 punktów procentowych więcej: 24,6%. Procentować można także podług zmiennej zależnej wtedy 100% znajdzie się w kolumnach. ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> W KOLUMNIE 6

Syntax: CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT COLUMN /COUNT ROUND CELL. Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały Stan cywilny #2 (od 2002r.) Ogółem Kawaler/panna Konkubinat Żonaty/zamężna Rozwiedziony(a) Separacja Wdowiec/wdowa liczba dzieci - przedziały Ogółem nie ma dzieci 1 dziecko 2 dzieci 3 dzieci 4 dzieci i więcej Liczebność 336 19 1 4 0 360 % z liczba dzieci - przedziały 75,0% 7,3% 0,3% 2,9% 0,0% 28,8% Liczebność 22 14 16 3 2 57 % z liczba dzieci - przedziały 4,9% 5,4% 4,6% 2,2% 3,8% 4,6% Liczebność 63 161 255 101 36 616 % z liczba dzieci - przedziały 14,1% 61,7% 72,6% 73,2% 67,9% 49,2% Liczebność 14 30 27 8 3 82 % z liczba dzieci - przedziały 3,1% 11,5% 7,7% 5,8% 5,7% 6,6% Liczebność 1 7 5 2 1 16 % z liczba dzieci - przedziały 0,2% 2,7% 1,4% 1,4% 1,9% 1,3% Liczebność 12 30 47 20 11 120 % z liczba dzieci - przedziały 2,7% 11,5% 13,4% 14,5% 20,8% 9,6% Liczebność 448 261 351 138 53 1251 % z liczba dzieci - przedziały 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% Czytamy zgodnie z zasadą [kolumna] [->] [wiersz], np.: Wśród osób posiadających jedno dziecko 7,3% stanowili kawalerowie/panny, a 5,4% - osoby żyjące w konkubinacie. 7

Ostatnia możliwość to procentowanie dla całości analizowanych danych ANALIZA -> OPIS STATYSTYCZNY -> TABELE KRZYŻOWE -> KOMÓRKI -> PROCENTY -> PROCENT CAŁOŚCI Syntax: CROSSTABS /TABLES=q41a1 BY q49a_rek /FORMAT=AVALUE TABLES /CELLS=COUNT TOTAL /COUNT ROUND CELL. Tabela krzyżowa Stan cywilny #2 (od 2002r.) * liczba dzieci - przedziały Stan cywilny #2 (od 2002r.) Ogółem Kawaler/panna Konkubinat Żonaty/zamężna Rozwiedziony(a) Separacja Wdowiec/wdowa liczba dzieci - przedziały Ogółem nie ma dzieci 1 dziecko 2 dzieci 3 dzieci 4 dzieci i więcej Liczebność 336 19 1 4 0 360 % z Ogółem 26,9% 1,5% 0,1% 0,3% 0,0% 28,8% Liczebność 22 14 16 3 2 57 % z Ogółem 1,8% 1,1% 1,3% 0,2% 0,2% 4,6% Liczebność 63 161 255 101 36 616 % z Ogółem 5,0% 12,9% 20,4% 8,1% 2,9% 49,2% Liczebność 14 30 27 8 3 82 % z Ogółem 1,1% 2,4% 2,2% 0,6% 0,2% 6,6% Liczebność 1 7 5 2 1 16 % z Ogółem 0,1% 0,6% 0,4% 0,2% 0,1% 1,3% Liczebność 12 30 47 20 11 120 % z Ogółem 1,0% 2,4% 3,8% 1,6% 0,9% 9,6% Liczebność 448 261 351 138 53 1251 % z Ogółem 35,8% 20,9% 28,1% 11,0% 4,2% 100,0% 8

W tym momencie 100% odnosi się do wszystkich branych pod uwagę respondentów. Czytamy zgodnie z zasadą [wiersz] [i] [kolumna], np.: Osoby, które deklarowały bycie kawalerem/panną oraz posiadanie jednego dziecka wśród wszystkich respondentów stanowią 1,5%. Z kolei osoby żyjące w konkubinacie i także posiadające jedno dziecko to 1,1%. 3. WYKRESY SPSS ma dość rozbudowany edytor wykresów i nie chcę omawiać go w całości kto ciekawy, może pobawić się sam. W tym miejscu chciałabym wskazać tylko na jedno ciekawe zastosowanie wykresu: wizualną ocenę dopasowania rozkładu zmiennej do rozkładu normalnego. Na przykładzie zmiennej q9age Wiek ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> WYKRESY -> TYP WYKRESÓW -> HISTOGRAMY -> POKAŻ KRZYWĄ NORMALNĄ NA HISTOGRAMIE Syntax: FREQUENCIES VARIABLES=q9age /HISTOGRAM NORMAL /ORDER=ANALYSIS. Otrzymujemy wykres, który pokazuje jak bardzo rozkład analizowanej zmiennej przypomina rozkład normalny lub od niego odstaje: 9

4. STATYSTYKI OPISOWE Parametry opisowe zbiorowości statystycznej: 1. Miary tendencji centralnej służą do określania tej wartości zmiennej opisanej przez rozkład, wokół której skupiają się wszystkie pozostałe wartości zmiennej; a) średnie klasyczne średnia arytmetyczna średnia geometryczna średnia harmoniczna b) średnie pozycyjne mediana dominanta (modalna) kwantyle (kwartyle, decyle, percentyle) 2. Miary dyspersji służą do badania stopnia zróżnicowania wartości zmiennej; a) rozstęp b) odchylenie międzykwartylowe (odchylenie ćwiartkowe) c) odchylenie standardowe d) wariancje e) odchylenie przeciętne f) współczynniki zmienności 3. Miary asymetrii służą do badania kierunku zróżnicowania wartości zmiennej; a) kurtoza b) skośność (współczynnik asymetrii) 4. Miary koncentracji służą do badania stopnia nierównomierności rozkładu ogólnej sumy wartości zmiennej pomiędzy poszczególne jednostki zbiorowości lub analizy stopnia skupienia poszczególnych jednostek wokół średniej; a) współczynniki koncentracji SPSS pozwala nam na wykonanie statystyk opisowych w różnych miejscach, a dwa podstawowe to: a) ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> STATYSTYKI Dostępne są: Średnia, mediana, dominanta, suma Odchylenie standardowe, wariancja, rozstęp, minimum, maksimum, błąd standardowy średniej Kwartyle, percentyle Kurtoza, skośność 10

b) ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE Dostępne są: Średnia, suma Odchylenie standardowe, wariancja, rozstęp, minimum, maksimum, błąd standardowy średniej Kurtoza, skośność WAŻNE: to od analityka zależy poprawność obliczeń! SPSS nie zaprotestuje, jeśli dla zmiennej np. nominalnej zapragniemy wyliczyć średnią. Miary opisu statystycznego a poszczególne skale pomiarowe: Nominalna Porządkowa Interwałowa Ilorazowa Procenty / odsetki / stosunki TAK TAK TAK TAK Średnia arytmetyczna TAK TAK Dominanta TAK TAK TAK TAK Mediana TAK TAK TAK Kwartyle TAK TAK TAK Rozstęp TAK TAK Odchylenie przeciętne TAK TAK Wariancja TAK TAK Odchylenie standardowe TAK TAK Odchylenie kwartylowe (TAK) * TAK TAK Współczynnik zmienności TAK TAK Kurtoza TAK TAK Skośność TAK TAK * przy założeniu pewnej interwałowości, np. skala ocen: 5,0 ; 4,0 ; 3,0 itd. 11

Przykład: Statystyki opisowe dla zmiennej q9age Wiek. Przed analizą należy łączyć filtr: dane tylko z 2010 roku. Wersja nr 1. ANALIZA -> OPIS STATYSTYCZNY -> CZĘSTOŚCI -> STATYSTYKI i wszystkie dostępne statystyki Syntax: FREQUENCIES VARIABLES=q9age /NTILES=4 /NTILES=3 /PERCENTILES=20 40 60 80 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT /ORDER=ANALYSIS. Dla wyjaśnienia co jest co w syntax: /NTILES=4 -> kwartyle /NTILES=3 -> punkty podziału na 3 równe grupy /PERCENTILES=20 40 60 80 -> percentyle 20-ty, 40-ty, 60-ty i 80-ty STDDEV -> odchylenie standardowe VARIANCE -> wariancja RANGE -> rozstęp MINIMUM -> minimum MAXIMUM -> maksimum SEMEAN -> błąd standardowy średniej MEAN -> średnia MEDIAN -> mediana MODE -> dominanta SUM -> suma SKEWNESS -> skośność SESKEW -> błąd standardowy skośności KURTOSIS -> kurtoza SEKURT -> błąd standardowy kurtozy 12

Otrzymujemy tabelkę z danymi: Statystyki Wiek respondenta Ważne 1263 N Braki danych 0 Średnia 44,78 Błąd standardowy średniej,478 Mediana 44,00 Dominanta 26 Odchylenie standardowe 16,996 Wariancja 288,876 Skośność,207 Błąd standardowy skośności,069 Kurtoza -1,040 Błąd standardowy kurtozy,138 Rozstęp 62 Minimum 18 Maksimum 80 Suma 56558 20 27,00 25 30,00 33,33333333 34,00 40 37,00 Percentyle 50 44,00 60 50,00 66,66666667 54,00 75 58,00 80 61,00 Dane z tabeli interpretujemy następująco: Statystyki opisowe zostały policzone dla całego zbioru danych: 1263 respondentów. Najmłodszy respondent miał 18 lat, a najstarszy 80. Rozstęp wyniósł więc 62 lata. Najwięcej osób miało 26 lat Średnia wieku wyniosła blisko 45 lat (z odchyleniem standardowym 16,996 i wariancją równą 288,876). Połowa osób miała przynajmniej 44 lata. ¼ osób miała maksymalnie 30 lat, a ¾ osób maksymalnie 58 lat. Przy podziale zbiorowości na trzy równe części, to 1/3 osób miała maksymalnie 34 lata, a 2/3 osób maksymalnie 54 lata. 13

Przy podziale zbiorowości na pięć równych części, to 1/5 osób miała maksymalnie 27 lat; 2/5 osób maksymalnie 37 lat; 3/5 osób maksymalnie 50 lat, a 4/5 osób maksymalnie 61 lat. Współczynnik kurtozy jest ujemny (-1,040), skąd można wnioskować, że rozkład zmiennej jest bardziej spłaszczony niż krzywa rozkładu normalnego i wartości zmiennej nie grupują się wokół średniej (jest więcej wartości skrajnych). Współczynnik skośności jest dodatni (0,207), skąd można wnioskować, że rozkład zmiennej jest prawostronnie asymetryczny: jest więcej niższych niż wyższych wartości zmiennej czyli wśród badanych jest więcej osób młodszych niż starszych. WAŻNE: do końcowego raportu tabeli z obliczonymi statystykami opisowymi nie wklejamy wystarczy tylko ich opis i interpretacja. Wersja nr 2 ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE i wszystkie dostępne statystyki. Syntax: DESCRIPTIVES VARIABLES=q9age /STATISTICS=MEAN SUM STDDEV VARIANCE RANGE MIN MAX SEMEAN KURTOSIS SKEWNESS. Uzyskana tabela: Statystyki opisowe Wiek respondenta N Ważnych (wyłączanie obserwacjami) N Statystyka 1263 1263 Rozstęp Statystyka 62 Minimum Statystyka 18 Maksimum Statystyka 80 Suma Statystyka 56558 Średnia Statystyka 44,78 Błąd standardowy,478 Odchylenie standardowe Statystyka 16,996 Wariancja Statystyka 288,876 Skośność Statystyka,207 Błąd standardowy,069 Statystyka -1,040 Kurtoza Błąd standardowy,138 Nie będę już interpretowała danych z tabeli jest to samo co wyżej. 14

I jedno wyjaśnienie: tabela generowana przez SPSS wygląda inaczej niż ta wyżej jest trójwierszowa i bardzo długa. Jej obecny wygląd uzyskałam poprzez panel przestawiania. W oknie raportu należy kliknąć na tabeli prawym przyciskiem myszy, a potem wybrać edytuj zawartość : Jeśli w nowym oknie: pojawi się nowe okno, a na pasku poleceń polecenie przestaw. Najprościej wówczas kliknąć transponuj wiersze i kolumny i obie rzeczy zamienią się miejscami. Lub można uruchomić panel przestawiania, o którym niżej. Jeśli w oknie raportu: na aktywowanej tabeli znów należy kliknąć prawym myszy i wybrać panel przestawiania. Pojawi się nowe okno ze schematem naszej tabeli teraz dowolnie przeciągając albo kasując jej elementy możemy wpływać na kształt tabeli. 5. PROSTE PORÓWNANIE ŚREDNICH Gdy analizujemy kilka zmiennych ilościowych (albo takich, które można uznać za ilościowe, czyli te z kafeterią likertowską), to najbardziej użytecznymi miarami opisu są średnia i odchylenie standardowe. Można porównywać średnie obliczone przy pomocy poleceń zaprezentowanych wyżej. Prościej jest jednak skorzystać z dedykowanego temu polecenia. Przykład: filtr: tylko dane dla 2010 Zmienne: re8a Zauf do sejmu re8b Zauf do org przemysł i handlowych re8c Zauf do kościołów i org wyznaniowych re8d Zauf do sądów i systemu prawnego re8e Zauf do szkolnictwa i syst kształcenia Przed dokonaniem obliczeń należy odpowiedź trudno powiedzieć zdefiniować jako brak danych baza -> zakładka zmienne -> kolumna braki -> wartość dyskretna: 8 w syntax można to zrobić za pomocą polecenia: MISSING VALUES re8a (LO THRU -1, 8) Gdzie re8a to nazwa zmiennej LO THRU -1 oznacza, że do tej pory braki to było wartości od najniższej do -1 (można to odczytać z arkusza zmienne_baza w przygotowanym przeze mnie pliku Excel; ważne jest, by dopisać tu już istniejące braki, bo inaczej zostaną usunięte 8 to nowo dodany brak danych Powtórzyć dla każdej zmiennej. 15

Gdy spojrzymy na kafeterię tych pytań, to widać, że kolejność jest nieintuicyjna: 1 - Całkowite zaufanie 2 - Duże zaufanie 3 - Umiarkowane zaufanie 4 - Bardzo małe zaufanie 5 - W ogóle nie ma zaufania Im mniejszy kod, tym większe zaufanie. Możemy to albo odwrócić rekodując zmienną, albo po prostu o tym pamiętać analizując dane. ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKI OPISOWE Wybrać zmienne re8a-re8e W opcjach zostawić domyślnie wybrane: średnia, odchylenie standardowe, minimum, maksimum Syntax: DESCRIPTIVES VARIABLES=re8a re8b re8c re8d re8e /STATISTICS=MEAN STDDEV MIN MAX Porządek wyświetlania: o Lista zmiennych (domyślnie, nic nie trzeba dopisywać w poleceniu syntax) o Alfabetycznie Syntax - do głównej linii kodu podanej powyżej należy dopisać: /SORT=NAME (A). o Średnie rosnące Syntax - do głównej linii kodu podanej powyżej należy dopisać: /SORT=MEAN (A). o Średnie malejące Syntax - do głównej linii kodu podanej powyżej należy dopisać: /SORT=MEAN (D). Z racji tego, że u nas im niższa średnia tym wyższe zaufanie, wybieramy porządek średnie rosnące Otrzymujemy poniższą tabelę: 16

Statystyki opisowe N Minimum Maksimum Średnia Odchylenie standardowe Zauf do szkolnictwa i syst 1195 1 5 2,53,736 kształcenia Zauf do kościołów i org 1225 1 5 2,86,983 wyznaniowych Zauf do sądów i systemu 1195 1 5 2,97,941 prawnego Zauf do org przemysł i 1151 1 5 3,23,716 handlowych Zauf do sejmu 1197 1 5 3,60,840 N Ważnych (wyłączanie obserwacjami) 1071 Do raportu wklejamy całą tabelę (wcześniej poprawiając nazwy zmiennych by nie było w nich skrótów), a pod spodem dajemy jej opis i interpretację. Na co można zwrócić uwagę: Kolejność zmiennych wg średnich: zaufanie do szkolnictwa jest największe, zaufanie do sejmu najmniejsze; Interpretacja średnich: możemy posłużyć się kafeterią z analizowanych pytań wówczas średnia ok. 2,5 będzie oznaczała opinię pomiędzy duże zaufanie a umiarkowane zaufanie Odchylenia standardowe: możemy porównać odchylenia między sobą im większe, tym większe rozbieżności w opiniach respondentów (tu największe w przypadku kościoła), im mniejsze tym bardziej respondenci byli jednomyślni (tu w przypadku organizacji przemysłowych i handlowych) Wartości minimum i maksimum: w przypadku wszystkich analizowanych instytucji pojawiały się zarówno odpowiedzi wskazujące na całkowite zaufanie (wartość: 1), jak na brak zaufania w ogóle (wartość: 5) Liczbę osób, których odpowiedzi zostały uwzględnione: im więcej osób, tym albo było łatwiej oceniać (bo np. respondenci wiedzą, co oceniają), albo było mniejsze ryzyko ukrywania swoich poglądów (nie blokowała badanych poprawność polityczna lub wstyd) 17