OPRACOWANIE DANYCH W PSPP



Podobne dokumenty
Przygotowanie danych

OPRACOWANIE DANYCH W PSPP

Porównywanie populacji

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

A N K I E T A. Zalety i wady ankiety. wielka możliwość nieszczerych odpowiedzi przy posyłaniu ankiet pocztą wiele z nich nie wraca

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Sposoby prezentacji problemów w statystyce

Niestandardowa tabela częstości

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

Dokumentacja programu. Zoz. Uzupełnianie kodów terytorialnych w danych osobowych związanych z deklaracjami POZ. Wersja

Formularz pierwszej oceny w służbie cywilnej

EXCEL TABELE PRZESTAWNE

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

Szybka instrukcja tworzenia testów dla E-SPRAWDZIAN-2 programem e_kreator_2

Wykład 3: Prezentacja danych statystycznych

Narzędzie informatyczne wspomagające dokonywanie ocen pracowniczych w służbie cywilnej

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Edytor tekstu OpenOffice Writer Podstawy

Zastanawiałeś się może, dlaczego Twój współpracownik,

SYSTEMY OPERACYJNE I SIECI KOMPUTEROWE

Bazy danych raporty. 1. Przekopiuj na dysk F:\ bazę M5BIB.mdb z dysku wskazanego przez prowadzącego.

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

najlepszych trików Excelu

STATYSTYKA DLA PEDAGOGÓW

Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

5.3. Tabele. Tworzenie tabeli. Tworzenie tabeli z widoku projektu. Rozdział III Tworzenie i modyfikacja tabel

MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Edytor materiału nauczania

ACCESS ćwiczenia (zestaw 1)

CZĘŚĆ A PIERWSZE KROKI Z KOMPUTEREM

Stosowanie, tworzenie i modyfikowanie stylów.

Zasady wypełniania formularza sprawozdań za 2014 w Excelu

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Aby przejść do edycji w tym module należy wybrać zakładkę "Dla Pracowników" -> "Sprawdziany".

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka

W każdej sali najważniejszym narzędziem są prawdopodobnie Zasoby. Przyjrzyjmy się teraz temu narzędziu, któremu zmieniono poniżej nazwę na Wspólne

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Przenoszenie, kopiowanie formuł

Rozpoczynamy import Kreator uruchamiamy przyciskiem Z tekstu, znajdującym się na karcie Dane, w grupie Dane zewnętrzne.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Instrukcja redaktora strony

Oficyna Wydawnicza UNIMEX ebook z zabezpieczeniami DRM

UONET+ - moduł Sekretariat. Jak wykorzystać wydruki list w formacie XLS do analizy danych uczniów?

Zasady wypełniania formularza sprawozdań za 2016 rok w Excelu. 6 komórek zawiera formuły. Są one oznaczone: lub wyświetla się w nich 0.

Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt

Jak utworzyć plik SIO dla aktualnego spisu?

Obliczanie wartości średniej i odchylenia standardowego średniej w programie Origin

Jak przygotować pokaz album w Logomocji

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych.

Damian Daszkiewicz Tworzenie strony-wizytówki dla firmy XYZ

Arkusz kalkulacyjny MS Excel 2010 PL.

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Struktura dokumentu w arkuszu kalkulacyjnym MS EXCEL

Projekt ZSWS. Instrukcja uŝytkowania narzędzia SAP Business Explorer Analyzer. 1 Uruchamianie programu i raportu. Tytuł: Strona: 1 z 31

1. Opis okna podstawowego programu TPrezenter.

TABULATORY - DOKUMENTY BIUROWE

Przypomnienie: Ćwiczenie 1.

e-podręcznik dla seniora... i nie tylko.

ZAJĘCIA KOMPUTEROWE KLASA IV. Opis wymagań, które uczeń powinien spełnić, aby uzyskać ocenę:

TABELE I WYKRESY W EXCELU I ACCESSIE

Instrukcja obsługi programu SWWS autorstwa Michała Krzemińskiego

Tabela 1. Rozproszenie wartości zmiennych. Zmienna Populacja Wartości dyrektorzy szkół gimnazjalnych

Jak korzystać z przeglądarki danych ESS SoftReport

Arkusz kalkulacyjny EXCEL

5.2. Pierwsze kroki z bazami danych

1. Objaśnienia do sprawozdania.

5.4. Tworzymy formularze

Kopiowanie, przenoszenie plików i folderów

Skrócona instrukcja korzystania z Platformy Zdalnej Edukacji w Gliwickiej Wyższej Szkole Przedsiębiorczości

I Tworzenie prezentacji za pomocą szablonu w programie Power-Point. 1. Wybieramy z górnego menu polecenie Nowy a następnie Utwórz z szablonu

ZINTEGROWANY SYSTEM ZARZĄDZANIA TREŚCIĄ

Formularz oceny okresowej arkusz B w służbie cywilnej Instrukcja użytkownika

Wykład III. dr Artur Bartoszewski Wydział Nauczycielski, Kierunek Pedagogika Wprowadzenie do baz danych

Sposób tworzenia tabeli przestawnej pokażę na przykładzie listy krajów z podstawowymi informacjami o nich.

Organizacja edytora danych

Edytor tekstu OpenOffice Writer Podstawy

Instrukcja korzystania z portalu Diagnoza Nowej Ery

Badanie zależności skala nominalna

Tworzenie tabeli przestawnej krok po kroku

Podstawy pracy z edytorem tekstu. na przykładzie Open Office

Temat: Organizacja skoroszytów i arkuszy

Analiza Statystyczna

Testy nieparametryczne

Główne elementy zestawu komputerowego

DOKUMENTY I GRAFIKI. Zarządzanie zawartością Tworzenie folderu Dodawanie dokumentu / grafiki Wersje plików... 7

Scenariusz zajęć z matematyki dla klasy I gimnazjum z wykorzystaniem programu edurom Matematyka G1

Instrukcja obsługi. Generatora CSV

Ekran tytułowy (menu główne)

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1

1. Przekopiuj na dysk F bazę M5BIB.mdb z dysku wskazanego przez prowadzącego 2. Otwórz bazę (F:\M5BIB.mdb)

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

Tworzenie raportów. Ćwiczenie 1. Utwórz Autoraport przedstawiający tabelę Studenci

Arkusz kalkulacyjny Excel

System Obsługi Zleceń

Temat 1. Więcej o opracowywaniu tekstu

Co to jest arkusz kalkulacyjny?

Transkrypt:

Zpracování dat v PSPP pro společenské vědy 3 KRAKOWSKA AKADEMIA A. F. MODRZEWSKIEGO BORIS KOŽUH OPRACOWANIE DANYCH W PSPP KRAKÓW 2013

4 Boris Kožuh, Jaroslav Myslivec

Opracowanie danych w PSPP 9 1 Program PSPP ROZDZIAŁ PIERWSZY Opis programu PSPP Program PSPP jest darmowym programem (shareware) do statystycznych opracowań danych w badaniach. Jest bardzo podobny do programu SPSS, umożliwia jedynie nieco mniej statystycznych metod. Dla studentów jest jednak bardzo korzystny, ponieważ pozwala na łatwe i proste korzystanie z obydwu programu. Darmowy program PSPP możemy mieć na swoim domowym komputerze, a dodatkowe opracowania w SPSS wykonywać na uczelni. W domu można wprowadzić dane i wykonać wszystkie podstawowe opracowania, a na uczelni dodatkowo wykonać w SPSS te opracowania, których PSPP nie umożliwia. Dla zdecydowanej większości studentów (kierunków humanistycznych) możliwości programu PSPP będą w całości wystarczające do pracy dyplomowej, a często nawet i do pracy doktorskiej. Jeżeli jednak będą potrzebne bardziej skomplikowane opracowania, dane wprowadzone w PSPP i zachowane na pamięci pendrive możno opracować na uczelni w SPSS. Przynajmniej w tym zakresie oba programy są kompatybilne.

10 Boris Kožuh Pobieranie programu Program SPSS, z którego korzystają zarówno profesorowie, jak i studenci niemal na wszystkich uniwersytetach świata, jest programem profesjonalnym. Jest on jednak bardzo drogi, dlatego nie kupują go ani profesorowie, ani studenci. Kupują go tylko firmy i uniwersytety. Pierwsza wersja programu pojawiła się na rynku 1968 roku, a ostatnia wersja to 21 z roku 2012. Wraz z pojawieniem sie systemu Windows, dostosowano też program SPSS do tego systemu. Autor niniejszej książki w roku 1973 opracował dane do swojej pracy dyplomowej za pomocą jednej z pierwszych wersji (wówczas jeszcze nie było systemu Windows ani komputerów domowych PC). Podręcznik do korzystania programu zawierał wtedy ponad 2000 stron. Program PSPP jest natomiast darmowym programem, który może legalnie posiadać każdy. Program pobiera się z witryny internetowej organizacji GNU. Do wyszukiwarki należy wprowadzić adres: www.gnu.org. Otwiera się wtedy strona organizacji GNU: Rysunek 1. Strona internetowa organizacji GNU Należy kliknąć na Downloads. Otwiera się niemal taka sama strona jak poprzednia.

Opracowanie danych w PSPP 11 Rysunek 2. Strona internetowa organizacji GNU z listą programów Na tej stronie należy poszukać listy wszystkich dostępnych programów. Znajduje się ona w dolnej części strony pod tytułem All Gnu Packages. Lista zawiera dużo dobrych i użytecznych programów. Wśród tych programów jest też PSPP (rysunek nr 3). Rysunek 3. Lista programów

12 Boris Kožuh Należy kliknąć na nazwę pspp. Otwiera się następująca strona: Rysunek 4. Strona programu PSPP Należy kliknąć na Get PSPP. Otwiera się kolejna strona tego programu: Rysunek 5. Wybór wersji programu PSPP Górna część tej strony jest taka sama jak poprzednia, a niżej znajduje się lista dostępnych wersji programu PSPP. Aby pobrać

Opracowanie danych w PSPP 13 wersję do Windows należy kliknąć na link: Mingw-based version (rysunek nr 5). Otwiera się wówczas następne okno: Rysunek 6. Wybór wersji programu PSPP Najlepiej oczywiście wybrać i kliknąć na najnowszą wersję. Program zostanie pobrany do naszego komputera. Rysunek nr 7 pokazuje ostatni etap całej procedury. Należy kliknąć na zapisz. Po zapisaniu programu należy odszukać program w komputerze, kliknąć na niego i już można korzystać z programu. Rysunek 7. Pobieranie pliku zawierającego program PSPP

14 Boris Kožuh Istnieje oczywiście krótsza procedura. Jeżeli czytelnika nie interesują informacje o organizacji GNU, która proponuje darmowe programy, można otrzymać program PSPP bezpośrednio z adresu: http://pspp.michelboaventura.com/en/downloads-2/?lang=en Praca w programie PSPP Opracowanie danych za pomocą programu PSPP przebiega w następujących fazach: Krok pierwszy Krok drugi Krok trzeci Krok czwarty Przygotowanie listy zmiennych Z kwestionariusza, arkuszu obserwacji, protokołu wywiadu lub z innych narzędzi należy zrobi pełną listę zmiennych, które będą opracowywane za pomocą komputera. Wprowadzanie danych do komputera Przygotowane dane należy wprowadzić do komputera. Program PSPP ma swój podprogram do wprowadzania danych. Dane wprowadzone za pomocą programu PSPP możn bez przygotowania opracowywać takż w programie SPSS. Opis zmiennych Po wprowadzeniu danych do komputera należy opisa zmienne: wpisa ich pełne imiona, wpisa imiona kategorii, itd. Opracowanie danych Wybierając różne polecenia w PSPP uruchamia się wybrane opracowania statystyczne. Po uruchomieniu poleceń otwiera się okno dialogowe. W tym oknie ustawia się różne opcje opracowania.

Opracowanie danych w PSPP 15 Krok piąty Krok szósty Krok siódmy Przegląd wyników Kilka sekund po uruchomieniu końcowego polecenia otwiera się okno Data Editor, w którym można zobaczyć wszystkie wyniki. Okno to umożliwia przegląd wyników i eksport, a następnie zachowanie wyników na dysku. Dodatkowe porządkowanie danych Prawie zawsze po przeglądzie pierwszych wyników powstaje potrzeba powrotu do danych wyjściowych po to, aby je dodatkowo uporządkować (pogrupować, selekcjonować itd. Wykorzystanie wyników Po opracowaniu wyników i ich przeglądzie, plik z wynikami należy zapisa na dysk. Zapis ten przebiega poprzez eksport pliku. Zapisane wyniki będzie trzeba przenieść do tekstu, w którym następnie będą analizowane, prezentowane oraz interpretowane (do pracy magisterskiej, dyplomowej, do raportu badań, artykułu itd.).

16 Boris Kožuh

Opracowanie danych w PSPP 17 2 Przygotowanie danych ROZDZIAŁ DRUGI Przed opracowaniem statystycznym należy uporządkować dane. Ułatwia ono późniejsze opracowywanie danych. Od czasu, kiedy pojawiły się komputery, procedury porządkowania danych zmieniły się w sposób zasadniczy. Przed ręcznym opracowaniem danych należy je uporządkować, natomiast do opracowania za pomocą komputera, wystarczy je jedynie przygotować. Przygotowanie danych do opracowania komputerowego W empirycznych badaniach edukacji badacz dysponuje zwykle stosunkowo prostymi danymi. Najczęściej występujące zmienne to zmienne nominalne i porządkowe. Należą do nich m. in.: wykształcenie, płeć, narodowość, zadowolenie, powodzenie, różne zdolności, życzenia, zainteresowania itd. Rzadziej spotyka się zmienne przedziałowe lub ilorazowe. Zmienne przedziałowe lub ilorazowe w tym podrozdziale (w celu łatwiejszego zrozumienia) zostaną omówione wspólnie: liczba uczniów w klasie, wiek,

18 Boris Kožuh wzrost, staż pracy, czas uczenia się, liczba przeczytanych książek, itd. Niektóre zmienne, które należą do porządkowych, często opracowuje się tak, jak zmienne przedziałowe (np. wyniki uczniów w teście). Dla wszystkich jednostek dane zbiera się najczęściej za pomocą jednego narzędzia. Do najczęściej używanych narzędzi w badaniach pedagogicznych należą kwestionariusze ankiety, kwestionariusze wywiadu, skale postaw, skale szacowania, testy socjometryczne, testy wiadomości i protokoły obserwacji. W niniejszym opracowaniu osoby badane różnymi narzędziami określa się pojęciem respondent. Na końcu badania dla wszystkich respondentów istnieje taka sama ilość zmiennych, ponieważ dane dla wszystkich respondentów zbiera się prawie zawsze tymi samymi narzędziami. To ułatwia wprowadzanie danych do komputera, ich opracowywanie i prezentowanie wyników. Jeżeli zastosowano dwa kwestionariusze dla dwóch różnych grup respondentów (np. dla nauczycieli i dla rodziców), to w takich przypadkach dane wprowadza się odrębnie: do jednego pliku odpowiedzi nauczycieli, a do drugiego pliku odpowiedzi rodziców. W przypadku prostych kwestionariuszy dane wprowadzane są bezpośrednio z kwestionariuszy do komputera. W przypadku skomplikowanych kwestionariuszy lepiej wprowadzać dane najpierw z kwestionariusza na przygotowane kartki (szablony). Każdy respondent posiada wówczas swoją kartkę lub przynajmniej swój wiersz na kartce. Z wypełnionych kartek dane wprowadza się do komputera. O tym, czy dane wprowadza się bezpośrednio czy pośrednio, decyduje doświadczenie i praktyka w posługiwaniu się komputerem. Przy bezpośrednim wprowadzaniu jest mniej pracy, ale jednocześnie pojawia się więcej błędów. Dane najlepiej wprowadzać z kimś: jedna osoba czyta dane, a druga je zapisuje w komputerze. Pozornie wydaje się, że dwie osoby potrzebują dwa razy mniej czasu na wprowadzanie danych. Prawda jest jednak zaskakująca: czas wprowadzania skraca się nawet o dziesięć razy.

Opracowanie danych w PSPP 19 Najlepiej wprowadzać dane za pomocą programu PSPP. Dane wprowadzone za pomocą programu PSPP można bez przygotowania opracowywać także w programie SPSS. Z danymi wprowadzonymi za pomocą programu Excel jest nieznacznie więcej pracy, ale tylko przy opracowywaniu w SPSS. Natomiast dane wprowadzone w programie Word wymagają dość skomplikowanego przenoszenia (importu) do programów SPSS i PSPP. Z tego powodu odradza się wprowadzanie danych za pomocą programu Word pomimo, że samo wprowadzanie wymaga mniej czasu niż w pozostałych wymienionych programach. Dane dla każdego respondenta zapisuje się w nowym wierszu. W ten sposób powstaje baza danych. W wierszach bazy umieszcza się respondentów, natomiast w kolumnach zmienne. Oto widok na bazę danych w programie PSPP. Rysunek 8. Baza danych w programie PSPP Baza danych w programie SPSS jest niemal identyczna:

20 Boris Kožuh Rysunek 9. Baza danych w programie SPSS Bardzo podobnie wygląda też baza danych wprowadzonych za pomocą programu Excel. Oto ona: Rysunek 10. Baza danych w programie Excel

Opracowanie danych w PSPP 21 Jeżeli dane zostały wprowadzone za pomocą programu Word (do pojawienia się programu PSPP było tak w większości przypadków), baza danych wygląda zupełnie inaczej: Rysunek 11. Baza danych w programie Word Do opracowania takich danych używa się programów statystycznych, takich jak np. PSPP, SPSS, Excel, Statistica, itp. Spis zmiennych Ważnym etapem przygotowania danych do wprowadzania do komputera jest przygotowanie listy zmiennych. Lista zmiennych powstaje na początku układania narzędzia jest to pierwszy etap układania. Niektóre zmienne mają proste i naturalne imiona, takie jak: wiek, płeć, czas uczenia się, ilość błędów w dyktandzie, itd. Innym trudno nadać proste imiona i (przynajmniej na początku) nadaje się im imiona techniczne jak np. odpowiedź na czwarte pytanie w ankiecie, pierwsza ocena, druga ocena, pogląd pierwszy,

22 Boris Kožuh itp. Do wprowadzania imion w programie PSPP należy skrócić imię każdej zmiennej do jednego słowa. Zapisy wartości Wartości większej części zmiennych z ankiet, skal szacowania, protokołów obserwacji, itd. zostają zapisane w postaci liczb jednocyfrowych. Zilustruje to przykład pytania ankietowego zamkniętego z sześcioma proponowanymi odpowiedziami: A, B, C, D, E i F. Do komputera nie wprowadza się liter zawsze tylko liczby. Odpowiedź A zapisana zostanie jako liczba 1. Dla respondentów, którzy zakreślili odpowiedź B - zapisana zostanie liczba 2, dla wszystkich, którzy zakreślili odpowiedź C, zostanie zapisana liczba 3 i tak dalej do odpowiedzi F. Taka zmienna będzie miała jednocyfrowy zapis i będzie zajmowała w szeregu danych tylko jedno miejsce. Oto przykład, w którym respondenci odpowiadali na pięć takich pytań. Pierwszy respondent zakreślił przy pytaniu pierwszym odpowiedź C, przy drugim A, przy trzecim A, przy czwartym D i przy piątym C. Odpowiedzi drugiego respondenta to kolejno: B, C, A, F, B; trzeciego: B, B, B, A, D i czwartego: C, C, E, A, F. Należy to zapisać w następujący sposób: pierwszy respondent 31143 drugi respondent 23162 trzeci respondent 22214 czwarty respondent 33516 itd. Dla pięciu zmiennych istnieje pięć kolumn, ponieważ wszystkie zapisy są jednocyfrowe. Nie ma znaczenia, że wszystkie pytania w ankiecie nie są ilościowe (numerycznie). W ten sposób zapisuje się dane także dla wyłącznie jakościowych zmiennych. W przypadku płci należy np. dla

Opracowanie danych w PSPP 23 kobiet zapisać liczbę 1, dla mężczyzn liczbę 2. Takie postępowanie nie zmienia natury zmiennych. Nie oznacza to, że nie uwzględnia się właściwości zmiennych. Łatwiejsze jest jedynie wprowadzanie danych do komputera, a także ich późniejsze opracowanie. Proste rozwiązania są najlepsze i przynoszą najmniej błędów. Dlatego też poszczególnym odpowiedziom na pytania w ankiecie (kategoriom zmiennej) przyporządkowuje się liczby w tej samej kolejności, według której były podane w ankiecie (pierwszej odpowiedzi zawsze 1, drugiej 2, trzeciej 3, itd.). Przy takim postępowaniu możliwość wystąpienia błędów jest najmniejsza. Nawet w przypadku, jeżeli w pytaniu ankietowym nr 8 odpowiedzi zostały umieszczone w następujący sposób: A. zawsze B. czasami C. nigdy a w pytaniu nr 13: A. nigdy B. czasami C. zawsze w obydwu sytuacjach odpowiedź A należy zapisać jako 1 (bez względu na to, że to dwie zupełnie przeciwne odpowiedzi). Istnieje wprawdzie możliwość oznaczania jednakowych odpowiedzi zawsze taką samą liczbą (bez względu na fakt, czy one były w ankiecie na pierwszym, drugim, trzecim... miejscu), jednak powoduje to komplikacje i zwiększa ilość błędów. Takie dylematy należy przewidzieć i rozwiązywać wcześniej już przy układaniu pytań ankietowych. Narzędzia do zbierania danych nie zawsze są tak proste, jak powyżej. Problemy pojawiają się najczęściej w tych pytaniach ankietowych, w których można zakreślić jednocześnie więcej

24 Boris Kožuh niż niż jedną jedną odpowiedź. Niektórzy respondenci zakreślają jedną odpowiedź, niektórzy dwie lub więcej niż dwie, natomiast niektórzy nie zakreślają żadnej. Stąd też dla niektórych respondentów pojawia się więcej wartości, dla innych natomiast tylko jedna wartość. Jak zatem zapisać odpowiedzi, aby zachować prostotę zapisu i równocześnie umieścić wszystkie dane? Najprostsze rozwiązanie jest następujące: z jednego pytania ankietowego zrobić więcej zmiennych tyle, ile jest proponowanych odpowiedzi. Powstałe w ten sposób wszystkie zmienne będą jednocyfrowe. W przypadku, gdy respondent zakreślił pewną odpowiedź zapisuje się 1, jeżeli jej nie zakreślił zapisuje się 0. Ilustruje to przykład pytania ankietowego z sześcioma proponowanymi odpowiedziami dla ośmiu respondentów. W przykładzie istniała możliwość zakreślenia dowolnej liczby odpowiedzi. Tabela 1. Odpowiedzi ośmiu respondentów na pytanie ankietowe Respondenci pierwszy drugi trzeci czwarty piąty szósty siódmy ósmy A A A A A A A A B B B B B B B B C C C C C C C C D D D D D D D D E E E E E E E E F F F F F F F F Należy to zapisać następująco: pierwszy respondent 110101 drugi respondent 011101 trzeci respondent 110110 czwarty respondent 111111 piąty respondent 011001 szósty respondent 101110

Opracowanie danych w PSPP 25 siódmy respondent 000000 ósmy respondent 101101 Siódmy respondent nie zakreślił żadnej odpowiedzi, więc wpisano sześć razy zero. W ten sposób powstały wiersze danych jednakowej długości dla wszystkich respondentów. W programie PSPP zapis ten wygląda następująco: Rysunek 12. Baza danych w programie PSPP Zjawisko to występuje bardzo często i z tego powodu zostanie dodatkowo wyjaśnione. W ankiecie pytano respondentów: Jakie są motywy podjęcia przez Panią/Pana studiów na kierunku pedagogika? Respondenci mogli zakreślić więcej niż jedną odpowiedź. Oto proponowane odpowiedzi: A będę miał możliwość awansu zawodowego B lubię pracować z dziećmi C lubię pracę grupową

26 Boris Kožuh D moi rodzice są nauczycielami E będę miał długie wakacje Zadano tylko jedno pytanie, jednak każdy respondent mógł udzielić kilku odpowiedzi. W celu wprowadzania i opracowywania danych pytanie to w myślach należy przekształcić w kilka podobnych pytań. Odpowiedzi traktuje się w taki sposób, jak gdyby kolejne pytania brzmiały: Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu możliwości awansu zawodowego? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi pracę z dziećmi? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi pracę grupową? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki, bo rodzice są nauczycielami? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu długich wakacji? TAK NIE Jeżeli respondent zakreślił A, to tak, jak gdyby na pierwsze zasymulowane w myślach pytanie, udzielił odpowiedź TAK. W przypadku, gdy go nie zakreślił, to jakby odpowiedział NIE. Tak należy postępować od pierwszej do ostatniej proponowanej odpowiedzi.

Opracowanie danych w PSPP 27 Ten rodzaj pytań można traktować jako jedną zmienną tylko w przypadkach, jeżeli opracowuje się je samodzielnie (czyli bez poszukiwania związków z innymi zmiennymi). Przy badaniu związków i zależności z innymi pytaniami lub zmiennymi ten rodzaj pytań należy traktować w powyżej opisany sposób (jako więcej zmiennych). Nie można analizować np. różnic według płci dla całego pytania, lecz dla każdej odpowiedzi oddzielnie (jedną po drugiej). Czynność ta jest skomplikowana, jednak nie istnieje inne rozwiązanie. Jeżeli współzależności nie są ważne, do kwestionariusza można włączyć podobne pytania. Jeżeli jednak współzależności są ważne dla badania, należy postępować w następujący sposób: - w kwestionariuszu należy ograniczyć możliwość wyboru odpowiedzi do jednej (np. który, z podanych motywów, był najważniejszy przy wyborze studiów pedagogiki?), - do kwestionariusza należy włączyć dwa podobne do siebie pytania (jedno z nich dotyczy wszystkich motywów i istnieje możliwość wyboru kilku odpowiedzi, drugie dotyczy jednego zwykle najsilniejszego motywu). Jeszcze bardziej złożone przypadki nie będą tu omówione, pomimo że mogą pojawić się w badaniach. Książka koncentruje się na najczęściej spotykanych problemach i sytuacjach badawczych. Prezentacja i porządkowanie danych jakościowych Dane jakościowe porządkuje i prezentuje się tworząc zestawy tabelaryczne. Dla każdej kategorii zmiennej należy policzyć ilość jednostek (liczebność). Liczebność zwykle wyrażana jest w postaci liczb absolutnych (np. ilu respondentów wybrało pojedyncze odpowiedzi na pytanie w ankiecie) i liczb procentowych (ile procent respondentów wybrało daną odpowiedź). Tak uporządkowane dane nadają się do kolejnych opracowań. Już samo uporządkowanie danych umożliwia pierwszą analizę.

28 Boris Kožuh Tabele zawierające jedną zmienną Tabele te pokazują stan każdej zmiennej w badanej populacji. Oto przykład prostej tabeli, która ilustruje strukturę zmiennej płeć wśród badanej populacji pracowników w Centrum Kształcenia Kadr. Tabela 2. Tabela grupy pracowników według płci płeć f % mężczyźni 26 39,4 kobiety 40 60,6 razem 66 100,0 Jeżeli zmienna jest porządkową i ma więcej niż dwa stopnie, można dodać kolumnę liczebności skumulowanych F (lub F%). Skumulowana liczebność jest sumą jednostek (lub %) do pewnej kategorii. Dla każdej kategorii należy zsumować wszystkie liczebności (zarówno jej, jak i niższych kategorii). Ma to jednak sens jedynie wtedy, gdy jest to niezbędne. Tabela 3. Tabela populacji uczniów według ocen z języka polskiego ocena liczebność procent liczebności skumulowany procent liczebności 2 5 5,8 5,8 3 12 14,0 19,8 4 32 37,2 57,0 5 31 36,0 93,0 6 6 7,0 100,0 razem 86 100,0 Wyniki w statystyce na ogół zaokrągla się do dwóch miejsc po przecinku. Istnieje jednak pewien wyjątek: procenty w tabelach

Opracowanie danych w PSPP 29 zaokrągla się do jednego miejsca po przecinku. Nie dotyczy to procentów, z których oblicza się kolejne wyniki. Tam znowu obowiązuje prawo dwóch miejsc po przecinku. W taki sposób przebiega porządkowanie danych dla wszystkich nominalnych i porządkowych zmiennych w badaniu. Te tabele pokazują stan w badanej populacji. Tabele zawierające dwie zmienne Często oprócz stanu po pojedynczych zmiennych bada się także związki między zmiennymi. Do takich celów należy sporządzić tabele, które zawierają więcej zmiennych. Są to tabele krzyżowe (korelacyjne). Najczęściej taka tabela zawiera dwie zmienne, ponieważ tabela z trzema zmiennymi jest już bardzo skomplikowaną i trudną do odczytania (nawet dla specjalistów). Poniżej zaprezentowano przykład tabeli dwóch zmiennych: wiek i poglądy dotyczące badanego zjawiska. Tabela 4. Tabela korelacyjna populacji studentów według wieku i poglądów zgadzam się niezdecydowany nie zgadzam razem się młodszy 24 18 37 79 starszy 24 12 14 50 razem 48 30 51 129 Z tej tabeli trudno zrozumieć, jaki jest związek zmiennych. Należy wyliczyć jeszcze procenty we wszystkich komórkach tabeli. Procenty można obliczyć trzema sposobami, otrzymując w ten sposób trzy odmienne tabele. Zostały one umieszczone na kolejnych stronach. W pierwszej z tabel procenty zostały obliczone według wieku, w drugiej według odpowiedzi dotyczących poglądów, w tabeli trzeciej z liczebności całej grupy (N=129).

30 Boris Kožuh Tabela 5. Procenty według kategorii zmiennej niezależnej młodszy 24 30,4% starszy 24 48,0% razem 48 37,2% zgadzam się niezdecydowany nie zgadzam się 18 22,8% 12 24,0% 30 23,3% 37 46,8% 14 28,0% 51 39,5% razem 79 100,0% 50 100,0% 129 100,0% W tej tabeli w wierszach obliczano procenty z sumy na końcu wiersza. W pierwszym wierszu liczebność 24 przedstawia 30,4% od sumy 79 (na prawym krańcu wiersza). Wszystkie procenty w tym wierszu dają razem 100,0% (30,4% + 22,8% + 46,8% = 100,0%). Tak samo oblicza się procenty we wszystkich wierszach. Tabela 6. Procenty według kategorii zmiennej zależnej zgadzam się niezdecydowany nie zgadzam się razem młodszy 24 50,0% 18 60,0% 37 72,5% 79 61,2% starszy 24 50,0% 12 40,0% 14 27,5% 50 38,8% razem 48 100,0% 30 100,0% 51 100,0% 129 100,0% W tej tabeli w kolumnach obliczano procenty z sumy na dnie kolumny. W pierwszej kolumnie liczebność 24 przedstawia 50,0% od sumy 48 (na dnie kolumny). Wszystkie procenty w tej kolumnie dają razem 100,0% (50,0% + 50,0% = 100,0%). Tak samo oblicza się procenty we wszystkich kolumnach.

Opracowanie danych w PSPP 31 Tabela 7. Procenty z liczebności całej populacji (N=129) młodszy 24 18,6% starszy 24 18,6% razem 48 37,2% zgadzam się niezdecydowany nie zgadzam się 18 14,0% 12 9,3% 30 23,3% 37 28,7% 14 10,8% 51 39,5% razem 79 61,2% 50 38,8% 129 100,0% W tej tabeli w komórkach obliczano procenty z liczebności całej populacji (N=129). W pierwszej komórce (górna lewa) liczebność 24 stanowi 18,6% wszystkich respondentów. Procenty we wszystkich komórkach tworzą razem 100,0% (18,6% + 14,0% + 28,7% + 18,6% + 9,3% + 10,8% = 100,0%). Procenty w kolumnie razem oraz w wierszu razem zostały też obliczone z N=129. Pierwsza tabela pokazuje, jaki wpływ na poglądy ma wiek respondentów. Z doświadczeń wiadomo, że ludzie w różnym wieku mają odmienne poglądy, o które pytano w ankiecie. Ponieważ obie zmienne są powiązane, należy określić, która z nich jest zmienną niezależną, a która zależną. Można założyć, że w tej parze wiek jest zmienną niezależną, a poglądy zależną. Dlatego akurat pierwsza tabela jest najbardziej odpowiednia. Przy badaniu zależności między zmiennymi, praktycznie zawsze należy obliczać procenty w przedstawiony sposób, to znaczy według zmiennej niezależnej. Druga tabela pokazuje, jaki wpływ mają poglądy na wiek. Jest to oczywiście bezsensowny kierunek wpływu. Dlatego też nie korzysta się z takich tabel. Trzecia tabela nie nadaje się do analizy związku między zmiennymi. Z tego powodu jest właśnie zupełnie niepotrzebna, ponieważ niepotrzebne jest włączenie niezwiązanych zmiennych do wspólnej tabeli.

32 Boris Kožuh Tabele sporządza się tak, że zmienna niezależna umieszczona jest w wierszach, a zmienna zależna w kolumnach. Wartości procentowe oblicza się w każdym wierszu odrębnie. Oto przykład takiego układu zmiennych: Tabela 8. Tabela korelacyjna populacji zaocznych studentów Zawsze Często Rzadko Nigdy Razem Dziewczęta 26 31,7% 31 37,8% 16 19,5% 9 11,0% 82 100,0% Chłopcy 19 25,0% 23 30,3% 21 27,6% 13 17,1% 76 100% Razem 45 28,5% 54 34,2% 37 23,4% 22 13,9% 158 100,0% Jeżeli zmienna zależna posiada tak wielką liczbę kategorii, że tabela jest za szeroka i nie pomaga nawet technika komputerowa (małe czcionki), należy odwrócić tę kolejność. W tym przypadku umieszcza się zmienną zależną w wierszach i zmienną niezależną w kolumnach. Ale uwaga: procenty należy i w tym przypadku obliczać według kategorii zmiennej niezależnej, (czyli 100, 0% znajduje się na dole każdej kolumny). Dodatkowo w tekście przed taką tabelą należy czytelnikowi zwrócić uwagę na tak odwrócony układ. Tabela 9. Sposób spędzania czasu wolnego Piłka nożna 6 8,5% Piłka ręczna 8 11,3% Siatkówka 14 19,7% Koszykówka 7 9,9% Dziewczęta Chłopcy Razem 32 23,4% 11 8,0% 27 19,7% 9 6,6% 38 18,3% 19 9,1% 41 19,7% 16 7,7%

Opracowanie danych w PSPP 33 Narciarstwo 6 8,5% Atletyka 6 8,5% Judo 3 4,2% Pływanie 7 9,9% Strzelectwo 5 7,0% Inny 9 12,7% Razem 71 100,0% 9 6,6% 8 5,8% 5 3,6% 12 8,6% 6 4,4% 18 13,1% 137 100,0% 15 7,2% 14 6,7% 8 3,8% 19 9,1% 11 5,3% 27 13,0% 208 100,0% Oto przykład upierania się przy regule: tabele sporządza się tak, że zmienna niezależna umieszczona jest po lewej stronie (w wierszach), a zmienna zależna u góry tabeli (w kolumnach). Tabela 10. Sposób spędzania czasu wolnego Piłka nożna Piłka ręczna Siatkówka Koszykówka Narciarstwo Atletyka Judo Pływanie Strzelectwo Inny Razem Dziewczęta 6 8 14 7 6 6 3 7 5 9 71 8,5% 11,3% 19,7% 9,9% 8,5% 8,5% 4,2% 9,9% 7,0% 12,7% 100,0% Chłopcy 32 11 27 9 9 8 5 12 6 18 137 23,4% 8,0% 19,7% 6,6% 6,6% 5,8% 3,6% 8,6% 4,4% 13,1% 100,0% Razem 38 19 41 16 15 14 8 19 11 27 208 18,3% 9,1% 19,7% 7,7% 7,2% 6,7% 3,8% 9,1% 5,3% 13,0% 100,0% Prezentacja i porządkowanie danych ilościowych Uporządkowane dane nominalne lub porządkowe nadają się już do interpretacji. Inaczej jest w przypadku danych ilościowych (przedziałowych i ilorazowych), które porządkuje się tylko w celach łatwiejszego opracowania. Korzystanie z komputera w opracowaniu danych przyniosło radykalną zmianę: porządkowanie danych ilościowych przed opracowaniem jest już zupełnie niepotrzebne. Dlatego też zagadnienie dotyczące porządkowania

34 Boris Kožuh danych ilościowych omawia się w sposób skrócony. Dane ilościowe porządkuje się na dwa sposoby. 1. Tworzy się szereg szczegółowy prosty. Wartości zmiennej porządkuje się rosnąco. Sposób ten, bez szczegółowego opisu, zostanie zilustrowany jednym przykładem. Oto odpowiedzi nauczycieli na pytanie o staż pracy: Tabela 11. Staż pracy nauczycieli x 2 4 5 6 7 9 10 11 12 14 17 21 23 24 27 R 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 2. Tworzy się szereg rozdzielczy z przedziałami klasowymi. Tego sposobu używa się w sytuacjach, gdy liczebność grupy przewyższa liczebność zwykłej klasy szkolnej. Tabela 12. Wyniki testu z języka angielskiego Przedziały klasowe Liczebność Procent liczebności Liczebność skumulowana Skumulowany procent liczebności 8-12 2 1,7 2 1,7 13-17 5 4,2 7 5,8 18-22 8 6,7 15 12,5 23-27 11 9,2 26 21,7 28-32 17 14,2 43 35,8 33-37 21 17,5 64 53,3 38-42 15 12,5 79 65,8 43-47 15 12,5 94 78,3 48-52 12 10,0 106 88,3 53-57 10 8,3 116 96,7 58-62 4 3,3 120 100,0 N=120

Opracowanie danych w PSPP 35 Do prezentacji i interpretacji danych ilościowych nadają się końcowe wyniki opracowań statystycznych (średnie arytmetyczne, wariancje, współczynniki korelacji, itd.).

36 Boris Kožuh

Opracowanie danych w PSPP 37 3 Wprowadzanie danych ROZDZIAŁ TRZECI Dane można wprowadzać za pomocą kilka programów: Excel, SPSS, PSPP, Word, itd. Do niedawna najlepszym rozwiązaniem było wprowadzanie danych za pomocą edytora Word. Jednak dane wprowadzone w programie Word wymagają złożonych operacji importowania do programów PSPP lub SPSS. Dlatego odradza się wprowadzanie danych za pomocą programu Word, pomimo że wymaga ono mniej czasu niż w pozostałych wymienionych programach. Wprowadzanie danych w programie Excel jest proste, ale wymaga więcej pracy niż w Wordzie. Przenoszenie bazy danych do programu SPSS jest nadzwyczaj proste, ale do programu PSPP na razie niemożliwe. Być może następne wersje programu PSPP będą umożliwiały import danych z Excel. Program PSPP posiada prosty podprogram do wprowadzania danych. Dane wprowadzone za pomocą programu PSPP można bez przygotowania opracowywać także w programie SPSS. Trzeba jednak podkreślić jedną zaletę programu Word. W przypadku bazy danych, która zawiera wielką liczbę zmiennych,

38 Boris Kožuh program Word oszczędza czas. Wprowadzanie za pomocą programów SPSS, PSPP lub Excel wymaga, po zapisaniu każdej wartości, użycia strzałki kursora (w prawo). Jeżeli np. badanie zawiera 200 prostych zmiennych (jednocyfrowych), przy wprowadzaniu danych dla każdego respondenta należy nacisnąć 200 razy odpowiednią cyfrę i 199 razy strzałkę kursora. W Wordzie wystarczy nacisnąć tylko 200 cyfr. Procedury wprowadzania danych za pomocą programu Word i importowania do SPSS (lub PSPP) zostały opisane w starszych podręcznikach (patrz: Kožuh 2006). Wprowadzanie danych za pomocą programu PSPP Przy uruchamianiu programu PSPP otwiera się okno Data Editor. W lewym dolnym rogu okna znajdują się dwie zakładki: Data View i Variable View. Pierwsza z nich otwiera widok na dane, a druga na listę zmiennych. W oknie z widokiem na dane uruchamia się opracowania statystyczne, a w oknie z listą zmiennych określa się i opisuje zmienne. Rysunek 13. Okno Data Editor

Opracowanie danych w PSPP 39 W otwartym oknie Data Editor jest oznaczona pierwsza komórka (w lewym górnym rogu). W programie SPSS można od razu zacząć wprowadzać dane, a w programie PSPP nie jest to możliwe, ponieważ najpierw trzeba określić zmienne. Kliknij na zakładkę Variable View. Otworzy się okno: Rysunek 14. Okno Data Editor-Variable View I w tym oknie oznaczona jest pierwsza komórka. Od razu można wpisać imię pierwszej zmiennej. Imię nie może być dłuższe od jednego słowa (nie wolno używać spacji). Oznacza to, że można wpisać imię ocenazmatematyki, ale nie można wpisać ocena z matematyki. Najlepiej nadać niektórym zmiennym ich krótkie imiona (np. płeć, wiek, staż, itd.), a zmiennym z długimi imionami tylko skróty np. z1, z2, z3 (zmienna pierwsza, zmienna druga, zmienna trzecia, itd.). Po wpisie imienia należy kliknąć na Enter lub przejść do kolejnego wiersza za pomocą myszki. Wpiszemy imię drugiej zmiennej i tak do końca listy zmiennych. Listę dziesięciu zmiennych prezentuje następny rysunek:

40 Boris Kožuh Rysunek 15. Okno Variable View z listą dziesięciu zmiennych Pierwsze cztery zmienne (płeć, wiek, klasa i wykształcenie matki) to dane osobowe respondentów z metryczki ankiety. Pozostałe zmienne to te, które bardzo często występują w badaniach edukacji: oceny z dwóch przedmiotów, wyniki dwóch testów i odpowiedzi na dwa pytania z kwestionariusza ankiety. Wiek i wyniki testów to zmienne ilościowe, natomiast pozostałe zmienne są zmiennymi jakościowymi. Jeżeli wprowadzone zostało niepoprawne imię zmiennej, należy kliknąć na odpowiednią komórkę, wpisać poprawne imię i zatwierdzić klawiszem Enter. Po wpisie całej listy zmiennych, najlepiej zapisać plik na dysk. Oczywiście, plik można zapisać też później (po wprowadzeniu wszystkich danych), ale ostrożność wymaga zapisów w trakcie pracy. W oknie Data Editor należy otworzyć menu File i wybrać pozycje Save As (zapisz jako).