OPRACOWANIE DANYCH W PSPP



Podobne dokumenty
Przygotowanie danych

OPRACOWANIE DANYCH W PSPP

Porównywanie populacji

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Dokumentacja programu. Zoz. Uzupełnianie kodów terytorialnych w danych osobowych związanych z deklaracjami POZ. Wersja

A N K I E T A. Zalety i wady ankiety. wielka możliwość nieszczerych odpowiedzi przy posyłaniu ankiet pocztą wiele z nich nie wraca

Sposoby prezentacji problemów w statystyce

STATYSTYKA DLA PEDAGOGÓW

Wykład 3: Prezentacja danych statystycznych

Szybka instrukcja tworzenia testów dla E-SPRAWDZIAN-2 programem e_kreator_2

Edytor tekstu OpenOffice Writer Podstawy

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

EXCEL TABELE PRZESTAWNE

Formularz pierwszej oceny w służbie cywilnej

Niestandardowa tabela częstości

Zastanawiałeś się może, dlaczego Twój współpracownik,

SYSTEMY OPERACYJNE I SIECI KOMPUTEROWE

Rozpoczynamy import Kreator uruchamiamy przyciskiem Z tekstu, znajdującym się na karcie Dane, w grupie Dane zewnętrzne.

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

UONET+ - moduł Sekretariat. Jak wykorzystać wydruki list w formacie XLS do analizy danych uczniów?

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka

Stosowanie, tworzenie i modyfikowanie stylów.

CZĘŚĆ A PIERWSZE KROKI Z KOMPUTEREM

Struktura dokumentu w arkuszu kalkulacyjnym MS EXCEL

Organizacja edytora danych

Instrukcja obsługi programu SWWS autorstwa Michała Krzemińskiego

Przypomnienie: Ćwiczenie 1.

Skrócona instrukcja korzystania z Platformy Zdalnej Edukacji w Gliwickiej Wyższej Szkole Przedsiębiorczości

MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej

W każdej sali najważniejszym narzędziem są prawdopodobnie Zasoby. Przyjrzyjmy się teraz temu narzędziu, któremu zmieniono poniżej nazwę na Wspólne

Instrukcja korzystania z portalu Diagnoza Nowej Ery

ZAJĘCIA KOMPUTEROWE KLASA IV. Opis wymagań, które uczeń powinien spełnić, aby uzyskać ocenę:

e-podręcznik dla seniora... i nie tylko.

BAZA_1 Temat: Tworzenie i modyfikowanie formularzy.

Przykład 1. (Arkusz: Sortowanie 1 )

Jak korzystać z przeglądarki danych ESS SoftReport

Wstęp Sterowanie Utworzenie, wybór i kasowanie gracza. utworzenia nowego gracza Nowy gracz Nastawienie gracza

Narzędzie informatyczne wspomagające dokonywanie ocen pracowniczych w służbie cywilnej

Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt

Oficyna Wydawnicza UNIMEX ebook z zabezpieczeniami DRM

5.3. Tabele. Tworzenie tabeli. Tworzenie tabeli z widoku projektu. Rozdział III Tworzenie i modyfikacja tabel

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych.

Instrukcja obsługi. Generatora CSV

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Tworzenie raportów. Ćwiczenie 1. Utwórz Autoraport przedstawiający tabelę Studenci

Ekran tytułowy (menu główne)

Wykład III. dr Artur Bartoszewski Wydział Nauczycielski, Kierunek Pedagogika Wprowadzenie do baz danych

Student 1. Loguje się do wirtualnego dziekanatu 2. Najlepiej z przeglądarki Mozilla Firefox i musi mieć wyłączone blokowanie wyskakujących okienek.

Generator CABRILLO program Marka SP7DQR (Instrukcja obsługi)

najlepszych trików Excelu

Aby przejść do edycji w tym module należy wybrać zakładkę "Dla Pracowników" -> "Sprawdziany".

Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu

Przygotowanie własnej procedury... 3 Instrukcja msgbox wyświetlanie informacji w oknie... 6 Sposoby uruchamiania makra... 8

System Obsługi Zleceń

Techniki wstawiania tabel

Edytor materiału nauczania

1. Przekopiuj na dysk F bazę M5BIB.mdb z dysku wskazanego przez prowadzącego 2. Otwórz bazę (F:\M5BIB.mdb)

1. Opis okna podstawowego programu TPrezenter.

ACCESS ćwiczenia (zestaw 1)

programu Neofon instrukcja obsługi Spis treści

Damian Daszkiewicz Tworzenie strony-wizytówki dla firmy XYZ

1. Przypisy, indeks i spisy.

I Tworzenie prezentacji za pomocą szablonu w programie Power-Point. 1. Wybieramy z górnego menu polecenie Nowy a następnie Utwórz z szablonu

5.2. Pierwsze kroki z bazami danych

Jak utworzyć plik SIO dla aktualnego spisu?

TABULATORY - DOKUMENTY BIUROWE

Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu

Importowanie danych z Excela

BIBLIOTEKA LOKALNE CENTRUM WIEDZY PRAKTYCZNEJ PRZEWODNIK PO NARZĘDZIACH WARSZTAT NR 1: ARKUSZE KALKULACYJNE - MINI SKRYPT

Przenoszenie, kopiowanie formuł

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

Zasady wypełniania formularza sprawozdań za 2014 w Excelu

Jak przygotować pokaz album w Logomocji

Poradnik obsługi systemu zarządzania treścią (CMS) Concrete5. Moduły i bloki

Po wstawieniu tabeli (i zawsze wtedy, gdy w tabeli jest kursor) pojawia się na wstążce nowa grupa zakładek o nazwie Narzędzia tabel.

Arkusz kalkulacyjny MS Excel 2010 PL.

Jak zapisać wersję elektroniczną pracy dyplomowej? - INSTRUKCJA (krok po kroku)

Wprowadzania liczb. Aby uniknąć wprowadzania ułamka jako daty, należy poprzedzać ułamki cyfrą 0 (zero); np.: wpisać 0 1/2

Obsługa pakietu biurowego OFFICE

Dokument zawiera podstawowe informacje o użytkowaniu komputera oraz korzystaniu z Internetu.

darmowe zdjęcia - allegro.pl

5.4. Tworzymy formularze

Zapytania i wstawianie etykiet z bazy danych do rysunku

Podstawy pracy z edytorem tekstu. na przykładzie Open Office

1 Podstawowe pojęcia

Tworzenie prezentacji w MS PowerPoint

Dlaczego stosujemy edytory tekstu?

Edytor tekstu OpenOffice Writer Podstawy

Zadanie 1. Stosowanie stylów

1. Umieść kursor w miejscu, w którym ma być wprowadzony ozdobny napis. 2. Na karcie Wstawianie w grupie Tekst kliknij przycisk WordArt.

Jak zapisać wersje elektroniczną pracy dyplomowej? - INSTRUKCJA (krok po kroku)

Zasady wypełniania formularza sprawozdań za 2016 rok w Excelu. 6 komórek zawiera formuły. Są one oznaczone: lub wyświetla się w nich 0.

Instrukcja. importu dokumentów. z programu Fakt do programu Płatnik. oraz. przesyłania danych do ZUS. przy pomocy programu Płatnik

2. Dostosuj listę Szybkiego Dostępu

opracował: Patryk Besler

Temat 1. Więcej o opracowywaniu tekstu

Transkrypt:

Zpracování dat v PSPP pro společenské vědy 3 KRAKOWSKA AKADEMIA A. F. MODRZEWSKIEGO BORIS KOŽUH OPRACOWANIE DANYCH W PSPP KRAKÓW 2013

4 Boris Kožuh, Jaroslav Myslivec

Opracowanie danych w PSPP 9 1 Program PSPP ROZDZIAŁ PIERWSZY Opis programu PSPP Program PSPP jest darmowym programem (shareware) do statystycznych opracowań danych w badaniach. Jest bardzo podobny do programu SPSS, umożliwia jedynie nieco mniej statystycznych metod. Dla studentów jest jednak bardzo korzystny, ponieważ pozwala na łatwe i proste korzystanie z obydwu programu. Darmowy program PSPP możemy mieć na swoim domowym komputerze, a dodatkowe opracowania w SPSS wykonywać na uczelni. W domu można wprowadzić dane i wykonać wszystkie podstawowe opracowania, a na uczelni dodatkowo wykonać w SPSS te opracowania, których PSPP nie umożliwia. Dla zdecydowanej większości studentów (kierunków humanistycznych) możliwości programu PSPP będą w całości wystarczające do pracy dyplomowej, a często nawet i do pracy doktorskiej. Jeżeli jednak będą potrzebne bardziej skomplikowane opracowania, dane wprowadzone w PSPP i zachowane na pamięci pendrive możno opracować na uczelni w SPSS. Przynajmniej w tym zakresie oba programy są kompatybilne.

10 Boris Kožuh Pobieranie programu Program SPSS, z którego korzystają zarówno profesorowie, jak i studenci niemal na wszystkich uniwersytetach świata, jest programem profesjonalnym. Jest on jednak bardzo drogi, dlatego nie kupują go ani profesorowie, ani studenci. Kupują go tylko firmy i uniwersytety. Pierwsza wersja programu pojawiła się na rynku 1968 roku, a ostatnia wersja to 21 z roku 2012. Wraz z pojawieniem sie systemu Windows, dostosowano też program SPSS do tego systemu. Autor niniejszej książki w roku 1973 opracował dane do swojej pracy dyplomowej za pomocą jednej z pierwszych wersji (wówczas jeszcze nie było systemu Windows ani komputerów domowych PC). Podręcznik do korzystania programu zawierał wtedy ponad 2000 stron. Program PSPP jest natomiast darmowym programem, który może legalnie posiadać każdy. Program pobiera się z witryny internetowej organizacji GNU. Do wyszukiwarki należy wprowadzić adres: www.gnu.org. Otwiera się wtedy strona organizacji GNU: Rysunek 1. Strona internetowa organizacji GNU Należy kliknąć na Downloads. Otwiera się niemal taka sama strona jak poprzednia.

Opracowanie danych w PSPP 11 Rysunek 2. Strona internetowa organizacji GNU z listą programów Na tej stronie należy poszukać listy wszystkich dostępnych programów. Znajduje się ona w dolnej części strony pod tytułem All Gnu Packages. Lista zawiera dużo dobrych i użytecznych programów. Wśród tych programów jest też PSPP (rysunek nr 3). Rysunek 3. Lista programów

12 Boris Kožuh Należy kliknąć na nazwę pspp. Otwiera się następująca strona: Rysunek 4. Strona programu PSPP Należy kliknąć na Get PSPP. Otwiera się kolejna strona tego programu: Rysunek 5. Wybór wersji programu PSPP Górna część tej strony jest taka sama jak poprzednia, a niżej znajduje się lista dostępnych wersji programu PSPP. Aby pobrać

Opracowanie danych w PSPP 13 wersję do Windows należy kliknąć na link: Mingw-based version (rysunek nr 5). Otwiera się wówczas następne okno: Rysunek 6. Wybór wersji programu PSPP Najlepiej oczywiście wybrać i kliknąć na najnowszą wersję. Program zostanie pobrany do naszego komputera. Rysunek nr 7 pokazuje ostatni etap całej procedury. Należy kliknąć na zapisz. Po zapisaniu programu należy odszukać program w komputerze, kliknąć na niego i już można korzystać z programu. Rysunek 7. Pobieranie pliku zawierającego program PSPP

14 Boris Kožuh Istnieje oczywiście krótsza procedura. Jeżeli czytelnika nie interesują informacje o organizacji GNU, która proponuje darmowe programy, można otrzymać program PSPP bezpośrednio z adresu: http://pspp.michelboaventura.com/en/downloads-2/?lang=en Praca w programie PSPP Opracowanie danych za pomocą programu PSPP przebiega w następujących fazach: Krok pierwszy Krok drugi Krok trzeci Krok czwarty Przygotowanie listy zmiennych Z kwestionariusza, arkuszu obserwacji, protokołu wywiadu lub z innych narzędzi należy zrobi pełną listę zmiennych, które będą opracowywane za pomocą komputera. Wprowadzanie danych do komputera Przygotowane dane należy wprowadzić do komputera. Program PSPP ma swój podprogram do wprowadzania danych. Dane wprowadzone za pomocą programu PSPP możn bez przygotowania opracowywać takż w programie SPSS. Opis zmiennych Po wprowadzeniu danych do komputera należy opisa zmienne: wpisa ich pełne imiona, wpisa imiona kategorii, itd. Opracowanie danych Wybierając różne polecenia w PSPP uruchamia się wybrane opracowania statystyczne. Po uruchomieniu poleceń otwiera się okno dialogowe. W tym oknie ustawia się różne opcje opracowania.

Opracowanie danych w PSPP 15 Krok piąty Krok szósty Krok siódmy Przegląd wyników Kilka sekund po uruchomieniu końcowego polecenia otwiera się okno Data Editor, w którym można zobaczyć wszystkie wyniki. Okno to umożliwia przegląd wyników i eksport, a następnie zachowanie wyników na dysku. Dodatkowe porządkowanie danych Prawie zawsze po przeglądzie pierwszych wyników powstaje potrzeba powrotu do danych wyjściowych po to, aby je dodatkowo uporządkować (pogrupować, selekcjonować itd. Wykorzystanie wyników Po opracowaniu wyników i ich przeglądzie, plik z wynikami należy zapisa na dysk. Zapis ten przebiega poprzez eksport pliku. Zapisane wyniki będzie trzeba przenieść do tekstu, w którym następnie będą analizowane, prezentowane oraz interpretowane (do pracy magisterskiej, dyplomowej, do raportu badań, artykułu itd.).

16 Boris Kožuh

Opracowanie danych w PSPP 17 2 Przygotowanie danych ROZDZIAŁ DRUGI Przed opracowaniem statystycznym należy uporządkować dane. Ułatwia ono późniejsze opracowywanie danych. Od czasu, kiedy pojawiły się komputery, procedury porządkowania danych zmieniły się w sposób zasadniczy. Przed ręcznym opracowaniem danych należy je uporządkować, natomiast do opracowania za pomocą komputera, wystarczy je jedynie przygotować. Przygotowanie danych do opracowania komputerowego W empirycznych badaniach edukacji badacz dysponuje zwykle stosunkowo prostymi danymi. Najczęściej występujące zmienne to zmienne nominalne i porządkowe. Należą do nich m. in.: wykształcenie, płeć, narodowość, zadowolenie, powodzenie, różne zdolności, życzenia, zainteresowania itd. Rzadziej spotyka się zmienne przedziałowe lub ilorazowe. Zmienne przedziałowe lub ilorazowe w tym podrozdziale (w celu łatwiejszego zrozumienia) zostaną omówione wspólnie: liczba uczniów w klasie, wiek,

18 Boris Kožuh wzrost, staż pracy, czas uczenia się, liczba przeczytanych książek, itd. Niektóre zmienne, które należą do porządkowych, często opracowuje się tak, jak zmienne przedziałowe (np. wyniki uczniów w teście). Dla wszystkich jednostek dane zbiera się najczęściej za pomocą jednego narzędzia. Do najczęściej używanych narzędzi w badaniach pedagogicznych należą kwestionariusze ankiety, kwestionariusze wywiadu, skale postaw, skale szacowania, testy socjometryczne, testy wiadomości i protokoły obserwacji. W niniejszym opracowaniu osoby badane różnymi narzędziami określa się pojęciem respondent. Na końcu badania dla wszystkich respondentów istnieje taka sama ilość zmiennych, ponieważ dane dla wszystkich respondentów zbiera się prawie zawsze tymi samymi narzędziami. To ułatwia wprowadzanie danych do komputera, ich opracowywanie i prezentowanie wyników. Jeżeli zastosowano dwa kwestionariusze dla dwóch różnych grup respondentów (np. dla nauczycieli i dla rodziców), to w takich przypadkach dane wprowadza się odrębnie: do jednego pliku odpowiedzi nauczycieli, a do drugiego pliku odpowiedzi rodziców. W przypadku prostych kwestionariuszy dane wprowadzane są bezpośrednio z kwestionariuszy do komputera. W przypadku skomplikowanych kwestionariuszy lepiej wprowadzać dane najpierw z kwestionariusza na przygotowane kartki (szablony). Każdy respondent posiada wówczas swoją kartkę lub przynajmniej swój wiersz na kartce. Z wypełnionych kartek dane wprowadza się do komputera. O tym, czy dane wprowadza się bezpośrednio czy pośrednio, decyduje doświadczenie i praktyka w posługiwaniu się komputerem. Przy bezpośrednim wprowadzaniu jest mniej pracy, ale jednocześnie pojawia się więcej błędów. Dane najlepiej wprowadzać z kimś: jedna osoba czyta dane, a druga je zapisuje w komputerze. Pozornie wydaje się, że dwie osoby potrzebują dwa razy mniej czasu na wprowadzanie danych. Prawda jest jednak zaskakująca: czas wprowadzania skraca się nawet o dziesięć razy.

Opracowanie danych w PSPP 19 Najlepiej wprowadzać dane za pomocą programu PSPP. Dane wprowadzone za pomocą programu PSPP można bez przygotowania opracowywać także w programie SPSS. Z danymi wprowadzonymi za pomocą programu Excel jest nieznacznie więcej pracy, ale tylko przy opracowywaniu w SPSS. Natomiast dane wprowadzone w programie Word wymagają dość skomplikowanego przenoszenia (importu) do programów SPSS i PSPP. Z tego powodu odradza się wprowadzanie danych za pomocą programu Word pomimo, że samo wprowadzanie wymaga mniej czasu niż w pozostałych wymienionych programach. Dane dla każdego respondenta zapisuje się w nowym wierszu. W ten sposób powstaje baza danych. W wierszach bazy umieszcza się respondentów, natomiast w kolumnach zmienne. Oto widok na bazę danych w programie PSPP. Rysunek 8. Baza danych w programie PSPP Baza danych w programie SPSS jest niemal identyczna:

20 Boris Kožuh Rysunek 9. Baza danych w programie SPSS Bardzo podobnie wygląda też baza danych wprowadzonych za pomocą programu Excel. Oto ona: Rysunek 10. Baza danych w programie Excel

Opracowanie danych w PSPP 21 Jeżeli dane zostały wprowadzone za pomocą programu Word (do pojawienia się programu PSPP było tak w większości przypadków), baza danych wygląda zupełnie inaczej: Rysunek 11. Baza danych w programie Word Do opracowania takich danych używa się programów statystycznych, takich jak np. PSPP, SPSS, Excel, Statistica, itp. Spis zmiennych Ważnym etapem przygotowania danych do wprowadzania do komputera jest przygotowanie listy zmiennych. Lista zmiennych powstaje na początku układania narzędzia jest to pierwszy etap układania. Niektóre zmienne mają proste i naturalne imiona, takie jak: wiek, płeć, czas uczenia się, ilość błędów w dyktandzie, itd. Innym trudno nadać proste imiona i (przynajmniej na początku) nadaje się im imiona techniczne jak np. odpowiedź na czwarte pytanie w ankiecie, pierwsza ocena, druga ocena, pogląd pierwszy,

22 Boris Kožuh itp. Do wprowadzania imion w programie PSPP należy skrócić imię każdej zmiennej do jednego słowa. Zapisy wartości Wartości większej części zmiennych z ankiet, skal szacowania, protokołów obserwacji, itd. zostają zapisane w postaci liczb jednocyfrowych. Zilustruje to przykład pytania ankietowego zamkniętego z sześcioma proponowanymi odpowiedziami: A, B, C, D, E i F. Do komputera nie wprowadza się liter zawsze tylko liczby. Odpowiedź A zapisana zostanie jako liczba 1. Dla respondentów, którzy zakreślili odpowiedź B - zapisana zostanie liczba 2, dla wszystkich, którzy zakreślili odpowiedź C, zostanie zapisana liczba 3 i tak dalej do odpowiedzi F. Taka zmienna będzie miała jednocyfrowy zapis i będzie zajmowała w szeregu danych tylko jedno miejsce. Oto przykład, w którym respondenci odpowiadali na pięć takich pytań. Pierwszy respondent zakreślił przy pytaniu pierwszym odpowiedź C, przy drugim A, przy trzecim A, przy czwartym D i przy piątym C. Odpowiedzi drugiego respondenta to kolejno: B, C, A, F, B; trzeciego: B, B, B, A, D i czwartego: C, C, E, A, F. Należy to zapisać w następujący sposób: pierwszy respondent 31143 drugi respondent 23162 trzeci respondent 22214 czwarty respondent 33516 itd. Dla pięciu zmiennych istnieje pięć kolumn, ponieważ wszystkie zapisy są jednocyfrowe. Nie ma znaczenia, że wszystkie pytania w ankiecie nie są ilościowe (numerycznie). W ten sposób zapisuje się dane także dla wyłącznie jakościowych zmiennych. W przypadku płci należy np. dla

Opracowanie danych w PSPP 23 kobiet zapisać liczbę 1, dla mężczyzn liczbę 2. Takie postępowanie nie zmienia natury zmiennych. Nie oznacza to, że nie uwzględnia się właściwości zmiennych. Łatwiejsze jest jedynie wprowadzanie danych do komputera, a także ich późniejsze opracowanie. Proste rozwiązania są najlepsze i przynoszą najmniej błędów. Dlatego też poszczególnym odpowiedziom na pytania w ankiecie (kategoriom zmiennej) przyporządkowuje się liczby w tej samej kolejności, według której były podane w ankiecie (pierwszej odpowiedzi zawsze 1, drugiej 2, trzeciej 3, itd.). Przy takim postępowaniu możliwość wystąpienia błędów jest najmniejsza. Nawet w przypadku, jeżeli w pytaniu ankietowym nr 8 odpowiedzi zostały umieszczone w następujący sposób: A. zawsze B. czasami C. nigdy a w pytaniu nr 13: A. nigdy B. czasami C. zawsze w obydwu sytuacjach odpowiedź A należy zapisać jako 1 (bez względu na to, że to dwie zupełnie przeciwne odpowiedzi). Istnieje wprawdzie możliwość oznaczania jednakowych odpowiedzi zawsze taką samą liczbą (bez względu na fakt, czy one były w ankiecie na pierwszym, drugim, trzecim... miejscu), jednak powoduje to komplikacje i zwiększa ilość błędów. Takie dylematy należy przewidzieć i rozwiązywać wcześniej już przy układaniu pytań ankietowych. Narzędzia do zbierania danych nie zawsze są tak proste, jak powyżej. Problemy pojawiają się najczęściej w tych pytaniach ankietowych, w których można zakreślić jednocześnie więcej

24 Boris Kožuh niż niż jedną jedną odpowiedź. Niektórzy respondenci zakreślają jedną odpowiedź, niektórzy dwie lub więcej niż dwie, natomiast niektórzy nie zakreślają żadnej. Stąd też dla niektórych respondentów pojawia się więcej wartości, dla innych natomiast tylko jedna wartość. Jak zatem zapisać odpowiedzi, aby zachować prostotę zapisu i równocześnie umieścić wszystkie dane? Najprostsze rozwiązanie jest następujące: z jednego pytania ankietowego zrobić więcej zmiennych tyle, ile jest proponowanych odpowiedzi. Powstałe w ten sposób wszystkie zmienne będą jednocyfrowe. W przypadku, gdy respondent zakreślił pewną odpowiedź zapisuje się 1, jeżeli jej nie zakreślił zapisuje się 0. Ilustruje to przykład pytania ankietowego z sześcioma proponowanymi odpowiedziami dla ośmiu respondentów. W przykładzie istniała możliwość zakreślenia dowolnej liczby odpowiedzi. Tabela 1. Odpowiedzi ośmiu respondentów na pytanie ankietowe Respondenci pierwszy drugi trzeci czwarty piąty szósty siódmy ósmy A A A A A A A A B B B B B B B B C C C C C C C C D D D D D D D D E E E E E E E E F F F F F F F F Należy to zapisać następująco: pierwszy respondent 110101 drugi respondent 011101 trzeci respondent 110110 czwarty respondent 111111 piąty respondent 011001 szósty respondent 101110

Opracowanie danych w PSPP 25 siódmy respondent 000000 ósmy respondent 101101 Siódmy respondent nie zakreślił żadnej odpowiedzi, więc wpisano sześć razy zero. W ten sposób powstały wiersze danych jednakowej długości dla wszystkich respondentów. W programie PSPP zapis ten wygląda następująco: Rysunek 12. Baza danych w programie PSPP Zjawisko to występuje bardzo często i z tego powodu zostanie dodatkowo wyjaśnione. W ankiecie pytano respondentów: Jakie są motywy podjęcia przez Panią/Pana studiów na kierunku pedagogika? Respondenci mogli zakreślić więcej niż jedną odpowiedź. Oto proponowane odpowiedzi: A będę miał możliwość awansu zawodowego B lubię pracować z dziećmi C lubię pracę grupową

26 Boris Kožuh D moi rodzice są nauczycielami E będę miał długie wakacje Zadano tylko jedno pytanie, jednak każdy respondent mógł udzielić kilku odpowiedzi. W celu wprowadzania i opracowywania danych pytanie to w myślach należy przekształcić w kilka podobnych pytań. Odpowiedzi traktuje się w taki sposób, jak gdyby kolejne pytania brzmiały: Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu możliwości awansu zawodowego? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi pracę z dziećmi? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki, bo lubi pracę grupową? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki, bo rodzice są nauczycielami? TAK NIE Czy Pani/Pan zdecydowała się na studia pedagogiki z powodu długich wakacji? TAK NIE Jeżeli respondent zakreślił A, to tak, jak gdyby na pierwsze zasymulowane w myślach pytanie, udzielił odpowiedź TAK. W przypadku, gdy go nie zakreślił, to jakby odpowiedział NIE. Tak należy postępować od pierwszej do ostatniej proponowanej odpowiedzi.

Opracowanie danych w PSPP 27 Ten rodzaj pytań można traktować jako jedną zmienną tylko w przypadkach, jeżeli opracowuje się je samodzielnie (czyli bez poszukiwania związków z innymi zmiennymi). Przy badaniu związków i zależności z innymi pytaniami lub zmiennymi ten rodzaj pytań należy traktować w powyżej opisany sposób (jako więcej zmiennych). Nie można analizować np. różnic według płci dla całego pytania, lecz dla każdej odpowiedzi oddzielnie (jedną po drugiej). Czynność ta jest skomplikowana, jednak nie istnieje inne rozwiązanie. Jeżeli współzależności nie są ważne, do kwestionariusza można włączyć podobne pytania. Jeżeli jednak współzależności są ważne dla badania, należy postępować w następujący sposób: - w kwestionariuszu należy ograniczyć możliwość wyboru odpowiedzi do jednej (np. który, z podanych motywów, był najważniejszy przy wyborze studiów pedagogiki?), - do kwestionariusza należy włączyć dwa podobne do siebie pytania (jedno z nich dotyczy wszystkich motywów i istnieje możliwość wyboru kilku odpowiedzi, drugie dotyczy jednego zwykle najsilniejszego motywu). Jeszcze bardziej złożone przypadki nie będą tu omówione, pomimo że mogą pojawić się w badaniach. Książka koncentruje się na najczęściej spotykanych problemach i sytuacjach badawczych. Prezentacja i porządkowanie danych jakościowych Dane jakościowe porządkuje i prezentuje się tworząc zestawy tabelaryczne. Dla każdej kategorii zmiennej należy policzyć ilość jednostek (liczebność). Liczebność zwykle wyrażana jest w postaci liczb absolutnych (np. ilu respondentów wybrało pojedyncze odpowiedzi na pytanie w ankiecie) i liczb procentowych (ile procent respondentów wybrało daną odpowiedź). Tak uporządkowane dane nadają się do kolejnych opracowań. Już samo uporządkowanie danych umożliwia pierwszą analizę.

28 Boris Kožuh Tabele zawierające jedną zmienną Tabele te pokazują stan każdej zmiennej w badanej populacji. Oto przykład prostej tabeli, która ilustruje strukturę zmiennej płeć wśród badanej populacji pracowników w Centrum Kształcenia Kadr. Tabela 2. Tabela grupy pracowników według płci płeć f % mężczyźni 26 39,4 kobiety 40 60,6 razem 66 100,0 Jeżeli zmienna jest porządkową i ma więcej niż dwa stopnie, można dodać kolumnę liczebności skumulowanych F (lub F%). Skumulowana liczebność jest sumą jednostek (lub %) do pewnej kategorii. Dla każdej kategorii należy zsumować wszystkie liczebności (zarówno jej, jak i niższych kategorii). Ma to jednak sens jedynie wtedy, gdy jest to niezbędne. Tabela 3. Tabela populacji uczniów według ocen z języka polskiego ocena liczebność procent liczebności skumulowany procent liczebności 2 5 5,8 5,8 3 12 14,0 19,8 4 32 37,2 57,0 5 31 36,0 93,0 6 6 7,0 100,0 razem 86 100,0 Wyniki w statystyce na ogół zaokrągla się do dwóch miejsc po przecinku. Istnieje jednak pewien wyjątek: procenty w tabelach

Opracowanie danych w PSPP 29 zaokrągla się do jednego miejsca po przecinku. Nie dotyczy to procentów, z których oblicza się kolejne wyniki. Tam znowu obowiązuje prawo dwóch miejsc po przecinku. W taki sposób przebiega porządkowanie danych dla wszystkich nominalnych i porządkowych zmiennych w badaniu. Te tabele pokazują stan w badanej populacji. Tabele zawierające dwie zmienne Często oprócz stanu po pojedynczych zmiennych bada się także związki między zmiennymi. Do takich celów należy sporządzić tabele, które zawierają więcej zmiennych. Są to tabele krzyżowe (korelacyjne). Najczęściej taka tabela zawiera dwie zmienne, ponieważ tabela z trzema zmiennymi jest już bardzo skomplikowaną i trudną do odczytania (nawet dla specjalistów). Poniżej zaprezentowano przykład tabeli dwóch zmiennych: wiek i poglądy dotyczące badanego zjawiska. Tabela 4. Tabela korelacyjna populacji studentów według wieku i poglądów zgadzam się niezdecydowany nie zgadzam razem się młodszy 24 18 37 79 starszy 24 12 14 50 razem 48 30 51 129 Z tej tabeli trudno zrozumieć, jaki jest związek zmiennych. Należy wyliczyć jeszcze procenty we wszystkich komórkach tabeli. Procenty można obliczyć trzema sposobami, otrzymując w ten sposób trzy odmienne tabele. Zostały one umieszczone na kolejnych stronach. W pierwszej z tabel procenty zostały obliczone według wieku, w drugiej według odpowiedzi dotyczących poglądów, w tabeli trzeciej z liczebności całej grupy (N=129).

30 Boris Kožuh Tabela 5. Procenty według kategorii zmiennej niezależnej młodszy 24 30,4% starszy 24 48,0% razem 48 37,2% zgadzam się niezdecydowany nie zgadzam się 18 22,8% 12 24,0% 30 23,3% 37 46,8% 14 28,0% 51 39,5% razem 79 100,0% 50 100,0% 129 100,0% W tej tabeli w wierszach obliczano procenty z sumy na końcu wiersza. W pierwszym wierszu liczebność 24 przedstawia 30,4% od sumy 79 (na prawym krańcu wiersza). Wszystkie procenty w tym wierszu dają razem 100,0% (30,4% + 22,8% + 46,8% = 100,0%). Tak samo oblicza się procenty we wszystkich wierszach. Tabela 6. Procenty według kategorii zmiennej zależnej zgadzam się niezdecydowany nie zgadzam się razem młodszy 24 50,0% 18 60,0% 37 72,5% 79 61,2% starszy 24 50,0% 12 40,0% 14 27,5% 50 38,8% razem 48 100,0% 30 100,0% 51 100,0% 129 100,0% W tej tabeli w kolumnach obliczano procenty z sumy na dnie kolumny. W pierwszej kolumnie liczebność 24 przedstawia 50,0% od sumy 48 (na dnie kolumny). Wszystkie procenty w tej kolumnie dają razem 100,0% (50,0% + 50,0% = 100,0%). Tak samo oblicza się procenty we wszystkich kolumnach.

Opracowanie danych w PSPP 31 Tabela 7. Procenty z liczebności całej populacji (N=129) młodszy 24 18,6% starszy 24 18,6% razem 48 37,2% zgadzam się niezdecydowany nie zgadzam się 18 14,0% 12 9,3% 30 23,3% 37 28,7% 14 10,8% 51 39,5% razem 79 61,2% 50 38,8% 129 100,0% W tej tabeli w komórkach obliczano procenty z liczebności całej populacji (N=129). W pierwszej komórce (górna lewa) liczebność 24 stanowi 18,6% wszystkich respondentów. Procenty we wszystkich komórkach tworzą razem 100,0% (18,6% + 14,0% + 28,7% + 18,6% + 9,3% + 10,8% = 100,0%). Procenty w kolumnie razem oraz w wierszu razem zostały też obliczone z N=129. Pierwsza tabela pokazuje, jaki wpływ na poglądy ma wiek respondentów. Z doświadczeń wiadomo, że ludzie w różnym wieku mają odmienne poglądy, o które pytano w ankiecie. Ponieważ obie zmienne są powiązane, należy określić, która z nich jest zmienną niezależną, a która zależną. Można założyć, że w tej parze wiek jest zmienną niezależną, a poglądy zależną. Dlatego akurat pierwsza tabela jest najbardziej odpowiednia. Przy badaniu zależności między zmiennymi, praktycznie zawsze należy obliczać procenty w przedstawiony sposób, to znaczy według zmiennej niezależnej. Druga tabela pokazuje, jaki wpływ mają poglądy na wiek. Jest to oczywiście bezsensowny kierunek wpływu. Dlatego też nie korzysta się z takich tabel. Trzecia tabela nie nadaje się do analizy związku między zmiennymi. Z tego powodu jest właśnie zupełnie niepotrzebna, ponieważ niepotrzebne jest włączenie niezwiązanych zmiennych do wspólnej tabeli.

32 Boris Kožuh Tabele sporządza się tak, że zmienna niezależna umieszczona jest w wierszach, a zmienna zależna w kolumnach. Wartości procentowe oblicza się w każdym wierszu odrębnie. Oto przykład takiego układu zmiennych: Tabela 8. Tabela korelacyjna populacji zaocznych studentów Zawsze Często Rzadko Nigdy Razem Dziewczęta 26 31,7% 31 37,8% 16 19,5% 9 11,0% 82 100,0% Chłopcy 19 25,0% 23 30,3% 21 27,6% 13 17,1% 76 100% Razem 45 28,5% 54 34,2% 37 23,4% 22 13,9% 158 100,0% Jeżeli zmienna zależna posiada tak wielką liczbę kategorii, że tabela jest za szeroka i nie pomaga nawet technika komputerowa (małe czcionki), należy odwrócić tę kolejność. W tym przypadku umieszcza się zmienną zależną w wierszach i zmienną niezależną w kolumnach. Ale uwaga: procenty należy i w tym przypadku obliczać według kategorii zmiennej niezależnej, (czyli 100, 0% znajduje się na dole każdej kolumny). Dodatkowo w tekście przed taką tabelą należy czytelnikowi zwrócić uwagę na tak odwrócony układ. Tabela 9. Sposób spędzania czasu wolnego Piłka nożna 6 8,5% Piłka ręczna 8 11,3% Siatkówka 14 19,7% Koszykówka 7 9,9% Dziewczęta Chłopcy Razem 32 23,4% 11 8,0% 27 19,7% 9 6,6% 38 18,3% 19 9,1% 41 19,7% 16 7,7%

Opracowanie danych w PSPP 33 Narciarstwo 6 8,5% Atletyka 6 8,5% Judo 3 4,2% Pływanie 7 9,9% Strzelectwo 5 7,0% Inny 9 12,7% Razem 71 100,0% 9 6,6% 8 5,8% 5 3,6% 12 8,6% 6 4,4% 18 13,1% 137 100,0% 15 7,2% 14 6,7% 8 3,8% 19 9,1% 11 5,3% 27 13,0% 208 100,0% Oto przykład upierania się przy regule: tabele sporządza się tak, że zmienna niezależna umieszczona jest po lewej stronie (w wierszach), a zmienna zależna u góry tabeli (w kolumnach). Tabela 10. Sposób spędzania czasu wolnego Piłka nożna Piłka ręczna Siatkówka Koszykówka Narciarstwo Atletyka Judo Pływanie Strzelectwo Inny Razem Dziewczęta 6 8 14 7 6 6 3 7 5 9 71 8,5% 11,3% 19,7% 9,9% 8,5% 8,5% 4,2% 9,9% 7,0% 12,7% 100,0% Chłopcy 32 11 27 9 9 8 5 12 6 18 137 23,4% 8,0% 19,7% 6,6% 6,6% 5,8% 3,6% 8,6% 4,4% 13,1% 100,0% Razem 38 19 41 16 15 14 8 19 11 27 208 18,3% 9,1% 19,7% 7,7% 7,2% 6,7% 3,8% 9,1% 5,3% 13,0% 100,0% Prezentacja i porządkowanie danych ilościowych Uporządkowane dane nominalne lub porządkowe nadają się już do interpretacji. Inaczej jest w przypadku danych ilościowych (przedziałowych i ilorazowych), które porządkuje się tylko w celach łatwiejszego opracowania. Korzystanie z komputera w opracowaniu danych przyniosło radykalną zmianę: porządkowanie danych ilościowych przed opracowaniem jest już zupełnie niepotrzebne. Dlatego też zagadnienie dotyczące porządkowania

34 Boris Kožuh danych ilościowych omawia się w sposób skrócony. Dane ilościowe porządkuje się na dwa sposoby. 1. Tworzy się szereg szczegółowy prosty. Wartości zmiennej porządkuje się rosnąco. Sposób ten, bez szczegółowego opisu, zostanie zilustrowany jednym przykładem. Oto odpowiedzi nauczycieli na pytanie o staż pracy: Tabela 11. Staż pracy nauczycieli x 2 4 5 6 7 9 10 11 12 14 17 21 23 24 27 R 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 2. Tworzy się szereg rozdzielczy z przedziałami klasowymi. Tego sposobu używa się w sytuacjach, gdy liczebność grupy przewyższa liczebność zwykłej klasy szkolnej. Tabela 12. Wyniki testu z języka angielskiego Przedziały klasowe Liczebność Procent liczebności Liczebność skumulowana Skumulowany procent liczebności 8-12 2 1,7 2 1,7 13-17 5 4,2 7 5,8 18-22 8 6,7 15 12,5 23-27 11 9,2 26 21,7 28-32 17 14,2 43 35,8 33-37 21 17,5 64 53,3 38-42 15 12,5 79 65,8 43-47 15 12,5 94 78,3 48-52 12 10,0 106 88,3 53-57 10 8,3 116 96,7 58-62 4 3,3 120 100,0 N=120

Opracowanie danych w PSPP 35 Do prezentacji i interpretacji danych ilościowych nadają się końcowe wyniki opracowań statystycznych (średnie arytmetyczne, wariancje, współczynniki korelacji, itd.).

36 Boris Kožuh

Opracowanie danych w PSPP 37 3 Wprowadzanie danych ROZDZIAŁ TRZECI Dane można wprowadzać za pomocą kilka programów: Excel, SPSS, PSPP, Word, itd. Do niedawna najlepszym rozwiązaniem było wprowadzanie danych za pomocą edytora Word. Jednak dane wprowadzone w programie Word wymagają złożonych operacji importowania do programów PSPP lub SPSS. Dlatego odradza się wprowadzanie danych za pomocą programu Word, pomimo że wymaga ono mniej czasu niż w pozostałych wymienionych programach. Wprowadzanie danych w programie Excel jest proste, ale wymaga więcej pracy niż w Wordzie. Przenoszenie bazy danych do programu SPSS jest nadzwyczaj proste, ale do programu PSPP na razie niemożliwe. Być może następne wersje programu PSPP będą umożliwiały import danych z Excel. Program PSPP posiada prosty podprogram do wprowadzania danych. Dane wprowadzone za pomocą programu PSPP można bez przygotowania opracowywać także w programie SPSS. Trzeba jednak podkreślić jedną zaletę programu Word. W przypadku bazy danych, która zawiera wielką liczbę zmiennych,

38 Boris Kožuh program Word oszczędza czas. Wprowadzanie za pomocą programów SPSS, PSPP lub Excel wymaga, po zapisaniu każdej wartości, użycia strzałki kursora (w prawo). Jeżeli np. badanie zawiera 200 prostych zmiennych (jednocyfrowych), przy wprowadzaniu danych dla każdego respondenta należy nacisnąć 200 razy odpowiednią cyfrę i 199 razy strzałkę kursora. W Wordzie wystarczy nacisnąć tylko 200 cyfr. Procedury wprowadzania danych za pomocą programu Word i importowania do SPSS (lub PSPP) zostały opisane w starszych podręcznikach (patrz: Kožuh 2006). Wprowadzanie danych za pomocą programu PSPP Przy uruchamianiu programu PSPP otwiera się okno Data Editor. W lewym dolnym rogu okna znajdują się dwie zakładki: Data View i Variable View. Pierwsza z nich otwiera widok na dane, a druga na listę zmiennych. W oknie z widokiem na dane uruchamia się opracowania statystyczne, a w oknie z listą zmiennych określa się i opisuje zmienne. Rysunek 13. Okno Data Editor

Opracowanie danych w PSPP 39 W otwartym oknie Data Editor jest oznaczona pierwsza komórka (w lewym górnym rogu). W programie SPSS można od razu zacząć wprowadzać dane, a w programie PSPP nie jest to możliwe, ponieważ najpierw trzeba określić zmienne. Kliknij na zakładkę Variable View. Otworzy się okno: Rysunek 14. Okno Data Editor-Variable View I w tym oknie oznaczona jest pierwsza komórka. Od razu można wpisać imię pierwszej zmiennej. Imię nie może być dłuższe od jednego słowa (nie wolno używać spacji). Oznacza to, że można wpisać imię ocenazmatematyki, ale nie można wpisać ocena z matematyki. Najlepiej nadać niektórym zmiennym ich krótkie imiona (np. płeć, wiek, staż, itd.), a zmiennym z długimi imionami tylko skróty np. z1, z2, z3 (zmienna pierwsza, zmienna druga, zmienna trzecia, itd.). Po wpisie imienia należy kliknąć na Enter lub przejść do kolejnego wiersza za pomocą myszki. Wpiszemy imię drugiej zmiennej i tak do końca listy zmiennych. Listę dziesięciu zmiennych prezentuje następny rysunek:

40 Boris Kožuh Rysunek 15. Okno Variable View z listą dziesięciu zmiennych Pierwsze cztery zmienne (płeć, wiek, klasa i wykształcenie matki) to dane osobowe respondentów z metryczki ankiety. Pozostałe zmienne to te, które bardzo często występują w badaniach edukacji: oceny z dwóch przedmiotów, wyniki dwóch testów i odpowiedzi na dwa pytania z kwestionariusza ankiety. Wiek i wyniki testów to zmienne ilościowe, natomiast pozostałe zmienne są zmiennymi jakościowymi. Jeżeli wprowadzone zostało niepoprawne imię zmiennej, należy kliknąć na odpowiednią komórkę, wpisać poprawne imię i zatwierdzić klawiszem Enter. Po wpisie całej listy zmiennych, najlepiej zapisać plik na dysk. Oczywiście, plik można zapisać też później (po wprowadzeniu wszystkich danych), ale ostrożność wymaga zapisów w trakcie pracy. W oknie Data Editor należy otworzyć menu File i wybrać pozycje Save As (zapisz jako).

Opracowanie danych w PSPP 41 Rysunek 16. Menu File i Save As Otworzy się okno Save As: Rysunek 17. Okno Save As

42 Boris Kožuh Do rybryki Name należy wprowadzić imię pliku (np. praca magisterska) i wybrać miejsce na dysku, w którym plik ma zostać zapisany. Wszystkie pozostałe ustawienia są automatyczne. Na końcu należy jeszcze kliknąć na Save. Rysunek 18. Okno Save As Teraz jest wszystko przygotowane i można wprowadzać dane. Należy kliknąć na zakładkę Data View. Otworzy się kolejne okno (rysunek 19 na następnej stronie). W pierwszym wierszu znajdują się imiona wszystkich zmiennych, a pod nimi puste wiersze. Kliknij w komórce na początku pierwszego pustego wiersza i wpisuj dane pierwszego respondenta, przesuwając się po każdej wpisanej liczbie w prawo za pomocą strzałki kursora. Na rysunku 20 (na następnej stronie) pokazane są dane pierwszego respondenta.

Opracowanie danych w PSPP 43 Rysunek 19. Okno Data View przed wpisem pierwszej wartości Rysunek 20. Okno Data View po wpisie danych pierwszego respondenta

44 Boris Kožuh Po wpisie wszystkich danych pierwszego respondenta (pełny pierwszy wiersz) naciśnij klawisz Tab. Oznaczona zostanie pierwsza komórka drugiego wiersza i w taki sam sposób wprowadź dane drugiego respondenta, trzeciego, czwartego, itd. do końca. Baza danych wówczas wygląda tak, jak na rysunku 21. Rysunek 21. Okno Data View po wpisie danych dziesięciu respondenów W wierszach znajdują się respondenci, a w kolumnach zmienne. Błędy powstałe przy wprowadzaniu danych są łatwo naprawialne. Tabela nr 13 zawiera instrukcje jak naprawić najczęstsze błędy.

Opracowanie danych w PSPP 45 Tabela 13. Poprawianie błędów Co zrobić? Poprawić niewłaściwą wartość Usunąć cały wiersz (wszystkie dane jednego respondenta) Dodać nowego respondenta Dodać nową zmienną Jak to zrobić? Kliknij na komórkę z niewłaściwą wartością. Wpisz poprawną wartość. Zatwierdź za pomocą klawisza Enter. Kliknij prawym przyciskiem myszki na numer respondenta otworzy się menu dwóch funkcji (Insert Cases i Clear Cases). Kliknij na Clear Cases. Kliknij prawym przyciskiem myszki na numer respondenta, przed którym chcesz dodać nowego otworzy się menu dwóch funkcji (Insert Cases i Clear Cases). Kliknij na Insert Cases. Otworzy się nowy pusty wiersz. Kliknij myszką w pierwszej komórce tego wiersza i wpisz stopniowo wszystkie dane nowego respondenta. Zatwierdź za pomocą klawisza Enter. Kliknij prawym przyciskiem myszki na imię tej zmiennej, przed którą chcesz dodać nową zmienną otworzy się menu czterech funkcji. Kliknij na Insert Variable. Otworzy się nowa pusta kolumna. Kliknij myszką w pierwszej komórce tej kolumny i wpisz stopniowo dane wszystkich respondentów. Zatwierdź za pomocą klawisza Enter. Nowych respondentów najlepiej dodawać na końcu bazy danych (za ostatnim wprowadzonym respondentem). W badaniach edukacji kolejność respondentów jest bez znaczenia i dlatego nic się nie osiąga dodawaniem respondentów pomiędzy już wprowadzonych. To samo dotyczy też kolejności zmiennych te również najlepiej dodawać na końcu listy zmiennych. Teraz można już zapisać plik, jednak lepiej przed tym jeszcze załatwić kilka drobnych spraw. Na rysunku 21 widać, że wszystkie

46 Boris Kožuh dane są zapisane z dokładnością do dwóch miejsc po przecinku. W przypadku zmiennej płeć zamiast K i M wprowadzono liczby 1 i 2. W bazie danych jest to zapisane jako 1,00 i 2,00. Nie ma to żadnego znaczenia przy opracowywaniu danych, ale źle to wygląda. Aby zlikwidować miejsca za przecinkiem, należy kliknąć na kolumnę Decimals i zmienić wartość 2 na zero. Taką zmianę prezentuje rysunek 22. Rysunek 22. Okno Variable View - rubryka Decimals W podobny sposób można zmienić też szerokość zapisu (rubryka Width). Szerokość 8 jest za duża i można ją zmniejszyć. Należy kliknąć na kolumnę Width i wprowadzić zamiast 8, mniejszą liczbę. W większości przypadków wystarczy szerokość 1. Dla zmiennych takich jak wiek, staż pracy, wyniki testowe, itd. zwykle wystarczy szerokość dwa, a bardzo rzadko więcej niż dwa. Na końcu wprowadzania danych należy ponownie zapisać plik. Otwórz menu File i kliknij na Save.

Opracowanie danych w PSPP 47 4 Opis zmiennych ROZDZIAŁ CZWARTY Powstała baza danych zawiera tylko krótkie imiona lub nawet skróty imion. Podobnie jest też z kategoriami zmiennych, gdzie określenia opisowe zastępowane są liczbami. W przypadku płci, zamiast kategorii kobieta i mężczyzna, w bazie danych istnieją tylko liczby 1 i 2. Dotyczy to wszystkich zmiennych. Teraz można to poprawić i dopełnić, czyli dodatkowo opisać zmienne. W niektórych przypadkach dodatkowe określanie zmiennych jest tylko korzystne, a w innych przypadkach natomiast koniecznie. Dla zmiennych charakterystycznych w badaniach edukacji najbardziej przydatne są trzy opcje: Label, Values i Missing (imiona zmiennych, słowne opisy kategorii i brakujące dane). Pełne imiona zmiennych Opcja Label służy do nadawania zmiennym dłuższych imion. Pełne imiona są szczególnie ważne w momencie, gdy wyniki przenosi się do programu Word w celu interpretacji. Raz nadane pełne imię zapisuje się wszędzie, gdzie pojawi się ta zmienna. Jako

48 Boris Kožuh przykład może posłużyć zmienna, którą wprowadzono na początku pod imieniem np. ocenachemia. W każdej tabeli z wynikami tej zmiennej będzie zapisane imię ocenachemia. Po przeniesieniu tabeli do tekstu w programie Word, należy w każdej tabeli usunąć imię ocenachemia i napisać pełne imię zmiennej np. końcowa ocena z chemii w pierwszej klasie liceum. Jeszcze gorsza sytuacja jest w przypadku zmiennych oznaczonych na początku skrótami (np. z1, z2, z3, itd.). Dla doświadczonego użytkownika programu Word, być może nie przedstawia to większego problemu, ale i tak wymaga więcej pracy niż w przypadku, gdy korzysta się z opcji Label nadając pełne imię zmiennej (raz na zawsze). Opcję Label uruchamia się w oknie z listą zmiennych: Rysunek 23. Okno Data Editor- Variable View Kliknij w okienku na skrzyżowaniu kolumny Label i wiersza tej zmiennej, której chcesz nadać pełne imię. Od razu można wpisać pełne imię zmiennej. Następnie należy zatwierdzić imię za pomocą

Opracowanie danych w PSPP 49 klawisza Enter, kliknąć w kolejnym okienku, wprowadzić imię dalszej zmiennej itd. Oto przykład: Rysunek 24. Okno z imionami zmiennych Imię nie powinno przekraczać 256 znaków. Można używać też polskich znaków ą, ę, ł, ś, ó, itd. Te znaki, dopóki pracuje się w PSPP, nie będą zapisywane poprawnie, ale po przeniesieniu tabel i wyników do tekstu w programie Word, zostaną zapisane poprawnie. Jeżeli imię jest długie i nie mieści się w komórce, to wyświetla się tylko część imienia. Można sprawdzić, czy imię jest pełne i poprawnie zapisane. Należy myszką chwycić prawą krawędź kolumny (w wierszu z imionami zmiennych) i kolumnę rozszerzyć (i później ponownie zwęzić). W komórce będzie widać tylko kilka pierwszych liter imienia, jednak pełne imię już zostało wprowadzone.

50 Boris Kožuh Rysunek 25. Okno Data Editor - Label Pełne imiona kategorii Przy pomocy funkcji Values można nadać imiona poszczególnym kategoriom zmiennej. W bazie danych wszystkie wartości są zapisane w postaci liczb. W przypadku zmiennych ilościowych zapis ten odpowiada rzeczywistości. Np. na pytanie ile godzin student się uczył, poprawną odpowiedzią jest faktycznie 7 lub 25 lub inna liczba. W przypadku zmiennych jakościowych np. w pytaniu o płeć uczniów, liczby tylko zastępują prawdziwe odpowiedzi. W tabelach oczywiście muszą znajdować się prawdziwe kategorie, a nie zastępcze liczby. W pytaniu o płeć uczniów są to kategorie kobieta i mężczyzna a nie 1 i 2. W pytaniach ankietowych mają być umieszczone słowne odpowiedzi zamiast 1, 2, 3, 4, itd. Kategoriom można nadać imiona używając funkcji Values (wartości). Kliknij w komórce na skrzyżowaniu kolumny Values i

Opracowanie danych w PSPP 51 wiersza wybranej zmiennej (której chcesz nadać imiona kategorii). W prawym rogu komórki pojawi się szary guzik. Rysunek 26. Okno Data Editor - Values Kliknij na ten guzik i otworzy się okno Value Labels: Rysunek 27. Okno Value Labels

52 Boris Kožuh W polu Value kliknij i wpisz pierwszą z wartości liczbowych (np. 1), a w Value Label pełne imię tej kategorii (np. kobieta). Następnie kliknij na przycisk Add (dodaj). Tym przyciskiem wpis się potwierdza i przenosi do listy nowych imion. Ponownie kliknij w polu Value i wpisz drugą z wartości liczbowych (np. 2), a w Value Label imię drugiej kategorii (np. mężczyzna). Rysunek 28. Okno Value Labels Następnie ponownie kliknij na przycisk Add. Po wprowadzeniu wszystkich wpisów kliknij na OK. Oto przykład okna przed kliknięciem OK:

Opracowanie danych w PSPP 53 Rysunek 29. Okno Value Labels Błędne wpisy można poprawić w każdej chwili. Na liście zmian końcowych kliknij na błędnym wpisie, a następnie w górnych rubrykach popraw wpis i potwierdź poprawkę przyciskiem Apply. Wpis można też usunąć w następujący sposób: kliknąć na błędnym wpisie, a następnie na przycisk Remove (usuń). Braki danych Przy wprowadzaniu danych może nastąpić sytuacja, że respondent nie odpowiedział na pytanie ankietowe. Wówczas komórkę zostawia się pustą (bez wpisu). Program PSPP automatycznie traktuje puste komórki jako brakujące dane. Przy wprowadzaniu danych w programie Word na miejsce brakujących danych zapisuje się zero. Wtedy pojawia się problem podwójnego znaczenia liczby zero. Nie ma już potrzeby korzystania z programu Word do wprowadzania danych i dlatego sytuacja ta została opisana tylko krótko:

54 Boris Kožuh Na niektóre pytania zero stanowi prawdziwą (poprawną) odpowiedź! Na pytanie o płe, zero oznacza brak odpowiedzi, ale na pytanie, ile książek uczeń przeczytał, zero jest ważną odpowiedzią (prawdziwą, poprawną). W niektórych przypadkach badacz chce mieć w tabelach brakujące odpowiedzi w odrębnej kolumnie. W innych przypadkach te odpowiedzi należycałkowicie usunąć zarówno z opracowania, jak i z tabeli. Właśnie do tego służy funkcja Missing. Wszystko, co należy zrobi, to określić, dla których zmiennych zero jest brakiem odpowiedzi. W trakcie opracowywania danych wprowadzonych w programie PSPP może też wystąpić potrzeba określenia brakujących danych. Dla każdej zmiennej należy odrębnie określić, jak są oznaczone brakujące dane. Dla niektórych zmiennych jest to pusta komórka, dla drugich inny znak, dla innych wcale nie jest potrzebna ta funkcja. Niekiedy istnieje potrzeba odróżnienia braku odpowiedzi od niepoprawnych odpowiedzi. Niepoprawna odpowiedź to przypadek, w którym respondent udzielił odpowiedzi, ale nie ma możliwości jej jednoznacznego określenia (np. jeżeli zakreślił kilka odpowiedzi na pytanie, gdzie wymagana jest tylko jedna odpowiedź lub jeżeli odpowiedzi są zakreślone, następnie przekreślone i w końcu nie wiadomo, której odpowiedzi respondent udzielił itd.). W tych przypadkach dla brakujących odpowiedzi zostawia się pustą komórkę, a dla niepoprawnych jakiś inny znak. Wybiera się oczywiście znak, który nie pojawia się wśród odpowiedzi. Zwykle jest to liczba 9, ponieważ wyjątkowo rzadko spotyka się pytania ankietowe z dziewięcioma kategoriami. Wówczas puste komórki będą automatycznie traktowane jako brakujące dane, a wartość 9 należy określić jako brakującą za pomocą funkcji Missing. W tabelach otrzymuje się informacje o tym, ile jest jednych, a ile drugich odpowiedzi (oczywiście obok wszystkich kategorii ważnych odpowiedzi). Należy jeszcze raz nadmienić, iż program PSPP automatycznie traktuje puste komórki jako brak danych. Dlatego też dla zmiennych

Opracowanie danych w PSPP 55 z pustymi komórkami użytkownik nie musi w ogóle korzystać z funkcji Missing (wszystko odbędzie się automatycznie). Aby określić brak danych należy kliknąć w komórce na skrzyżowaniu kolumny Missing i wiersza tej zmiennej, której określa się brakujące dane. W komórce pojawi się szary guzik. Rysunek 30. Okno Data Editor Variable View Po kliknięciu na szary guzik otworzy się okno Missing Values:

56 Boris Kožuh Rysunek 31. Okno Missing Values Jeżeli brakujące dane były wprowadzane jako jeden lub kilka ściśle określonych znaków, należy wybrać rubrykę Discrete missing values i w puste pole wpisać znak (jeżeli znaków jest kilka, to w każdym polu umieszcza się jeden znak). Zwykle jest to tylko 9, a pozostałe pola zostają puste. Jest to wystarczające prawie we wszystkich przypadkach. Oto przykład: Rysunek 32. Okno Missing Values

Opracowanie danych w PSPP 57 Jeżeli brakujące dane określa się jako wartości»od...do«, wtedy wybiera się rubrykę Range plus one optional discrete missing value. W pole Low wpisuje się dolną granicę, a w pole High wpisuje się górną granicę. Jeżeli jako brakujące dane określa się wszystkie wartości pomiędzy trzy i siedem, do pierwszej rubryki wpisuje się liczbę 3 i do dolnej liczbę 7 (rysunek 33). Rysunek 33. Okno Missing Values Jeżeli oprócz przedziału od trzy do siedem brakującą wartością ma być też dziewięć, wówczas w trzecią rubrykę wpisuje się dodatkowo liczbę 9 (rysunek 34).

58 Boris Kožuh Rysunek 34. Okno Missing Values Po wprowadzeniu wszystkich wartości należy kliknąć OK. Opisane sposoby dodatkowego uporządkowania i określania danych w pełni wystarczą w badaniach pedagogicznych. Nie jest to jednak wszystko, co umożliwia program PSPP. Jego możliwości są dużo większe, dlatego też książka, która opisywałaby wszystko, co można zrobić przy pomocy programu PSPP byłaby kilkanaście razy bardziej obszerna. Niech się Czytelnik nie boi opisane sposoby naprawdę wystarczą pedagogowi, a tylko w incydentalnych przypadkach, będzie potrzebny lepszy podręcznik.