raportowanie Przemysław Budzewski spss polska tabela dla pytań wielokrotnego wyboru co to są pytania wielokrotnego wyboru? W tym artykule zajmę się sposobami prezentacji szczególnej kategorii pytań pytaniami wielokrotnego wyboru. Pytania te stosuje się wtedy, gdy respondent może udzielić więcej niż jednej prawdziwej odpowiedzi na pytanie, a co więcej, odpowiedzi te interesują mnie z punktu widzenia celu badania. Mógłbym np. zapytać respondentów o sposób spędzania wolnego czasu. Formułując pytanie w następujący sposób: W jaki sposób najczęściej spędza Pan(i) czas wolny od pracy? oczekuję, że każdy z respondentów wskaże tylko jedną odpowiedź. Jednakże, zadając pytanie nieco inaczej sformułowane: W jaki sposób spędza Pan(i) czas wolny od pracy?, daję respondentom możliwość wskazania więcej niż jednej odpowiedzi. I tak jeden z respondentów może odpowiedzieć: 1. czytam książki, 2. oglądam telewizję, 3. chodzę na spacery a inny: 1. czytam książki, 6. po prostu leżę ;-) W instrukcji do pytania w kwestionariuszu ankiety mogę również zawęzić liczbę możliwych odpowiedzi, prosząc respondentów o podanie najwyżej 3 odpowiedzi, ale mogę tego również nie robić, prosząc ich wręcz o podanie wszystkich prawdziwych odpowiedzi. Prosząc respondentów o wskazanie np. wszystkich znanych im chociażby ze słyszenia osób publicznych narodowości niemieckiej, mogę otrzymać dziesiątki nazwisk, w tym również niepoprawne, jak np. Adolf Hitler czy też Reinhold Messner. Stąd też istotne jest aby na etapie projektowania badania i kwestionariusza rozważyć, jaki sposób zadawania tego typu pytań jest celowy z punktu widzenia celu analizy. jak kodować pytania wielokrotnego wyboru? Pytania wielokrotnego wyboru kodowane są w edytorze danych w postaci zestawu zmiennych: albo w postaci tzw. wielokrotnych kategorii (mc), albo w postaci wielokrotnych dychotomii (md). 1 Techniczne aspekty kodowania i zmiany sposobu kodowania pytań wielokrotnego wyboru w pasw Statistics ujmuje materiał zamieszczony w numerze 6. biuletynu ekspress pt. Zamiana pytań kodowanych jako mc na md Ogólnie rzecz biorąc 1 różnica polega na liczbie zmiennych oraz unikatowych kodów numerycznych potrzebnych do zakodowania odpowiedzi. W przypadku kodowania md zmiennych jest tyle ile wszystkich kategorii odpowiedzi (możliwych odpowiedzi w kafeterii) i są one kodowane zero jedynkowo (1 respondent wskazał kategorię, 0 respondent nie wskazał kategorii). W przypadku kodowania mc zmiennych jest tyle, ile wynosi liczba odpowiedzi udzielonych przez respondenta, który zaznaczył maksymalną liczbę odpowiedzi, a każda kategoria odpowiedzi oznaczana jest unikatowym kodem. De facto, stwierdzenie, iż te dwa sposoby kodowania różnią się liczbą zmiennych koniecznych do pełnego opisania odpowiedzi jest nie do końca zgodne z prawdą. Może się zdarzyć, że znajdzie się osoba, która wskaże wszystkie odpowiedzi. Anegdota głosi, że w pewnych badaniach na temat zachowań ryzykownych, w pytaniu o stosowane metody antykoncepcji respondent wskazał wszystkie możliwe odpowiedzi, i dodał jeszcze do tego wstrzemięźliwość (sic!). Warto może zatem wspomnieć o jeszcze jednej sytuacji, to znaczy o sytuacji, w której zbiór odpowiedzi jest otwarty gramatycznie pozostawiam dodatkowo opcję Inne (jakie?) i daję respondentowi możliwość swobodnej odpowiedzi jeśli lista pozycji na kafeterii nie jest wyczerpująca. Takie podejście wynika zazwyczaj z dwóch względów: (a) lista możliwych odpowiedzi jest długa i zbyt szczegółowa aby wprowadzać ją do narzędzia w całości lub też (b) badacz ma świadomość, iż jego wiedza o zjawisku nie jest pełna a kafeteria, potencjalnie, nie wyczerpuje tematu, w związku z tym uwzględnia możliwość pojawienia
się istotnych kategorii spoza kafeterii. Jeśli rzeczywiście odpowiedzi pojawiające się w tej kategorii są analitycznie istotne, należy przeprowadzić analizę treści tych odpowiedzi zanim dokonamy kodowania zmiennej na potrzeby ostatecznej analizy. Można wtedy połączyć niektóre bliskoznaczne kategorie odpowiedzi z już obecnymi na kafeterii, lub też utworzyć dodatkowe kategorie. W dalszej części artykułu zajmę się przede wszystkim sposobem prezentacji pytań wielokrotnego wyboru w tabelach, mając świadomość, że ten krótki, wstępny opis nie wystarcza aby zaprezentować wszystkie aspekty związane z wykorzystaniem pytań wielokrotnego wyboru w badaniach ankietowych. p r z y k ł a d tabela częstości dla pytania o korzystanie z produktów bankowych W marketingu produktów, ale nie tylko, ważne jest by mieć możliwość oceny np. zasięgu produktu na rynku/wśród klientów. Rzadko jednak zdarza się, że klient=produkt. Aby zatem poprawnie ocenić siłę przyciągania (popularność) produktu na rynku powinienem mieć możliwość odpowiedzenia na przynajmniej dwa pytania: jak wielu klientów korzysta z danego produkt? oraz, jaki odsetek wszystkich produktów wykorzystywanych przez klientów stanowi ten produkt? Możecie spytać po co mi wiedza o tym drugim (o odsetku wskazań liczonym w stosunku do wszystkich odpowiedzi, a nie w stosunku do respondentów)? Np. ze względu na to, że chciałbym uwzględnić konkurencję pomiędzy produktami. Nie jest to oczywiście odpowiedź uniwersalna. W przypadku różnych badań interpretacja procentu odpowiedzi może wskazywać na nieco inne zależności. Niemniej, spróbuję zobrazować tę zależność dodatkowo takim oto przykładem. W badaniach na temat zachowań Polaków związanych ze spędzaniem wolnego czasu, realizowanych dla dużej sieci oferującej usługi turystyczne w krajach północnej Afryki, zadaję pytanie o kraje (regiony), które respondenci odwiedzili w ciągu ostatnich 3 lat podczas urlopu. Okazuje się, że najpopularniejszymi odpowiedziami są Egipt (40% respondentów), Tunezja (38%) i Krym (12%). Czy na podstawie tych informacji mogę, pomijając oczywiście dodatkowe czynniki, prognozować podobną popularność każdego z tych miejsc w kolejnych sezonach? Wątpliwe, powinienem spodziewać się raczej, iż znaczna część osób wskazujących Egipt była również w Tunezji (podobna jakość, cena i bogactwo oferty biur turystycznych, podobne upodobania co do spędzania urlopu, typu atrakcji, itp.), i że osoby te raczej nie były zainteresowane ofertą 34 godzinnej podróży koleją z Lwowa do Simferopola w celu zobaczenia na własne oczy największego popiersia Lenina na Ukrainie. Zatem, moim kontrahentom zaprezentuję obok procentu respondentów, również zazwyczaj niższy procent odpowiedzi, który w sposób niedoskonały, niemniej na początek wystarczająco dobry, pokaże im wielkości transferu turystów, którego mogą spodziewać się w najbliższej przyszłości. (Zaznaczam, że to pierwszy, a nie ostatni krok w analizie.) Powrócę teraz do przykładu, mając nadzieję, że powrót z ciepłych krajów do prozy produktów bankowych nie będzie zbyt bolesny. Poniżej zamieściłem wizualizację odpowiedzi na pytanie o korzystanie z produktów/usług bankowych. Nieco archaiczne, jak na dzisiejsze czasy, kategorie odpowiedzi wynikają z faktu, iż badania były realizowane w pierwszej połowie lat 90. 2
Tabela 1. Korzystanie z produktów Resp % Resp Odp % Odp Książeczka oszczędnościowa 127 57% 127 18% Kredyty na zakupy 82 37% 82 12% Regularne opłaty 70 32% 70 10% Wymiana walut 61 27% 61 9% Rachunek czekowy/ oszczędnościowo rozliczeniowy 50 23% 50 7% Rachunek terminowy 45 20% 45 6% Rachunek walutowy 44 20% 44 6% Przekazy krajowe 41 18% 41 6% Informacja 40 18% 40 6% Sprzedaż/skup bonów 21 9% 21 3% Inne 20 9% 20 3% Kredyty na działalność gospodarczą 17 8% 17 2% Czeki złotowe 16 7% 16 2% Przekazy z zagranicy 13 6% 13 2% Usługi maklerskie 12 5% 12 2% Przekazy za granicę 10 5% 10 1% Rachunek przedsiębiorstwa 10 5% 10 1% Czeki dewizowe 7 3% 7 1% Przyjmowanie utargów 4 2% 4 1% Karty kredytowe 4 2% 4 1% Kredyt (ogólnie) 0 0% 0 0% Kredyt mieszkaniowy 0 0% 0 0% Ogółem 222 100% 694 100% W zaprezentowanej tabeli % Resp oznacza procent respondentów, którzy korzystają z danego produktu, natomiast % Odp oznacza procent, jaki w stosunku do wszystkich odpowiedzi wszystkich respondentów stanowią wskazania na konkretny produkt. Statystyka % Resp nie sumuje się, co oczywiste, do 100% respondent mógł udzielić więcej niż jednej odpowiedzi. Bazę procentowania dla % Resp odczytać można z wiersza Ogółem i kolumny Resp (222 respondentów), natomiast dla % Odp z tego samego wiersza i kolumny Odp (694 odpowiedzi). Wartości w kolumnach Resp i Odp są takie same, ponieważ każdy respondent mógł wskazać jeden produkt tylko raz. Wiersze tabeli posortowane są względem liczebności ( Resp ) w porządku malejącym. krok po kroku Aby utworzyć taką tabelę, muszę w pierwszej kolejności wskazać zmienne wchodzące w skład zestawu wielokrotnych odpowiedzi. Do definiowania zestawu służy okno analiza tabele specjalne zestawy odpowiedzi lub polecenie mrset. 3
Z listy po lewej stronie wybieram zmienne wchodzące w skład zestawu i przerzucam je przy pomocy strzałki na listę w centralnej części okna. W przykładzie korzystam ze zmiennych v45_1 do v45_16. Ponieważ zmienne, których używam, kodowane są na zasadzie mc (wielokrotne kategorie), poniżej listy zmiennych zaznaczam opcję Kategorie. W polu tekstowym Nazwa zestawu wpisuję nazwę nowego zestawu wielokrotnych odpowiedzi, natomiast w polu Etykieta zestawu wprowadzam dłuższy opis, który wykorzystam jako tytuł/nagłówek tabeli. W ostatnim kroku, przy pomocy przycisku dodaj wprowadzam zestaw na listę Zestawy wielokrotnych odpowiedzi. Wychodzę z okna przy pomocy przycisku ok, przez co zestaw zostaje utworzony a w oknie edytora raportów pojawia się obiekt tabelaryczny podsumowujący dotychczasowe działania. Skoro zestaw został zdefiniowany, mogę przejść do budowy tabeli w oknie analiza tabele specjalne tabele użytkownika. Zestaw wielokrotnych odpowiedzi na liście zmiennych widoczny jest jako standardowa zmienna opisuje go nazwa i etykieta. Jedynym elementem wyróżniającym go na tej liście jest ikona kwadrat z czterema polami wewnątrz, symbolizującymi wiele kategorii. Lista Kategorie prezentuje wszystkie opisane etykietami produkty/usługi zaprezentowane respondentom do wyboru. 4
Wybieram zestaw z listy i wrzucam go w obszar wierszy w obszarze roboczym. Następnie wchodzę do okna statystyki podsumowujące i wybieram odpowiednie miary. Lista statystyk dla zestawu wielokrotnych odpowiedzi różni się nieco od listy dla standardowych zmiennych jakościowych. Dodatkowymi miarami są w tym przypadku: Odpowiedzi liczebność odpowiedzi, oraz szereg miar procentowych, wykorzystujących odpowiedzi jako bazę procentowania (np. % z odpowiedzi w kolumnie). W tym przykładzie skorzystam z dwóch miar standardowych: Liczebności oraz % z N w kolumnie, które nazywam odpowiednio Resp i % Resp aby zaznaczyć, iż dotyczą one respondentów. Ponadto skorzystam również z Odpowiedzi i % z odpowiedzi w kolumnie, które nazywam Odp i % Odp. Zmieniam też liczbę miejsc dziesiętnych prezentowanych dla miar procentowych. Klikam Zastosuj do wybranej i wracam do głównego okna kreatora. Teraz wchodzę w kategorie i podsumowania, aby ustalić porządek wyświetlania kategorii w boczku tabeli oraz wyświetlić podsumowania Ogółem. 5
Porządek sortowania wyznaczać będzie Liczebność ustalam porządek na malejący. Zaznaczam też checkbox Podsumowania ogółem i akceptuję zmiany przyciskiem zastosuj. W ostatnim kroku eliminuję prezentowanie etykiety zestawu w boczku tabeli natomiast wprowadzam ją na karcie Tytuły w polu Tytuł (np. poprzez klikniecie przycisku BY reguła w prawym górnym rogu okna). Mogę też dodać numer tabeli wprowadzając go żywym tekstem. Więcej na temat konstruowania tabel w pasw Statistics można dowiedzieć się na kursie an2 spss polsk a ul. Racławicka 58 30 017 Kraków tel./faks 012.636.96.80 e mail: info@spss.pl www.spss.pl www.analizadanych.pl www.webmining.pl Struktura tabeli prezentuje się w następujący sposób. Wystarczy teraz tylko kliknąć ok.