OPRACOWANIE WYNIKÓW BADAŃ ANKIETOWYCH W PROGRAMIE STATISTICA

Podobne dokumenty
Analiza danych ankietowych. Wykład 1. Projekt badawczy. Rodzaje danych ankietowych. Jerzy Legut

Analiza danych ankietowych. Wykład 1. Projekt badawczy. Rodzaje danych ankietowych. Jerzy Legut

OD KWESTIONARIUSZA DO RAPORTU SYSTEM ZBIERANIA DANYCH I NARZĘDZIA ANALITYCZNE W BADANIACH ANKIETOWYCH

MONITOROWANIE DZIAŁAŃ NIEPOŻĄDANYCH

Sposoby prezentacji problemów w statystyce

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

SIGMA KWADRAT. Wykorzystanie programu MS Excel do opracowań statystycznych CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Wykorzystanie programu MS Excel do opracowań statystycznych

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Jak korzystać z arkusza kalkulacyjnego?

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

You created this PDF from an application that is not licensed to print to novapdf printer (

RAPORT Z BADANIA ANKIETOWEGO NA TEMAT WPŁYWU CENY CZEKOLADY NA JEJ ZAKUP. Katarzyna Szady. Sylwia Tłuczkiewicz. Marta Sławińska.

Raport z badania ankietowego dot. Stopnia zadowolenia klienta z poziomu usług świadczonych przez Powiatowy Urząd Pracy w Rykach.

Wprowadzenie do analizy dyskryminacyjnej

RAPORT Z BADANIA SATYSFAKCJI KLIENTÓW KORZYSTAJĄCYCH Z USŁUG ŚWIADCZONYCH PRZEZ URZĄD MIASTA RZESZOWA

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

Badanie opinii Omniwatch. Oferta badawcza

Wykład 3: Prezentacja danych statystycznych

Statystyki opisowe i szeregi rozdzielcze

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Raport z badania Ankietowego. Wizerunek Urzędu Miasta Nowy Targ i oczekiwania jego klientów - w ramach procedury systemu zarządzania, jakością PZ-1.5.

Zadanie 9: Oferta edukacyjna na nowej specjalności Pomiary technologiczne i biomedyczne na kierunku Elektrotechnika, WEAIiE

Wykład 4: Statystyki opisowe (część 1)

Badanie pilotażowe satysfakcji Interesanta z jakości usług świadczonych przez Urząd Miasta Torunia

JAK EFEKTYWNIE I POPRAWNIE WYKONAĆ ANALIZĘ I RAPORT Z BADAŃ BIEGŁOŚCI I WALIDACJI PRAKTYCZNE WSKAZÓWKI

Badanie zależności skala nominalna

Wśród ankietowanych aż 73,5% stanowiły kobiety. Świadczyć to może o większym zainteresowaniu niezależną modą i dizajnem wśród kobiet.

ZARZĄDZANIE DANYMI W STATISTICA

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

Kryteria wyboru operatorów usług telefonicznych przez abonentów w Polsce

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka

Wprowadzenie do analizy korelacji i regresji

Moduł ankiet. Kompleksowe rozwiązanie marketingowe

Testy nieparametryczne

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Raport nt. ogólnej oceny Uczelni dokonywanej przez studentów składających pracę dyplomową w roku 2013

Wykład 5: Statystyki opisowe (część 2)

Charakterystyka respondentów

Raport z badania satysfakcji klientów z jakości usług świadczonych przez Urząd Miasta Chełm. za okres 01 lipca 2013 r. 31 grudnia 2013 r.

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

TP1 - TABELE PRZESTAWNE od A do Z

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

WPROWADZENIE. Strona 1/14

Wynagrodzenia w sektorze publicznym w 2011 roku

Raport z badania ankietowego dot. Stopnia zadowolenia Klienta z poziomu usług świadczonych przez Powiatowy Urząd Pracy w Rykach.

Emerytury nowosystemowe wypłacone w grudniu 2018 r. w wysokości niższej niż wysokość najniższej emerytury (tj. niższej niż 1029,80 zł)

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

Raport z badania Ankietowego. Wizerunek Urzędu Miasta Nowy Targ i oczekiwania jego klientów - w ramach procedury systemu zarządzania, jakością PZ-1.5.

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Raport z badania Ankietowego. Wizerunek Urzędu Miasta Nowy Targ i oczekiwania jego klientów - w ramach procedury systemu zarządzania, jakością PZ-1.5.

Badanie opinii Warsaw Watch. Oferta badawcza

Raport z badań preferencji licealistów

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Ćwiczenie 2 arkusze kalkulacyjne użycie funkcji logicznych

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Sprawozdanie z ankiety Uczelni Wydziału Biotechnologii i Hodowli Zwierząt ZUT w Szczecinie w roku akademickim 2016/2017

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

W1. Wprowadzenie. Statystyka opisowa

Raport nt. ogólnej oceny Uczelni dokonywanej przez studentów składających pracę dyplomową w roku 2014

WYNIKI ANKIETY Serwis internetowy Biblioteki PWSZ w Nysie

ECDL/ICDL Zaawansowane arkusze kalkulacyjne Moduł A2 Sylabus, wersja 2.0

Badanie zadowolenia pasażerów Metra Warszawskiego

PROGRAM SZKOLENIA. Excel w Analizach danych.

Wykład 2: Arkusz danych w programie STATISTICA

Ankieta badająca opinię respondentów na temat inicjatywy utworzenia hospicjum stacjonarnego w powiecie lęborskim

Podstawowe pojęcia statystyczne

tel.: (+48) mail.

Raport nt. ogólnej oceny Uczelni dokonywanej przez studentów składających pracę dyplomową w roku 2015

Zadanie nr 3 Szkolenie ze specjalistycznego oprogramowania dla kadry naukowej

Zajęcia nr VII poznajemy Rattle i pakiet R.

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Otwórz R. Zmień katalog roboczy za pomocą File/Change Dir. Wczytaj plik przypisując go obiektowi o nazwie students:

WYNIKI ANKIETY Czy Biblioteka spełnia Twoje oczekiwania?

Raport z badania jakości kształcenia. doktorantów

WYNIKI ANKIETY Elektroniczne szkolenie biblioteczne na platformie Moodle Biblioteki PWSZ w Nysie

Microsoft Excel 2003 profesjonalna analiza i raportowanie oraz prezentacja danych

PROGRAM SZKOLENIA. Excel Średniozaawansowany z wprowadzeniem do tabel przestawnych i makr.

Analiza korespondencji

Skrypt 29. Statystyka. Opracowanie L2

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Walentynki. Raport z badania przeprowadzonego w dniach 2 66 lutego 2006

OCENA ZADOWOLENIA Z USŁUG URZĘDU MIEJSKIEGO W SŁOMNIKACH

SUBIEKTYWNEJ JAKOŚCI ŻYCIA TOM II SZCZEGÓŁOWE WYNIKI BADAŃ WEDŁUG DZIEDZIN

OCENA RYZYKA ZAKUPU I SPRZEDAZY NIERUCHOMOSCI ZA POŚREDNICTWEM INTERNETOWYCH SERWISOW AUKCYJNYCH

Krótki przewodnik po Open Calc

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

166 Wstęp do statystyki matematycznej

WPROWADZENIE. Cel badania, przedmiot oraz metodologia

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Przewodnik... Tworzenie ankiet

WPŁYW TECHNOLOGII INFORMACYJNYCH NA POZIOM KSZTAŁCENIA STUDENTÓW KIERUNKU INFORMATYKA

1. Metodologiczne podstawy badań wśród uczniów szkół gimnazjalnych i ponadgimnazjalnych Miasta Rzeszowa

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Badanie ankietowe: Postawy mieszkańców województwa śląskiego wobec transportu zbiorowego i indywidualnego

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

Badania marketingowe. Źródło:

Transkrypt:

OPRACOWANIE WYNIKÓW BADAŃ ANKIETOWYCH W PROGRAMIE STATISTICA Michał Kusy, StatSoft Polska Sp. z o.o. Wprowadzenie Najczęściej w kontekście opracowania wyników badań ankietowych poruszane są zagadnienia związane z opisami różnych metod analizy i wizualizacji danych. Mniej uwagi poświęca się natomiast bardziej praktycznym problemom - między innymi temu, jak przygotować arkusz danych do analizy, w jaki sposób zakodować dane, jak sprawdzić poprawność i rzetelność wprowadzonych informacji. Niewłaściwie wprowadzone dane potrafią znacznie wydłużyć czas wykonywanej analizy. Pominięcie etapu weryfikacji i czyszczenia danych często zmusza badacza do powtórnego wykonania analiz, ze względu na odkrywane w trakcie obliczeń nieprawidłowości. Opisywaną w kolejnych rozdziałach przykładową analizę rozpoczniemy od przygotowania arkusza danych i wprowadzenia odpowiedzi respondentów. Do wstępnego opracowania wyników wykorzystamy różne metody analityczne, specyficzne dla badań ankietowych. W dalszej części zobaczymy, jakich problemów moglibyśmy uniknąć, gdyby etap analizy poprzedzony został sprawdzeniem poprawności i odpowiednim przygotowaniem danych. Zbiór danych, na którym będziemy pracować, został przygotowany tak, aby uwzględnić różne rodzaje pytań ankietowych i typowe sytuacje występujące w trakcie analizy. Nie są to dane rzeczywiste. W każdym etapie będziemy sięgać do odpowiednich narzędzi analitycznych. Zobaczymy, w jaki sposób usprawnić przygotowanie arkusza STATISTICA oraz z jakich narzędzi skorzystać w trakcie wstępnej obróbki i sprawdzania poprawności danych. Oprócz typowych analiz wykonywanych w programie STATISTICA odkryjemy również bardziej specjalistyczne narzędzia oferowane przez program STATISTICA dla analiz marketingowych i rynkowych. Kwestionariusze Przygotowana ankieta kierowana była do osób dorosłych, które korzystały z usług biura podróży. Charakterystyka grupy docelowej była z góry określona, jednakowa dla każdego z sześciu ankieterów, którym zlecono przeprowadzenie badania. Kwestionariusz zawierał Copyright StatSoft Polska 2010 www.statsoft.pl/czytelnia.html 27

między innymi pytania o cechy szczególnie istotne przy wyborze oferty turystycznej, ocenę wybranych cech biura podróży i przygotowanego przez nie wypoczynku oraz o miejsca, które badani chcieliby jeszcze odwiedzić. Na początku kwestionariusza pojawiły się tzw. pytania metryczkowe: o płeć, wiek, wykształcenie i miejsce zamieszkania respondentów. Jak zobaczymy później, bardzo istotnym etapem jest samo przygotowanie kwestionariusza. Sposób postawienia pytania może nie tylko zmienić jego kontekst, ale również wpłynąć na rzetelność udzielonych odpowiedzi. Odpowiednio zadane pytanie może ułatwić samą analizę, jak również etap czyszczenia i sprawdzania poprawności danych. W ankiecie uwzględniono szeroki zakres rodzajów pytań - od pytań zamkniętych, z możliwością jednokrotnego lub wielokrotnego wyboru, po skale i pytania otwarte. Dzięki temu będziemy mogli zaprezentować zarówno podstawowe narzędzia analityczne, jak i rozwiązania dedykowane badaniom ankietowym. Przygotowanie arkusza i wprowadzenie danych Dobrą praktyką jest przygotowanie szablonu arkusza przed przystąpieniem do wprowadzenia danych ankietowych. Okazuje się to szczególnie istotne w przypadku, gdy dane są wprowadzane przez różne osoby (np. ankieterów) lub gdy inne osoby zajmują się 28 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2010

wprowadzaniem, a inne analizą danych. Przygotowanie arkusza rozpoczynamy od wprowadzenia nazw zmiennych. Pierwsze dwie kolumny arkusza pozwolą zidentyfikować ankietę i ankietera. Kolejne zmienne będą odpowiadały poszczególnym pytaniom ankietowym. Ze względu na przejrzystość prezentowanych później wyników nazwy zmiennych powinny być w miarę możliwości krótkie. Z drugiej strony powinny umożliwiać łatwą identyfikację pytania, bez potrzeby odszukiwania go w kwestionariuszu. Wprowadzanie nazw zmiennych można usprawnić, korzystając z dostępnej w programie opcji Specyfikacje wszystkich zmiennych. Zauważmy, że rodzaj zadanego pytania wpływa na formę zakodowania zmiennych w arkuszu. W przypadku pytań jednokrotnego wyboru odpowiedzi zostaną umieszczone w jednej zmiennej (np. Wykształcenie). Do przechowywania odpowiedzi na pytania otwarte warto użyć zmiennej typu tekstowego - jak w pytaniu o inne czynniki istotne przy wyborze oferty. Z kolei oceny wskazane na skali zakodujemy w ten sposób, że do każdej cechy przypiszemy osobną zmienną (np. Wybrał ofertę ze względu na markę). Nieco bardziej skomplikowane będzie zakodowanie danych pochodzących z pytań wielokrotnego wyboru lub wielokrotnych odpowiedzi. Przykładem pytania z wielokrotnym wyborem jest pytanie o czynniki istotne dla klienta przy wyborze oferty. W takiej sytuacji każdej możliwej odpowiedzi przypisana została oddzielna zmienna (np. Istotne: marka biura), której wartość mówi, czy dana odpowiedź została zaznaczona czy nie (zwykle przypisujemy: 1-tak, 0-nie). Taki sposób nazywa się kodowaniem w postaci wielokrotnych dychotomii. Z nieco inną sytuacją mamy do czynienia w przypadku pytania o pięć miejsc, które respondent chciałby jeszcze odwiedzić. Podane miejsca będziemy wprowadzać w pięciu zmiennych: Miejsca(1)-Miejsca(5). Ponieważ kolejność wprowadzenia odpowiedzi nie ma dla nas znaczenia, do podsumowania wyników wykorzystamy później tabele wielokrotnych odpowiedzi. W kolejnym etapie przypiszemy określonym odpowiedziom wartości liczbowe, czyli utworzymy tzw. etykiety tekstowe. Dzięki temu przy wprowadzaniu danych wystarczy podać odpowiednią wartość (np. numer odpowiedzi: 1), a program automatycznie przypisze tej wartości odpowiedź - etykietę tekstową (np. kobieta), która następnie będzie wyświetlana w arkuszach i na wykresach. Takie rozwiązanie pozwala jednocześnie przyspieszyć przepisywanie odpowiedzi z ankiety do arkusza i ograniczyć możliwość pomyłki przy Copyright StatSoft Polska 2010 www.statsoft.pl/czytelnia.html 29

wprowadzaniu danych. Program umożliwia skopiowanie etykiet tekstowych do innych zmiennych, co okazuje się szczególnie przydatne w przypadku wielokrotnych dychotomii lub skal. Wprowadzenie danych zaczynamy od przydzielenia każdej wypełnionej ankiecie unikalnego identyfikatora. Osobno zaznaczamy również poszczególnych ankieterów. Dzięki temu będzie można w dowolnej chwili zweryfikować wprowadzone do arkusza odpowiedzi. W trakcie wypełniania arkusza program automatycznie przypisuje podanym przez użytkownika wartościom zdefiniowane wcześniej etykiety tekstowe. Jeżeli utworzymy w zmiennych formuły sprawdzające, wprowadzane wartości mogą również być przez program wstępnie weryfikowane (np. czy podana na skali odpowiedź to 1, 2, 3, 4 lub 5). Przed przystąpieniem do analizy warto zadać sobie pytanie, czy wszystkie wprowadzone odpowiedzi chcemy analizować w takiej postaci, w jakiej zostały zaznaczone w ankiecie, czy interesują nas bardziej zmienne pochodne. Może się na przykład okazać, że zamiast dokładnego wieku wolimy raczej rozważać określone przedziały wiekowe: 18-25 lat, 26-35 lat, 36-45 lat, 46-55 lat i powyżej 55 lat. Zmienną pochodną, uwzględniającą nowe kategorie możemy utworzyć za pomocą Przekodowania zmiennych. Z kolei Szybkie rekodowanie, dostępne w dodatku STATISTICA dla analiz marketingowych i rynkowych, umożliwi nam jednoczesne przekodowanie wielu zmiennych. Dzięki niemu ujednolicimy odpowiedzi na pytanie o miejsca, które respondent chciałby jeszcze odwiedzić. Jak to bywa w pytaniach otwartych, pojawiły się tam odpowiedzi, które oznaczają tę samą kategorię, jak: Hiszpanii, Hiszpanię, Hiszpana. 30 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2010

Wstępna analiza danych Wstępne czyszczenie danych wykonaliśmy już na etapie wprowadzania odpowiedzi do arkusza. Bardzo istotne było stworzenie jednakowego arkusza dla wszystkich wprowadzających. Dzięki odpowiedniemu przygotowaniu zmiennych zabezpieczyliśmy się np. przed wskazaniem kilku odpowiedzi na pytanie jednokrotnego wyboru. Przekodowanie odpowiedzi na pytania otwarte pozwoliło uniknąć analizowania kilka razy tej samej kategorii. Wartości spoza zakresu wyeliminowaliśmy za pomocą formuł sprawdzających. Czy w tym momencie możemy przejść do analizy danych? Odłóżmy na chwilę bardziej wnikliwe sprawdzanie odpowiedzi i spróbujmy wykonać wstępną analizę. Po jej przeprowadzeniu ocenimy, na ile wyniki pozwalają zauważyć nieprawidłowości występujące w danych i w jakim stopniu pozornie prawidłowe wartości są obarczone błędami wynikającymi z nierzetelności lub pomyłek ankietowanych, czy samych ankieterów. W programie STATISTICA znajdziemy pełny zakres narzędzi statystycznych i graficznych, zarówno podstawowych narzędzi analitycznych, takich jak: wykresy, statystyki opisowe, testy statystyczne, jak i bardziej zaawansowanych technik analizy wielowymiarowej, między innymi: analizy korespondencji, analizy skupień, analizy sekwencji, asocjacji i połączeń oraz drzew klasyfikacyjnych. Wstępny etap analizy danych ankietowych Copyright StatSoft Polska 2010 www.statsoft.pl/czytelnia.html 31

obejmuje zazwyczaj proste zestawienia oraz graficzny i liczbowy opis danych zebranych w kwestionariuszach. Do badania empirycznych rozkładów zmiennych można wykorzystać tabele liczności lub ich graficzną prezentację w postaci wykresów kołowych, histogramów, czy wykresów ramka-wąsy. Zestawienie odpowiedzi ankietowych rozpoczniemy od pytań metryczkowych. Biorąc pod uwagę wiek badanych, widzimy, że największy udział stanowią respondenci między 26 a 35 rokiem życia. Dokładniejsza analiza rozkładu wieku respondentów pozwala z kolei zauważyć podejrzaną wartość - 12 lat. Co prawda mieści się ona w sensownym zakresie, jednak ze względu na fakt, że badanie kierowano tylko do osób pełnoletnich, należałoby sprawdzić, czy nie jest to efekt pomyłki przy wprowadzaniu danych (np. zamiany cyfr w wieku 21 lat). Dzięki identyfikacji ankiet możemy porównać podejrzany wiek z odpowiedzią występującą w kwestionariuszu i skonsultować się z ankieterem, który prowadził badanie. Okazuje się, że w badaniu wzięło udział nieco więcej kobiet niż mężczyzn i że najczęściej były to osoby z wykształceniem średnim / policealnym lub wyższym magisterskim. Badani w większości pochodzą z dużych miast, najmniejszy odsetek badanych pochodzi ze wsi. Na tym kończymy charakterystykę badanych. Zobaczmy teraz, jak rozłożyły się czynniki, które decydowały o wyborze oferty turystycznej. Ponieważ w tym przypadku ankietowani udzielali więcej niż jednej odpowiedzi, wykorzystamy opcję programu STATISTICA umożliwiającą analizę danych zakodowanych w postaci wielokrotnych dychotomii (tak - 1, nie - 0). Tabela wynikowa składa się z trzech kolumn zawierających odpowiednio: liczbę osób, które zaznaczyły daną odpowiedź, procenty odnoszące się do liczby odpowiedzi (sumujące się do 100%) oraz do liczby respondentów (które zwykle nie sumują się do 100%). Okazuje się, że najczęściej przy wyborze oferty ankietowani kierowali się rzetelnością biura, ceną wycieczki i bezpieczeństwem podróży. Z kolei najmniej ważne okazały się: możliwość uzyskania rabatu z kartą OBCCard, lokalizacja biura i czas obsługi. W podobny sposób zestawiamy odpowiedzi na pytanie o miejsca, które respondent chciałby jeszcze odwiedzić. Korzystamy tym razem z tabeli wielokrotnych odpowiedzi, w której program umieszcza liczbę wszystkich 32 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2010

wystąpień danej kategorii dla wskazanych zmiennych. Wśród najczęściej wymienianych krajów znajdujemy miejsca związane z letnim wypoczynkiem: Egipt, Tunezję czy Grecję, zdarzają się również bardziej egzotyczne podróże - do Indii, Chin czy Nowej Zelandii. Pora na podsumowanie skal. W kolejnym pytaniu poprosiliśmy ankietowanego o ustosunkowanie się do podanych stwierdzeń poprzez wskazanie odpowiedniej oceny na pięciostopniowej skali Likerta (zdecydowanie nie, raczej nie, nie mam zdania, raczej tak, zdecydowanie tak). Podsumowanie zilustrowane zostało na wielokrotnym wykresie ramkawąsy, zestawiającym medianę oraz pierwszy i trzeci kwartyl dla wszystkich zmiennych. Na podstawie wykresu można powiedzieć, jakie oceny zwykle wskazywali ankietowani (np. Wybrał ofertę ze względu na markę - 4, czyli raczej tak). Szerokość ramki mówi z kolei o zróżnicowaniu odpowiedzi (widać np. stosunkowo małą zmienność w przypadku stwierdzenia: W biurze spotkał fachową obsługę). Copyright StatSoft Polska 2010 www.statsoft.pl/czytelnia.html 33

W tej sytuacji możemy również skorzystać ze specjalistycznych analiz, które oferuje program STATISTICA dla analiz marketingowych i rynkowych. Przykładem takiej analizy jest Podsumowanie skali pozycyjnej, które przedstawia udział procentowy poszczególnych ocen dla każdego stwierdzenia z wyróżnieniem najczęściej i najrzadziej pojawiających się odpowiedzi. Dodatek STATISTICA dla analiz marketingowych i rynkowych pozwoli nam również zestawić wyniki pytania opartego na innej skali porządkowej - tzw. dyferencjale semantycznym. Na wykresie podsumowującym znajdziemy poziom natężenia danej cechy rozpiętej między dwiema przeciwstawnymi kategoriami (np. ocenami: drogi wyjazd / tani wyjazd). Za wartość neutralną przyjmiemy w tej sytuacji środek skali, czyli 4. Na podstawie wykresu możemy wyciągnąć wniosek, że zwykle respondenci wypoczywali w komfortowych warunkach, jedzenie było smaczne, a miejsce wypoczynku atrakcyjne, natomiast zdania na temat ceny wyjazdu są podzielone. Bardziej interesujące może okazać się porównanie ocen udzielonych przez kobiety i mężczyzn. Jak widać na wykresie uwzględniającym podział na płeć, badani mężczyźni nieco wyżej od kobiet ocenili np. uprzejmość obsługi i podróż na miejsce wypoczynku, natomiast mniej zadowoleni byli z kosztu wyjazdu. Przed chwilą porównaliśmy różnice w ocenie wskazanych cech z punktu widzenia kobiet oraz mężczyzn. W badaniach ankietowych mamy na ogół do czynienia ze zbiorem danych, który nie jest całkiem jednorodny, w związku z czym, podobnie jak w tej sytuacji, zachodzi potrzeba przeprowadzenia analiz w określonych grupach. Podobne analizy wykonamy za chwilę, sprawdzając rzetelność uzyskanych wyników. Sprawdzanie poprawności danych Oprócz nieprawidłowego wieku respondenta przedstawione wyniki nie wzbudziły w nas większych podejrzeń. Przygotowując arkusz i wykonując wstępną obróbkę danych ominęliśmy część problemów. Czy możemy się spodziewać innych, których nie byliśmy w stanie wychwycić w trakcie pierwszej analizy? Okazuje się, że odpowiednia konstrukcja ankiety 34 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2010

i znajomość najczęściej występujących błędów pozwala czasem namierzyć przeciwnika, którym w tym wypadku będzie nieuczciwy respondent lub nierzetelny ankieter. Po pierwsze warto sprawdzić, czy ankieterzy spełnili założenia badania dotyczące grupy docelowej. Każdy z ankieterów miał zadaną jednakową charakterystykę respondentów. Możemy zatem porównać rozkłady procentowe w metryczkach poszczególnych ankieterów. Pomocne okażą się tutaj wykresy skategoryzowane i wykresy obrazkowe. Copyright StatSoft Polska 2010 www.statsoft.pl/czytelnia.html 35

Na skategoryzowanych wykresach kołowych i histogramach przedstawiających rozkład płci, wieku, wykształcenia i miejsca zamieszkania respondentów nie widzimy znacznych rozbieżności między sześcioma ankieterami. Uwagę może zwrócić rozkład wieku osób ankietowanych przez czwartego ankietera. Okazuje się, że dotarł on do większej liczby młodych ludzi w wieku 18-25 lat, nieco mniejszy udział stanowili z kolei respondenci w wieku 26-35 lat. Przyjrzyjmy się zatem bliżej wybranemu ankieterowi i najmłodszej badanej przez niego grupie. W tym celu sięgniemy do wykresów obrazkowych, których przykładem mogą być twarze Chernoffa. Przypadki zostaną na tym wykresie zobrazowane poprzez ludzkie twarze w taki sposób, że względne wartości zmiennych określą wielkość i pozycję różnych elementów twarzy. Dzięki temu będzie można jednocześnie ująć więcej cech respondentów. W naszym przykładzie długość nosa określa płeć (dłuższe nosy mają mężczyźni), położenie ust charakteryzuje wiek (osoby starsze mają usta bliżej brody), uśmiech mówi o poziomie wykształcenia (najbardziej uśmiechnięte są osoby z wyższym wykształceniem), a szerokość ust o miejscu zamieszkania (mieszkańcy większych miejscowości mają szersze usta). Wykres obrazkowy pozwala zobaczyć prawidłowości, których nie zauważylibyśmy na wykresach podsumowujących każdą z cech oddzielnie. W przypadku czwartego ankietera badani z miast powyżej 300 tys. mieszkańców są do siebie bardzo podobni. Okazuje się, że są to w przeważającej większości kobiety w wieku 23, 24 lat z wykształceniem średnim, co może sugerować, że ankieter przeprowadził badanie np. na grupie studentów. W odpowiedniej grupie pochodzącej od innego ankietera widzimy z kolei wyraźnie większe zróżnicowanie cech. Okazuje się zatem, że respondenci badani przez czwartego ankietera różnią się od pozostałych, mimo zachowania podobnej struktury na poziomie pojedynczych cech. 36 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2010

Zachowanie wymaganej struktury badanych nie zawsze musi świadczyć o rzetelności ankietera. Czasami okazuje się, że pewna grupa respondentów jest niedostępna i ankieter omija problem dopisując brakujące przypadki i powielając informacje z wypełnionych ankiet. Są to nieprawidłowości trudniejsze do wyśledzenia, ale część z nich można odnaleźć, korzystając z opcji znajdowania powtórzeń lub analizując korelacje między odpowiedziami badanych. Przyjrzyjmy się teraz bliżej rzetelności odpowiedzi udzielonych przez respondentów. W pytaniu o czynniki, które były dla ankietowanego szczególnie istotne przy wyborze oferty turystycznej pojawiła się między innymi odpowiedź Rabat z kartą OBCCard. Okazuje się, że dla kilku osób był to czynnik szczególnie istotny, mimo że wymieniona karta nie istnieje W pytaniu uwzględniono dodatkowy, fikcyjny czynnik, aby sprawdzić uczciwość ankietowanych i ich uwagę przy wypełnianiu ankiety. Za pomocą opcji Autofiltr można teraz wyszukać podejrzane przypadki. O ile odpowiedź mogła zostać zaznaczona w wyniku nieuwagi respondenta lub ankietera, w dwóch przypadkach zaznaczono wszystkie dostępne odpowiedzi, co oznaczałoby, że ankietowany kierował się przy wyborze oferty wszystkimi czynnikami. Dzięki opcji określania stanów przypadków w arkuszu możemy teraz zaznaczyć etykietą podejrzanych respondentów lub wyłączyć ich z dalszych analiz. Poprzednie pytanie wskazało kolejną ścieżkę, którą możemy podążyć w tropieniu niepoprawnych odpowiedzi. Respondent bez odpowiedniej motywacji do wypełnienia ankiety zaznacza czasami wszystkie odpowiedzi z góry na dół lub, w przypadku skal, zaznacza odpowiedzi zgodnie z pewną regułą - np. po przekątnej, co drugą itp. Jednym ze sposobów zabezpieczenia się przed takimi odpowiedziami jest ponowne zapytanie respondenta o podobny problem za pomocą przeformułowanego lub zanegowanego zdania. Oczywiście musimy się kierować w tym przypadku dużym wyczuciem. Nie można np. takich pytań używać zbyt często, aby respondent nie poczuł się traktowany niepoważnie. W naszym kwestionariuszu przeciwstawne stwierdzenia znajdziemy w pytaniu opartym na skali Likerta. Umieszczono tam przykładowo zdania: Wyjazd spełnił moje oczekiwania Copyright StatSoft Polska 2010 www.statsoft.pl/czytelnia.html 37

i jestem z niego zadowolony oraz Nie uważam, że wyjazd był do końca udany, czegoś mi brakowało. Po zebraniu danych można porównać zależności między odpowiedziami udzielonymi dla przeciwstawnych stwierdzeń. Pomocny okazuje się w tej sytuacji wykres interakcji liczności. Widać na nim wyraźną tendencję: wraz ze wzrostem wartości na skali opisującej zadowolenie z wyjazdu maleją wartości na skali dla stwierdzenia przeciwstawnego. Zidentyfikowanie prostych relacji między zmiennymi umożliwiają również tabele dwudzielcze (lub wielodzielcze), często stosowane w analizie danych ankietowych. Tabele dwudzielcze powstają w oparciu o podział badanej grupy na kategorie wyznaczone przez dwie zmienne i zawierają liczności i procenty odpowiadające poszczególnym kategoriom. W naszym przykładzie widać, że żaden z respondentów nie zaznaczył jednocześnie odpowiedzi zdecydowanie tak przy obu stwierdzeniach. Jednak znalazły się cztery osoby, które zdecydowanie przyznały, że wyjazd spełnił ich oczekiwania, a jednocześnie stwierdziły, że raczej wyjazd nie był do końca udany. 38 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2010

Ostatnią próbą, jaką podejmiemy, będzie wyszukanie podejrzanych regularnych wzorców odpowiedzi udzielonych na skali dyferencjału semantycznego. Skorzystamy z możliwości, jakie daje opcja sprawdzania reguł poprawności danych dostępna w programie STATISTICA dla analiz marketingowych i rynkowych. Opcja Reguły poprawności umożliwia zarówno wygodne tworzenie reguł, jak i wczytanie wcześniej wprowadzonych formuł. Dzięki temu możemy wykorzystać wcześniej zdefiniowane, często skomplikowane formuły do nowych danych. Po sprawdzeniu wskazanych reguł program zaznaczył w arkuszu niepoprawne przypadki. Są to respondenci, którzy wskazali jednakowe wartości na całej skali lub postępowali według określonego wzorca. Różnice między podejrzanymi, zbyt regularnymi odpowiedziami a wartościami bardziej typowymi można zauważyć na wykresie obrazkowym przedstawiającym profile odpowiedzi. Oczywiście nie wszystkie regularne odpowiedzi możemy uznać za niepoprawne - często zdarza się przecież, że respondent jest bardzo zadowolony z wyjazdu i daje najwyższe noty wszystkim opisywanym cechom. Program STATISTICA pozwala przeprowadzić analizę na zawężonej grupie badanych oraz etykietować interesujące nas przypadki. Dzięki temu moglibyśmy śledzić podejrzanych respondentów w kolejnych analizach i skonfrontować ich odpowiedzi np. z oceną wyjazdu wyrażoną na skali Likerta. Podsumowanie W przedstawionym powyżej przykładzie zobaczyliśmy, jak przygotować arkusz danych i sprawdzić poprawność wprowadzonych informacji. Dzięki temu uniknęliśmy wielu problemów w trakcie wstępnej analizy. Mimo to w zbiorze danych znalazły się odpowiedzi niepoprawne, które na pierwszy rzut oka ciężko było odróżnić od wiarygodnych. Odkryliśmy je dzięki odpowiedniej konstrukcji kwestionariusza oraz bardziej zaawansowanym technikom sprawdzania poprawności. Dzięki analizie zapoznaliśmy się również z przykładami wykorzystania w opracowaniu wyników badań ankietowych zarówno znanych opcji programu STATISTICA, jak i specjalistycznych narzędzi oferowanych przez program STATISTICA dla analiz marketingowych i rynkowych. Copyright StatSoft Polska 2010 www.statsoft.pl/czytelnia.html 39

Literatura 1. G.A. Churchill, Badania marketingowe. Podstawy metodologiczne, Wydawnictwo Naukowe PWN, Warszawa 2002. 2. M. Walesiak, Metody analizy danych marketingowych, Wydawnictwo Naukowe PWN, Warszawa 1996. 40 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2010