Jedzenie w kawiarni W pewnej kawiarni puszczano trojakiego rodzaju podkład muzyczny do posiłku ballady rockowe, klasyczne przeboje lub muzykę taneczną. Badano czas przeznaczony przez losowo wybranych gości na spożycie zamówionych posiłków oraz ich cene, gdy w tle puszczano odpowiedni podkład muzyczny. Wyniki poszczególnyh obserwacji przedstawiają się następująco. BALLADY ROCKOWE KLASYCZNE PRZEBOJE MUZYKA TANECZNA CENA CZAS CECNA CZAS CENA CZAS 41,95 20 22,6 30 30,86 17 32,52 31 23,5 33 32,25 19 18,97 26 25,67 33 32,16 20 24,18 34 27,37 28 32,52 25 8,88 38 30,73 28 37,16 27 29,76 29 18,34 29 29,15 21 16,17 39 25,17 28 47,24 27 16,87 27 19,09 24 35,78 19 42,15 25 32,17 30 23,26 23 20,92 27 21,89 31 41,51 25 1. Przygotuj zbiór danych w SPSS i wprowadź uzyskane w badaniu wyniki 2. Oblicz ile złotych na minutę wydał każdy z badanych gości - CENA WDYATEK CAS 3. Dokonaj opisu statystycznego badanych zmiennych średnia, mediana, odch. standardowe, skośność, kurtoza zinterpretuj uzyskane wskaźniki i scharakteryzuj rozkład wyników posługując się nakreślonym histogramem. 4. Zweryfikuj hipotezę, że im szybszy jest podkład muzyczny (ballady rockowe są najmniej szybkie, klasyczne przeboje są nieco szybsze, muzyka taneczna jest najszybsza) tym więcej czasu goście kawiarni spędzają na konsumpcji i tym więcej wydają pieniędzy. a. Jakiej metody statystycznej należy użyć? b. Podaj odpowiednie statystyki i wskaźniki oraz ich interpretację dla potwierdzenia postawionej przez Ciebie tezy. Karol Karasiewicz www.karasiewicz.az.pl 1
Odpowiedzi 1. Przygotuj zbiór danych w SPSS i wprowadź uzyskane w badaniu wyniki W badaniu można wyróżnić cztery zmienne pierwszą jest rodzaj (jak można wnioskować również tempo) podkładu muzycznego (zmienna prawdopodobnie nominalna, choć w dalszej części gdzie pytano o związek z tempem można wysunąć przypuszczenie, że zakładano jej charakter porządkowy), 1 Ballady Rockowe, 2 Klasyczne przeboje, 3 Muzyka taneczna. Kolejna zmienna to CZAS konsumpcji (zmienna ilościowa) i CENA zamówionego posiłku (zmienna ilościowa). W zbiorze będzie zatem 30 wierszy ponieważ jest 30 obserwacji (prawdopodobnie 30 gości, 30 zamówionych posiłków). Fragment zbioru danych zapisanego w pliku SPSS przedstawia się następująco: Ryc. 1 CENA WDYATEK 2. Oblicz ile złotych na minutę wydał każdy z badanych gości - CAS Aby wykonać to zadanie, należy jedynie wyliczyć nową zmienną WYDATEK która jest wynikiem dzielenia zmiennej CENA przez zmienną CZAS. Więc należy wybrać polecenie PRZEKSZTAŁCENIA OBLICZ WARTOŚCI. Karol Karasiewicz www.karasiewicz.az.pl 2
Ryc. 2 I w otwartym oknie kreatora obliczania wartości nowej zmiennej należy wpisać nazwę nowej zmiennej do pola Zmienna wynikowa oraz funkcję obliczającą żądany iloraz poprzez wpisanie CENA/CZAS. Ryc. 3 W edytorze danych pojawi się nowa zmienna WYDATEK, która wskaże, ile złotych w przeliczeniu na jedną minutę wizyty wydał każdy z gości w czasie posiłku. 3. Dokonaj opisu statystycznego badanych zmiennych średnia, mediana, odch. standardowe, skośność, kurtoza zinterpretuj uzyskane wskaźniki i scharakteryzuj rozkład wyników posługując się nakreślonym histogramem. Wykonanie tego zadania wymaga użycia jednej z opcji analizy rozkładu np. procedury analizy częstości ANALIZA OPIS STATYSTYCZNY CZĘSTOŚCI. Oddzielnie analizę tę należy przeprowadzić dla zmiennej nominalnej (tutaj MUZYKA) oraz zmiennych ilościowych (tutaj CENA, CZAS, WYDATEK). Dla zmiennej nominalnej analiza częstości posłuży jedynie do tego, aby wskazać, ile (i jaki to stanowiło odsetek całości próby) było obserwacji w towarzystwie muzyki rockowej, klasycznych przebojów i muzyki tanecznej. Interesować nas będą jedynie liczebności i procenty. Choć te ostatnie w małym stopniu, ponieważ primo zmienna jest zmienną niezależną ją się kontroluje a secundo, liczba obserwacji jest mała (znacznie poniżej 100) i dlatego procent jest miarą mało informatywną. Oczywiście dla zmiennych ilościowych warto wskazać szereg podstawowych statystyk wymienionych w poleceniu oraz oszacować normalność rozkładu poprzez histogram. Karol Karasiewicz www.karasiewicz.az.pl 3
Ryc. 4 A więc dla oszacowania liczebności prób obserwacji w towarzystwie określonej muzyki należy w otwartym oknie kreatora analizy częstości wskazać wszystkie zmienne nominalne tutaj MUZYKA i w oknie WYKRESY zażądać wykresów kołowych. Ryc. 5 W wyniku analizy po zaakceptowaniu wszystkich ustawień otrzymamy raport z podsumowaniem liczby obserwacji w poszczególnych grupach.w odniesieniu do zmiennej MUZYKA jest to raport nieszczególnie interesujący w każdym warunku eksperymentalnym jest N=10 tyle samo obserwacji. PODKŁAD MUZYCZNY Ważne Procent Procent Częstość Procent ważnych skumulowany BALLADY ROCKOWE 10 33,3 33,3 33,3 KLASYCZNE PRZEBOJE 10 33,3 33,3 66,7 MUZYKA TANECZNA 10 33,3 33,3 100,0 Ogółem 30 100,0 100,0 Karol Karasiewicz www.karasiewicz.az.pl 4
Natomiast w odniesieniu do CENY, CZASU i WYDATKU zmiennych ilościowych należy przeprowadzić tę samą procedurę analizy częstości, lecz przy wyborze WYKRESÓW należy wskazać histogram z kryzwą normalną, natomiast w polu STATYSTYKI należy wskazać średnią, medianę, odh. Standardowe, medianę, minimum i maksimum oraz skośność i kurtozę. Ryc. 6 Po zaakceptowaniu ustawień otrzymamy raport z podsumowaniem statystyk opisowych oraz wykresami funkcji gęstości rozkładu normalnego dla liczebności obserwowanych i oczekiwanych w poszczególnych zmiennych. Goście spędzili na posiłku od 17 do 39 minut i w tym czasie wydali od 8,88 do 47,24 złotych. Przeciętnie gość spędził na posiłku M=27,10 minuty z odchyleniem standardowym SD=5,403 minuty i wydał w tym czasie M=28,0263 1 złotego z odchyleniem standardowym SD=8,86102 złotego. Przeciętny gość zatem na posiłek przeznacza od 19,16528 do 28,26złtegi i spożywa go w czasie od 21,697 do 27,00 minuty. Połowa gości na posiłek wydaje co najwyżej 28,2600 złotego i spożywa go w czasie nie dłuższym niż 27 minut. 1 Wydaje się oczywiste, że w normalnym raporcie wszystkie wartości byłyby ograniczone do dwóch miejsc po przecinku, ale dla ułatwienia Czytelnikowi odnalezienia wartości w tabeli podano je z dokładnością taką, jaką raportuje to SPSS. Karol Karasiewicz www.karasiewicz.az.pl 5
Statystyki N CENA ZAMÓWIO NYCH PRODUKT ÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENI U NA MINUTĘ KONSUMPCJI Ważne 30 30 30 Braki danych 0 0 0 Średnia 28,0263 27,10 1,1087 Mediana 28,2600 27,00 1,0188 Odchylenie standardowe 8,86102 5,403,48299 Skośność,173,173,377 Błąd standardowy skośności,427,427,427 Kurtoza -,194 -,082 -,838 Błąd standardowy kurtozy,833,833,833 Minimum 8,88 17,23 Maksimum 47,24 39 2,10 Na podstawie wskaźników skośności i kurtozy (mieszczących się w przedziale od-0,7 do 0,7) można powiedzieć, że oba rozkłady pomiarów pomiar czasu i ceny spożytego posiłku są rozkładami względnie symetrycznymi i mezokurtycznymi. Można zatem powiedzieć, że liczba gości, którzy zapłacili za posiłek mniej niż średnia jest zbliżona do liczby gości płacących więcej niż średnia i analogicznie w odniesieniu do czasu liczba gości spędzających w kawiarni mniej czasu niż średnia jest zbliżona do liczby gości spędzających więcej czasu niż średnia. Zróżnicowanie wyników można uznać za przeciętne. Karol Karasiewicz www.karasiewicz.az.pl 6
CENA ZAMÓWIONYCH PRODUKTÓW 6 Częstość 4 2 0 0,00 20,00 40,00 CENA ZAMÓWIONYCH PRODUKTÓW Średnia =28,0263 OdchStd. =8,86102 N =30 Natomiast rozkład wyników pomiaru wydatku na posiłek w przeliczeniu na jedną minutę wizyty okazują się nieznacznie różnić od rozkładu normalnego charakteryzują się dość wyraźną spłaszczeniem (Kurtoza=-0,838), co oznacza dość duże zróżnicowanie badanej próbki pod względem poziomu wydatków na posiłek w przeliczeniu na jedną minutę wizyty. I rzeczywiście w badanej próbie goście na posiłek wydali w przeliczeniu na jedną minutę od 0,23 złotego do 2,10 złotego. Przeciętnie gość wydał M=1,1087 złotego na minutę z odchyleniem standardowym SD=1, 0188 co oznacza, że typowy gość wydaje w przeliczeniu na jedną minutę od 0,0899 złotego 2,1275. Karol Karasiewicz www.karasiewicz.az.pl 7
4. Zweryfikuj hipotezę, że im szybszy jest podkład muzyczny (ballady rockowe są najmniej szybkie, klasyczne przeboje są nieco szybsze, muzyka taneczna jest najszybsza) tym więcej czasu goście kawiarni spędzają na konsumpcji i tym więcej wydają pieniędzy. Tutaj jest dość trudna kwestia do rozstrzygnięcia związana z charakterem zmiennej MUZYKA (Tempo tła muzycznego). Z jednej strony logicznym się wydaje, że Ballady Rockowe, Klasyczne przeboje i Muzyka Taneczna należą do innych kategorii, a więc stanowią inną jakość - ergo tworzą zmienną nominalną. Jednakże instrukcja przekazana w hipotezie może sugerować, że zmienna jednak ma charakter porządkowy i należy ją traktować, jak wynik pewnego uporządkowania. Ten dylemat metodologiczny implikuje pewien problem natury statystycznej. Ponieważ, jeśli zmienną MUZYKA traktować jako zmienną nominalną, do oszacowania jej związku ze zmienną ilościową (tzn. CENA, CZAS i WYDATEK) można wykorzystać jednoczynnikową ANOVA. Jeśli natomiast zmienną tę traktować, jak zmienną porządkową nasuwa się rozwiązanie poprzez analizę zależności metodą r ho Spearmana. Bezpieczniejsze wydaje się skorzystanie z metody jednoczynnikowej ANOVA. Każdą zmienną porządkową można traktować, jak zmienną nominalną obniżenie skali szacunkowej jest dopuszczalne, nigdy podwyższenie. A jednocześnie nie mamy podstaw, aby sądzić, że tempo podkładu muzycznego liniowo wiąże się z czasem spożycia, czy ceną zamówionego posiłku. a. Jakiej metody statystycznej należy użyć? Dla oszacowania związku między tempem muzyki, a czasem i ceną oraz wydatkiem w złotych na minutę należy przeprowadzić test jednoczynnikowej ANOVA. W tym celu należy kliknąć ANALIZA PORÓWNYWANIE ŚREDNIECH JEDNOCZYNNIKOWA ANOVA. Ryc. 7 W otwartym oknie kreatora analizy należy zdefiniować zmienne zależne są to zmienne ciągłe o rozkładzie normalnym (Tutaj CENA, CZAS i WYDATEK). Następnie zdefiniować czynnik, tzn. zmienną niezależną jest to zmienna nominalna o więcej niż dwie kategoriach (tutaj jest to MUZYKA). Karol Karasiewicz www.karasiewicz.az.pl 8
Ryc. 8 Następnie koniecznie należy zdefiniować żądanie odpowiednich statystyk i wykresów poprzez kliknięcie na przycisk OPCJE. Warto wybrać statystyki opisowe testy jednorodności wariancji oraz mocne testy równości średnich Browna-Forsythe i wykres średnich. Ryc. 9 I wreszcie należy zdefiniować testy kontrastów lub testy post hoc dla oszacowania dokładnych różnic między porównywanymi warunkami. Wybierzmy jedne i drugie, choć w praktyce należy raczej zdecydować się na jedne z nich. Zacznijmy od testów post hoc. Służą one do oszacowania różnic między poszczególnymi parami grup. Najczęściej wykorzystywanymi testami post hoc to NIR (najmniej restrykcyjny, daje najwięcej istotnych statystycznie różnic), test Tukey a (w wersji A jest to test dla grup równolicznych, w wersji B dla grup nierównolicznych) lub test T2Tamhane a. Często też, gdy prowadzone są eksperymenty z tzw. grupą kontrolną wykorzystywany jest test Dunnetta, który przeprowadza tylko porównania parami między grupą kontrolną (grupa ta musi być pierwsza lub ostatnia w definicji zmiennej niezależnej) a każdą inną grupą. Ryc. 10 Oczywiście w rzeczywistym badaniu należy zdecydować się na jedno z rozwiązań, w tym opracowaniu przeprowadzone będą wszystkie testy dla pokazania różnicy między nimi. Karol Karasiewicz www.karasiewicz.az.pl 9
I wreszcie testy kontrastów definiowane poprzez przycisk KONTRASTY. Jednakże zanim przejdziemy do technicznego problemu definiowania kontrastów, należy wspomnieć kilka słów o ich logice. Testy kontrastów to testy szczegółowej hipotezy alternatywnej. O ile jednoczynnikowa ANOVA (tzw. Omnibus F) pozwala oszacować istotność związku między zmienną niezależną i zależną, a testy post hoc pozwalają na oszacowanie istotności różnic między każdą parą średnich, to kontrasty pozwalają zdefiniować dokładnie interesujące różnice nie tylko między parami średnich, ale między średnią jednej grupy i średnią wszystkich pozostałych grup itd. Ponadto kontrasty pozwalają odpowiedzieć na pytanie, czy różnice między średnimi układają się w odpowiednim trendzie liniowym, kwadratowym itd. Najważniejsze, aby pamiętać, że istnieją trzy proste reguły dotyczące definiowania współczynników kontrastów: Każda średnia (każda grupa) powinna otrzymać własny współczynnik (wagę) kontrastu Suma wszystkich współczynników kontrastów powinna wynosić 0 Jeśli dwie grupy otrzymują taki sam współczynnik kontrastu (np. 1 i 1) ich średnie są uśredniane, jeśli przeciwny (np. -1 i 1) są porównywane, jeśli współczynnik dla danej grupy wynosi 0 jej średnia nie jest uwzględniana w porównaniach. Tak więc zdefiniujmy współczynniki kontrastów dla trzech hipotez, które (jak się wydaje) możemy założyć mając podstawową wiedzę odnośnie praw rządzących zachowaniami konsumenta: Wyniki uzyskane przy muzyce tanecznej różnią się od średniej uzyskanej przy balladach rockowych i klasycznych przebojach Istnieje istotny statystycznie liniowy trend zależności między tempem muzyki i ceną oraz czasem i wydatkiem na posiłek. Tzn, że zależność ma charakter liniowy Istnieje istotny nieliniowy (kwadratowy) trend zależności między tempem muzyki i ceną oraz czasem i wydatkiem na posiłek. Tzn. że zależność ta jest krzywoliniowa do pewnego momentu ma charakter rosnący, potem malejący. Zatem przejdźmy do technicznej strony definiowania kontrastów w SPSS. Dla zdefiniowania trendu, tzn. odpowiedzi na pytanie, czy zależność ma określony charakter liniowy lub nieliniowy wystarczy wskazać najwyższy interesujący nas wielomian w naszym przykładzie jest to wielomian kwadratowy. Trzeba pamiętać, że dla oszacowania wielomianu k stopnia (np. drugiego, trzeciego itd.) potrzebnych jest k+1 grup. Zatem w naszym przykładzie, gdzie tempo muzyczne jest zdefiniowane na trzech poziomach mamy możliwość oszacowania jedynie wielomianu drugiego stopnia. SPSS domyślnie oszacuje również wielomiany niższego stopnia. W ten sposób odpadną nam dwa problemy: jak należy przypisać współczynniki kontrastów, aby trend okazał się liniowy, kwadratowy itd. i czy kontrasty te są ortogonalne (niezależne). Jednak dla celów dydaktycznych przedstawię, jak SPSS przypisuje wagi kontrastów dla trendu liniowego i kwadratowego w planie trzygrupowym: Ballady Rockowe Klasyczne Przeboje Muzyka Taneczna Trend Liniowy -1 0 1 Trend kwadratowy 1-2 1 Karol Karasiewicz www.karasiewicz.az.pl 10
Do tych dwóch trendów liniowego i kwadratowego my chcemy zdefiniować jeszcze trzeci kontrast o innym (niestandardowym) charakterze tzn. -1-1 2. Ten kontrast będzie weryfikował pierwszą ze stawianych hipotez, tzn. że wyniki uzyskane przy muzyce tanecznej (grupa trzecia) różnią się od uśrednionych wyników uzyskanych przy muzyce rockowej i klasycznych przebojach obie grupy pierwsza i druga otrzymały tę samą wagę kontrastu. Stąd też po dopisaniu ustalonych współczynników kontrastu do kontrastów trendu liniowego i kwadratowego otrzymujemy następującą macierz współczynników kontrastów: Ballady Rockowe Klasyczne Przeboje Muzyka Taneczna Trend Liniowy -1 0 1 Trend kwadratowy 1-2 1 Trend potęgowy -1-1 2 Kontrasty te nie są ortogonalne (nie są niezależne), ponieważ suma iloczynów współczynników kontrastów (wynosi 5) nie jest równa zero. Można zatem powiedzieć, że wyniki porównania specjalnego, które zaplanowano nie są niezależne od porównań wynikających z trendu liniowego i kwadratowego wynikają z nich. Mocno zalecane jest testowanie kontrastów ortogonalnych, ponieważ tylko wtedy można powiedzieć, jaki jest rzeczywisty poziom istotności każdej z szacowanych różnic. Przy testowaniu kontrastów nieortogonalnych pewna część istotności każdego z nih jest zależna od istotności pozostałych. Ballady Rockowe Klasyczne Przeboje Muzyka Taneczna Trend Liniowy -1 0 1 Trend kwadratowy 1-2 1 Trend potęgowy -1-1 2 Iloczyn wag 1 2 2 Suma iloczynów 5 0 Ryc. 11 Aby zatem zdefiniować ten niestandardowy kontrast musimy kolejno według kolejności grup w zmiennej niezależnej (tutaj: 1 - Ballady Rockowe, 2 Klasyczne Przeboje i 3 Muzyka Taneczna) wprowadzić wagi kontrastów. Po wpisaniu jednego współczynnika (np. - 1) należy przycisnąć klawisz DODAJ i wprowadzić kolejny współczynnik. Wprowadzone współczynniki będą pojawiały się na liście i jednocześnie poniżej SPSS kontrolnie będzie obliczał ich sumę tak, aby nie pomylić się przy samodzielnym liczeniu. Gdybyśmy chcieli zdefiniować więcej niż jeden kontrast możemy po wpisaniu współczynników dla Karol Karasiewicz www.karasiewicz.az.pl 11
wszystkich grup kliknąć przycisk NASTĘPNY i od nowa wprowadzać współczynniki dla następnych kontrastów. Gdyby sobie wyobrazić rozłożenie tych trzech wartości, jako wartości rzędnych (na osi Y) dla kolejnych trzech wartości z osi X, to w klasycznym układzie kwadratowym dałyby one obraz funkcji liniowej lub kwadratowej (patrz: Ryc. 12). Ryc. 12 Co można również zaobserwować, zadany przez nas specjalny kontrast - -1-1 2 to odwrotny trend pierwiastkowy (tzw. trend potęgowy). b. Podaj odpowiednie statystyki i wskaźniki oraz ich interpretację dla potwierdzenia postawionej przez Ciebie tezy. Statystyki opisowe CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI BALLADY ROCKOWE N Średnia Odchylenie standardowe 10 25,2370 11,14386 KLASYCZNE PRZEBOJE 10 24,6530 4,54726 MUZYKA TANECZNA 10 34,1890 6,68217 Ogółem 30 28,0263 8,86102 BALLADY ROCKOWE 10 29,60 5,967 KLASYCZNE PRZEBOJE 10 29,40 2,675 MUZYKA TANECZNA 10 22,30 3,592 Ogółem 30 27,10 5,403 BALLADY ROCKOWE 10,9347,56897 KLASYCZNE PRZEBOJE 10,8424,16102 MUZYKA TANECZNA 10 1,5490,27227 Ogółem 30 1,1087,48299 Wyniki przeprowadzonej analizy wskazują, że przeciętny czas konsumpcji przy muzyce rockowej (M=29,60) i klasycznych przebojach (M=29,40), czy przeciętny koszt Karol Karasiewicz www.karasiewicz.az.pl 12
zamówionego posiłku (odpowiednio M=25,2370 dla muzyki rockowej i M=24,6530 dla klasycznych przebojów) nie różnią się w sposób znaczący. Natomiast różnica między ceną i czasem konsumpcji przy muzyce rockowej lub klasycznych przebojach, a analogicznymi wynikami uzyskanymi przy muzyce tanecznej wydaje się wyraźnie większa. Przeciętnie gość w towarzystwie muzyki tanecznej spędził na konsumpcji M=22,30 minut i w tym czasie wydał M=34,1890 złotych na posiłek. Co wydaje się istotne, to fakt, że w grupie gości spędzających czas w towarzystwie muzyki klasycznej ujawniło się znacznie większe zróżnicowanie wyników niż w pozostałych grupach gości (na co wskazuje dużo większe odchylenie standardowe) w obrębie wszystkich analizowanych zmiennych. Test jednorodności wariancji Test Levene'a df1 df2 Istotność CENA ZAMÓWIONYCH PRODUKTÓW 4,399 2 27,022 CZAS SPĘDZONY NA KONSUMPCJI 3,559 2 27,042 WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI 4,430 2 27,022 Obawę o to, że istnieją istotne różnice między wariancjami wyników w trzech porównywanych grupach potwierdza test Levene a dla weryfikacji hipotezy o jednorodności (homogeniczności) porównywanych grup. Test ten okazał się statystycznie istotny w obrębie wszystkich analizowanych zmiennych. Oznacza to znaczące zaburzenie założenia o jednorodności wariancji we wszystkich porównywanych w procedurze jednoczynnikowej ANOVA grup. Co zatem można z tym zrobić, jak poradzić sobie z tym wynikiem? Rozwiązania są co najmniej dwa po pierwsze wydaje się, że ta większa wariancja w jednej grupie może wiązać się z występowaniem w danych jakiejś pojedynczej obserwacji odstającej, po drugie można założyć (jeśli jest to teoretycznie uzasadnione), że większa wariancja wyników w tej grupie jest uzasadniona i prowadzić dalej porównania z założeniem braku równości wariancji. Jak znaleźć ową obserwację odstającą? Wystarczy przeprowadzić analizę rozkładu częstości (patrz: Ryc. 4 i Ryc. 6 w punkcie 2) oddzielnie w każdej z porównywanych grup. Wymaga to jednak wskazania SPSSowi żądania, aby przeprowadził tę analizę oddzielnie w każdej z grup, można to zrobić klikając w DANE PODZIEL NA PODZBIORY. Ryc. 13 Karol Karasiewicz www.karasiewicz.az.pl 13
Następnie w otwartym oknie edytora podziału danych na podzbiory należy wskazać metodę najlepiej Porównaj grupy i wskazać zmienną wyróżniającą te grupy przenosząc MUZYKA do pola Grupy wyróżnione na podstawie. Ryc. 14 Gdy teraz przeprowadzimy analizę rozkładu częstości wyniki analizy będą przedstawione oddzielnie w każdej z grup. Zwłaszcza interesujące są histogramy rozkładu zmiennych, ponieważ one wydaje się najłatwiej pokazują istnienie obserwacji odstających lub wariancję wyników. Można na nich zauważyć, że w pierwszej grupie gości restauracji nie ma znaczących obserwacji odstających, a jeśli nawet są, to znajdują się na obu krańcach rozkładu i łącznie stanowią 30% liczebności tej grupy Sugeruje to raczej, że rzeczywiście wariancja wyników w grupie pierwszej gości spożywających posiłek w towarzystwie muzyki rockowej jest większa. Stąd też w dalszym postępowaniu przyjmiemy to założenie. Ryc. 15 Wróćmy zatem do wyników jednoczynnikowej ANOVA. Przyjęcie założenia o zróżnicowaniu wariancji wyników powoduje, że nie należy interpretować wyników testu Omnibus F jednoczynnikowej ANOVA, ponieważ nie jest spełnione leżące u ich podstaw założenie, że wariancje w grupach są jednorodne. Jednak dla celów dydaktycznych przyjrzyjmy się tej tabeli. Wyniki przeprowadzonej analizy są podzielone na kilka wierszy w związku z zaplanowaniem testu istotności trendu liniowego i kwadratowego w założonych danych. W pierwszym wierszu nazwanym Połączone znajdują się wyniki oszacowania ogólnego modelu. Innymi słowy w wierszu Połączone są oszacowania poziomu istotności dla hipotezy zerowej mówiącej o równości wszystkich średnich. W przypadku, gdyby nie założono żadnych kontrastów dla trendu, tylko ta hipoteza byłaby testowana i wskaźniki istotności dla składnika połączonego byłyby wyliczone. W wierszu Składnik liniowy kontrast i Składnik kwadratowy kontrast znajdują się oszacowania istotności dla założenia o istnieniu liniowej i kwadratowej zależności między zmienną niezależną i zależną. Ponownie należy przypomnieć testy te są prawdopodobnie w pewnym stopniu nieprecyzyjne (niedokładnie oszacowane) ze względu na niespełnienie warunku Karol Karasiewicz www.karasiewicz.az.pl 14
jednorodności wariancji w grupach. Jednak są tutaj analizowane wyłącznie dla celów dydaktycznych (poglądowych). Jednoczynnikowa ANOVA CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI Między grupami Wewnątrz grup Ogółem Między grupami Wewnątrz grup Ogółem Między grupami Wewnątrz grup Ogółem (Połączone) F Istotność 4,522,020 Składnik liniowy Kontrast 6,343,018 Odchylenie 2,702,112 Składnik kwadratowy Kontrast 2,702,112 (Połączone) 9,320,001 Składnik liniowy Kontrast 14,362,001 Odchylenie 4,277,048 Składnik kwadratowy Kontrast 4,277,048 (Połączone) 10,445,000 Składnik liniowy Kontrast 13,357,001 Odchylenie 7,534,011 Składnik kwadratowy Kontrast 7,534,011 Można zauważyć, że testy hipotez o równości średnich w porównywanych grupach odnośnie do wszystkich zmiennych okazują się statystycznie istotne, tzn. wskazują dają podstawę do przyjęcia, że średni czas konsumpcji (F(2;27)=9,320; p=0,001), średnia cena zakupu (F(2;27)=4,522; p=0,020) i średnia wydana w przeliczeniu na jedną minutę kwota (F(2;27)=10,445; p<0,001) są istotnie różne w zależności od tempa muzycznego. Jednocześnie testy trendów wskazują, że w odniesieniu do ceny zamówionych posiłków można zaobserwować istotny trend liniowy (F(1;27)=6,343; p=0,018), co oznacza iż cena zamówionego posiłku liniowo wzrasta wraz z tempem podkładu muzycznego im szybsze, tym droższe zamówienie. Natomiast w odniesieniu do czasu konsumpcji istotnym okazuje się równocześnie trend liniowy (F1;27)=14,362; p=0,001), jak i kwadratowy (F(1;27)=4,277; p=0,048). Można więc powiedzieć, że wyniki te wskazują, iż czas konsumpcji maleje wraz z tempem podkładu muzycznego, jednakże spadek ten nie ma charakteru iniowego, przy spokojniejszym podkładzie muzycznym (ballady rockowe i klasyczne przeboje) jest mniejszy, natomiast przy muzyce tanecznej większy. Wyniki analizy wydatku tzn. kwoty wydanej w przeliczeniu na jedną minutę wizyty są podobne do wyników analizy czasu wizyty. Gdzie istotnym okazuje się trend liniowy (F(1;27)=13,357; p=0,001) i kwadratowy F(1;27)=7,534; p=0,011). Bardziej rzetelną miarą testu hipotezy o równości wszystkich średnich w porównywanych grupach, gdy grupy te mogą być uznane za niehomogeniczne jest miara mocnych testów równości średnich bądź to testów Browna-Forsythe bądź też Wlelcha, przy czym testy Welcha są nieco bardziej konserwatywne i wiążą się z większym niż testy Browna-Forsythe błędem II rodzaju. Karol Karasiewicz www.karasiewicz.az.pl 15
Mocne testy równości średnich CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI Statystyka(a) df1 df2 Istotność Brown-Forsythe 4,522 2 18,116,026 Brown-Forsythe 9,320 2 18,773,002 Brown-Forsythe 10,445 2 14,566,002 a Asymptotyczny rozkład F Wszystkie testy równości średnich potwierdzają istotność różnic między średnimi wyniki jednoczynnikowej ANOVA również to ujawniały jednakże w porównaniu z wynikami jednoczynnikowej ANOVA poziom istotności okazuje się nieco niższy i (co za tym idzie) związek okazuje się nieco słabszy. Wszystko to z powodu zmniejszonej liczby stopni swobody dla różnic wewnątrzgrupowych (df2), które są wprowadzone dla poprawki ze względu na niehomogeniczność wariancji w porównywanych grupach. Kolejny wynik przedstawia tabela dotycząca testu niestandardowego kontrastu zaplanowanego przez nas obok kontrastów trendu. Pierwszą tabelą jest podsumowanie współczynników kontrastu dla testu. Jest to o tyle ważne, żeby nie pomylić się przy interpretacji kontrastu, gdy zdefiniowano więcej niż jeden kontrast. Współczynniki kontrastu PODKŁAD MUZYCZNY BALLADY KLASYCZNE MUZYKA Kontrast ROCKOWE PRZEBOJE TANECZNA 1-1 -1 2 Wyniki testu kontrastu są podzielone na dwa rodzaje test z założeniem równości wariancji i założeniem niejednorodności wariancji. Testy Levene a wskazują, że raczej należy przyjąć raczej założenie o braku równości wariancji. Przede wszystkim należy zauważyć, że test kontrastu dla braku równości wariancji ma inną (mniejszą) liczbę stopni swobody dokładnie tak, jak w teście t dla prób niezależnych. Wyniki testu kontrastu wskazują, że kontrast ten jest istotny statystycznie w odniesieniu do wszystkich zmiennych, tak w odniesieniu do ceny (t(19,721)=3,251; p=0,004), jak również w odniesieniu do czasu wizyty (t(20,127)=-4,688; p<0,001), czy wydatku na posiłek (t(19,431)=5,197; p<0,001). Testy kontrastu CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI Założenie o równości wariancji Brak założenia o równości wariancji Założenie o równości wariancji Brak założenia o równości wariancji Założenie o równości wariancji Brak założenia o równości wariancji Kontrast t df Istotność (dwustronna) 1 3,003 27,006 1 1 1 1 1 3,251 19,721,004-4,316 27,000-4,688 20,127,000 4,537 27,000 5,197 19,431,000 Karol Karasiewicz www.karasiewicz.az.pl 16
Ostatnim wreszcie wynikiem jest test porównań post hoc. Tabela ta przedstawia porównania wszystkich średnich parami Ballady Rockowe vs. Klasyczne Przeboje; Ballady Rockowe vs. Muzyka Taneczna i Klasyczne Przeboje vs. Muzyka Taneczna. Jednakże te porównania trzeba wyłuskać, ponieważ SPSS każde z porównań przeprowadza w obie strony Ballady Rockowe porównuje z Klasycznymi Przebojami a w innym miejscu Klasyczne Przeboje z Balladami Rockowymi. Dodatkowo wybór wielu metod porównań post hoc i prowadzenie ich dla wielu zmiennych (jak w niniejszym przykładzie) bardzo szybko powiększa tabelę i utrudnia jej analizę. W niniejszym przykładzie zalecaną metodą porównań post hoc wydaje się test T2 Tamhana, gdyż test ten, jako jedyny nie przyjmuje założenia o równości wariancji w grupach. Porównania wielokrotne Zmienna zależna (I) PODKŁAD MUZYCZNY (J) PODKŁAD MUZYCZNY Istotność CENA ZAMÓWIONYCH Test Tukey'a HSD BALLADY ROCKOWE KLASYCZNE PRZEBOJE PRODUKTÓW,985 MUZYKA TANECZNA,046 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,985 MUZYKA TANECZNA,032 MUZYKA TANECZNA BALLADY ROCKOWE,046 KLASYCZNE PRZEBOJE,032 Test NIR BALLADY ROCKOWE KLASYCZNE PRZEBOJE,871 MUZYKA TANECZNA,018 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,871 MUZYKA TANECZNA,012 MUZYKA TANECZNA BALLADY ROCKOWE,018 KLASYCZNE PRZEBOJE,012 Test Tamhane BALLADY ROCKOWE KLASYCZNE PRZEBOJE,998 MUZYKA TANECZNA,132 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,998 MUZYKA TANECZNA,006 Test t Dunnetta (>średnia kontrolna)(a) MUZYKA TANECZNA BALLADY ROCKOWE,132 KLASYCZNE PRZEBOJE,006 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,729 MUZYKA TANECZNA BALLADY ROCKOWE,017 * Różnica średnich jest istotna na poziomie.05. a Procedura testu t Dunnetta traktuje jedną z grup jako kontrolną i porównuje do niej wszystkie pozostałe grupy. W przytoczonej tabeli dla oszacowania różnic między średnimi cenami posiłku w porównywanych grupach można zaobserwować, jak różne testy post hoc przyjmując różne założenia pokazują różny poziom istotności a więc i siłę zależności) różnic między grupami. Np. można zauważyć, że różnice między średnimi cenami posiłków w grupie Ballady Rockowe i Klasyczne Przeboje oszacowana metodą NIR jest istotna z p=0,0,871, natomiast oszacowane metodą HSD Tukeya p=0,985, a metodą T2 Tmhane p=0,998. W przytoczonym przykładzie wszystkie testy wskazują na brak istotności różnic, natomiast widoczna jest różnica między poziomem istotności najmniej rygorystycznego z nich (NIR) i testami bardziej rygorystycznymi (HSD i T2), która czasem może decydować o przyjęciu lub odrzuceniu założenia o braku istotności różnic między porównywanymi średnimi. Podsumowując, raport z przeprowadzonej analizy na przykładzie ceny zamówionego posiłku mógłby wyglądać mniej więcej w następujący sposób: Karol Karasiewicz www.karasiewicz.az.pl 17
Wyniki przeprowadzonej analizy wariancji wskazują, że w odniesieniu do ceny zamówionego posiłku można przyjąć założenie, że jest ona różna w zależności od tempa podkładu muzycznego (F(2;18,115)=4,522; p=0,020), jednocześnie, gdy przyjąć, że różnice między tempem poszczególnych rodzajów muzyki jest równe, to związek między tempem podkładu muzycznego a średnią ceną spożywanego posiłku wydaje się mieć charakter liniowy (F(1;18,116)=6,343; p=0,021), jednakże (choć kontrast ten nie jest ortogonalny względem zadanego kontrastu liniowego) ujawnia się istotny statystycznie trend potęgowy (t(119,721)=3,251; p=0,004). Można zatem powiedzieć, że istnieje istotna statystycznie różnica między średnią ceną zamówionego posiłku przy muzyce tanecznej i przy innym podkładzie muzycznym, choć tempo podkładu muzycznego generalnie sprzyja wzrostowi ceny zamówionego posiłku. Karol Karasiewicz www.karasiewicz.az.pl 18