Zadanie 1: Skompletuj poniższą tablicę analizy wariancji dwutorowej. Źródło SS? Wariancja? A 1828,09 2 MSFA=914,045? B 1102,34 3 =367,447 17,09? 88,91??? Błąd? 12??? 3277,34 23?? Rozwiązanie powyższego zadania polega na wpisaniu (lub usunięciu) niektórych symboli i wartości liczbowych. Korzystać w tym celu będziemy ze standardowej postaci tablicy ANOVA (patrz np. str. 51 tab. 2.10). A zatem, - w pierwszej kolumnie: zastępujemy pierwszy znak? przez czynnik AB, a drugi znak? przez słowa łącznie, - w drugiej kolumnie korzystamy z podstawowej równości analizy wariancji dwutorowej: SST = SSFA + SSFB + SSAB + SSE i wpisujemy zamiast znaku? wartość 258 otrzymując: 3277,34 = 1828,09 + 1102 + 88,91 + 258, - w trzeciej kolumnie podobną równość otrzymujemy dla stopni swobody. Stąd, pierwszy pytajnik zastępujemy oznaczeniem stopni swobody (najczęściej jest to df ), a drugi pytajnik liczbą 6 otrzymując: 2 + 3 + 6 + 12 = 23, - w czwartej kolumnie znajdują się odpowiednie wariancje związane z poszczególnymi źródłami zmienności. A zatem, po pierwsze uzupełniamy drugi wiersz o symbol MSFA, po drugie wyliczamy wartość wariancji dla oddziaływania łącznego (dzieląc 88,91 SSAB przez odpowiadającą mu liczbę stopni swobody): MSAB = = 14, 81, oraz 6 258 dla błędu: MSE = = 21, 5, po trzecie: ostatni pytajnik usuwamy, jako że 12 sumowanie podobne do sum z poprzedniej kolumny nie zachodzi, - w ostatniej kolumnie zawarte są wartości statystyki F-Snedecora. A zatem jej MSFA MSAB nagłówek to najczęściej litera F, a dalej wartości: = 42, 51, = 0, 69. MSE Dwa ostatnie pytajniki usuwamy. A zatem uzupełniona tablica będzie miała następującą postać: MSE Źródło SS Df Wariancja F A 1828,09 2 MSFA =914,045 42,51 B 1102,34 3 MSFB =367,447 17,09 AB 88,91 6 MSAB =14,81 0,69 Błąd 258 12 MSE =21,5 Łącznie 3277,34 23 Zadanie 2: Analizowano trzy metody karmienia kurczaków: 1, 2 i 3, które używano od momentu wylęgu do momentu uboju otrzymując następujące wyniki dotyczące wagi ubojowej:
Metody karmienia 1 2 3 1,42 1,24 1,40 1,12 1,28 0,96 1,32 1,36 0,92 1,06 1,34 1,20 1,46 1,24 1,42 a) używając powyższych danych dowieść, że występują znaczące różnice w wadze ubojowej kurcząt karmionych według różnych metod, b) dokonać 95% estymacji różnicy średnich w wadze ubojowej pomiędzy metodami 2 i 3, c) rozwiązać problem z punktu a) stosując analizę rangową. a) Chcąc dowieść znaczących różnic w wadze ubojowej kurcząt karmionych różnymi metodami przyjmiemy jako czynnik różnicujący wagę kurcząt metodę karmienia i zastosujemy analizę wariancji. Mamy tutaj do czynienia z jednoczynnikową analizą wariancji, której standardowa postać tablicy wyników przedstawiona zastała w tab. 2.2. Aby otrzymać tablicę analizy wariancji dla tego problemu użyjemy arkusza kalkulacyjnego Excel. Dane wpisujemy do arkusza a następnie uruchamiamy analizę wariancji jednoczynnikową - wybieramy na pasku narzędziowym: Narzędzia Analiza danych Analiza wariancji: jednoczynnikowa: Stawiamy następujące hipotezy: H 0 : (wartości średnie poszczególnych grup są sobie równe); przeciwko hipotezie alternatywnej: H 1 : (nie wszystkie wartości średnie poszczególnych grup są sobie równe).
Wyniki są następujące: Analiza wariancji: jednoczynnikowa PODSUMOWANIE Grupy Licznik Suma Średnia Wariancja 1 5 6,46 1,292 0,01512 2 5 5,62 1,124 0,04168 3 5 6,66 1,332 0,01252 ANALIZA WARIANCJI Źródło warian SS df MS F Wartość-p Test F Pomiędzy g 0,121813 2 0,060907 2,635892 0,112477 3,88529 W obrębie 0,27728 12 0,023107 Razem 0,399093 14 A zatem: nie mamy podstaw do odrzucenia hipotezy zerowej o tym, że nie występują znaczące różnice w wadze ubojowej kurcząt karmionych według różnych metod. Wniosek: metody karmienia nie mają wpływu na wagę ubojową kurcząt. b) Obliczmy na początek różnice średnich wag ubojowych kurcząt karmionych metodą drugą i trzecią: - waga średnia dla metody drugiej wynosi (dane zawarte są w powyższej tabeli analizy wariancji): 1,124, - dla metody trzeciej: 1,332 Stawiamy hipotezy: H 0 : średnie wagi kurcząt karmionych metodą drugą i trzecią nie różnią się, oraz H 1 : średnie wagi kurcząt karmionych metodą drugą i trzecią są istotnie różne. Aby zweryfikować powyższą hipotezę użyjemy dwustronnego testu t-studenta o równości średnich. Ponownie użyjemy arkusza kalkulacyjnego Excel - Narzędzia Analiza danych test t z dwiema próbkami zakładający równe wariancje: Test t: z dwiema próbami zakładający równe wariancje 2 3 Średnia 1,124 1,332 Wariancja 0,04168 0,01252 Obserwacje 5 5 Wariancja sumaryczna 0,0271 Różnica średnich wg hipotezy 0 df 8 t Stat -1,99778475 P(T<=t) jednostronny 0,04039651 Test T jednostronny 1,85954832 P(T<=t) dwustronny 0,08079302 Test t dwustronny 2,30600563
Wartość obliczona prawdopodobieństwa prawdziwości hipotezy zerowej dla testu dwustronnego wynosi 0,0808. Ponieważ zazwyczaj używamy poziomu istotności α = 0, 05 to, w tym przypadku nie mamy podstaw do odrzucenia hipotezy zerowej. Ponieważ użyliśmy tutaj testu t-studenta zakładającego równość wariancji zweryfikujmy zatem to założenie. Stawiamy hipotezy: H 0 : wariancje obu grup są równe, przeciwko hipotezie alternatywnej H 1 : wariancje obu grup są różne. Hipotezę zerową zweryfikujemy przy pomocy testu F-Snedecora. Ponownie w arkuszu Excel uruchamiamy - Narzędzia Analiza danych test F z dwiema próbkami, otrzymując: Test F: z dwiema próbami dla wariancji 2 3 Średnia 1,124 1,332 Wariancja 0,04168 0,01252 Obserwacje 5 5 df 4 4 F 3,32907348 P(F<=f) jednostronny 0,13542629 Test F jednostronny 6,38823394 Widzimy, że prawdopodobieństwo prawdziwości hipotezy zerowej wynosi 0,1354 (większe od α = 0, 05, a zatem wcześniejsze założenie o równości wariancji może być utrzymane. Wniosek: średnie wagi kurcząt karmionych metodą drugą i trzecią nie różnią się istotnie. c) Przekształćmy najpierw dane z zadania w tablicę rangową. Najmniejsza zaobserwowana wartość wagi kurczęcia wynosi 0,92. Ta zatem wartość otrzymuje rangę 1. Następna w kolejności zaobserwowana waga wynosi 0,96. Otrzymuje zatem rangę 2. Postępując tak dalej otrzymujemy poniższą tablicę rang (podobnie do tab. 2.5): Metody karmienia rangi 1 2 3 13,5 6,5 12 4 8 2 9 11 1 3 10 5 15 6,5 13,5 T 1 =40 T 2 =26 T 3 =50 Stawiamy hipotezę zerową: mediany poszczególnych grup są równe; przeciwko hipotezie alternatywnej, że nie wszystkie równości zachodzą i stosujemy test Kruskala-Wallisa: c 12 T H = n( n + 1) j = 1 n 2 j j 3( n + 1)
2 Otrzymujemy wyliczona wartość testu równą 3,12. Test ten ma rozkład χ z 2 stopniami swobody, o wartości krytycznej dla α = 0, 05 wynoszącej (ponownie odczytujemy to z arkusza excelowskiego: Wstaw funkcje statystyczne ROZKŁAD.T.ODW.): 4,3026. Ponieważ wartość krytyczna jest większa bezwzględnie od wartości testu obliczonej, zatem nie ma podstaw do odrzucenia hipotezy o równości median. Wniosek: także i w tym przypadku potwierdziliśmy, że metody karmienia nie mają wpływu na wagę ubojową kurcząt. Zadanie 3: Badano szybkość czytania tekstów napisanych przy pomocy różnych krojów pisma. Tekst napisany przy użyciu czterech różnych czcionek został w sposób losowy przeczytany przez pięciu czytelników. Czas czytania zanotowano i przedstawiono w następującej tabeli: Czytelnicy 1 2 3 4 5 Rodzaj czcionki 1 15 18 13 21 15 2 19 19 16 22 15 3 13 20 14 21 16 4 11 18 12 17 12 a) czy rodzaj czcionki ma wpływ na szybkość czytania? b) czy czytelnicy czytają z rózną prędkością teksty pisane różnymi czcionkami? a) Ponownie użyjemy analizy wariancji jednotorowej (jednoczynnikowej) zawartej w arkuszu Excel, pamiętając, że tym razem grupowanie danych odbywa się wierszami. Analiza wariancji: jednoczynnikowa PODSUMOWANIE Grupy Licznik Suma Średnia Wariancja 1 5 82 16,4 9,8 2 5 91 18,2 7,7 3 5 84 16,8 12,7 4 5 70 14 10,5 ANALIZA WARIANCJI Źródło warian SS df MS F Wartość-p Test F Pomiędzy g 45,75 3 15,25 1,498771 0,252885 3,238867 W obrębie 162,8 16 10,175 Razem 208,55 19
Ponieważ obliczona wartość prawdopodobieństwa istotności (Wartość-p) wynosi 0,252885, to nie mamy podstaw do odrzucenia hipotezy zerowej na poziomie istotności α = 0, 05, która w tym przypadku mówiła o równości średnich prędkości czytania dla różnych czcionek. Wniosek: krój czcionki nie ma wpływu na prędkość czytania statystycznego czytelnika. b) Ponownie uruchamiamy analizę wariancji jednoczynnikową, tym razem grupując dane kolumnami. Otrzymujemy: Analiza wariancji: jednoczynnikowa PODSUMOWANIE Grupy Licznik Suma Średnia Wariancja 1 4 58 14,5 11,66667 2 4 75 18,75 0,916667 3 4 55 13,75 2,916667 4 4 81 20,25 4,916667 5 4 58 14,5 3 ANALIZA WARIANCJI Źródło warian SS df MS F Wartość-p Test F Pomiędzy g 138,3 4 34,575 7,382562 0,001706 3,055568 W obrębie 70,25 15 4,683333 Razem 208,55 19 Tym razem hipotezy zerowej o równym tempie czytania przez różnych ludzi różnych tekstów odrzucić nie mamy prawa (Wartość-p wynosi 0,0001706 i jest mniejsza od α = 0, 05). Wniosek (dosyć oczywisty): ludzie teksty czytają z różnymi prędkościami. Uwaga: czytelnik powinien przedyskutować ewentualną konieczność randomizacji bloków związaną z różnymi rodzajami czcionek. Zadanie 4. Badano wpływ efektu treningu w zarządzaniu wśród kadry kierowniczej pewnej firmy. W tym celu rozpatrzono wpływ dwóch czynników: czynnika A posiadanie lub nie treningu kierowniczego, oraz czynnik B wpływ sytuacji stresowej na podejmowanie decyzji. Badaniu poddano 16 decydentów różnego szczebla, z których 8 poddano treningowi kierowniczemu. Wyniki przedstawione w poniższej tabeli odzwierciedlają osiągnięte rezultaty mierzone w pewnej umownej skali. Czynnik A Czynnik B Z treningiem Bez treningu Sytuacja standardowa Sytuacja stresowa 85 91 80 78 76 67 82 53 49 38 45 40 52 46
71 39 a) czy trening wpływa na podwyższenie zdolności kierowniczej kadry zarządzającej w tej firmie? b) czy kadra ta lepiej sprawuje się w sytuacji stresowej czy też bezstresowej? c) jakie jest oddziaływanie łączne obu czynników? d) proszę sporządzić właściwy raport dla zarządu firmy. Analysis of Variance for Col_1 - Type I Sums of Squares Source Sum of Squares Df Mean Square F-Ratio P-Value MAIN EFFECTS A:Col_2 4489,0 1 4489,0 117,49 0,0000 B:Col_3 132,25 1 132,25 3,46 0,0875 INTERACTIONS AB 56,25 1 56,25 1,47 0,2483 RESIDUAL 458,5 12 38,2083 TOTAL (CORRECTED) 5136,0 15 All F-ratios are based on the residual mean square error. The StatAdvisor --------------- The ANOVA table decomposes the variability of Col_1 into contributions due to various factors. Since Type I sums of squares have been chosen, the contribution of each factor is measured having removed the effects of factors above it in the table. The P-values test the statistical significance of each of the factors. Since one P-value is less than 0,05, this factor has a statistically significant effect on Col_1 at the 95,0% confidence level. Z przedstawionego wydruku programu Statgraph Plus znajdujemy, że tylko czynnik A (brak lub nie treningu kadry) jest czynnikiem różnicującym obserwacje. Fakt, że sytuacje mogą być standardowe lub stresowe nie ma wpływu istotnego na wyniki. Podobnie zauważamy, że brak jest oddziaływania łącznego. A zatem, odpowiadając na postawione w zadaniu pytania stwierdzamy: a) trening wpływa na zdolność kierowniczą badanej kadry, b) kadra ta sprawuje się jednakowo w sytuacji stresowej i standardowej, c) oddziaływanie łączne obu czynników nie występuje d) raport dla zarządu firmy powinien zawierać wymienione powyżej wnioski, lecz jego pełne stworzenie pozostawiamy czytelnikowi.