Rozwiązanie: MSFA MSAB

Podobne dokumenty
Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

Rozdział 8. Regresja. Definiowanie modelu

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Testy nieparametryczne

Testy post-hoc. Wrocław, 6 czerwca 2016

Matematyka i statystyka matematyczna dla rolników w SGGW

Wykład 3 Hipotezy statystyczne

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna dla leśników

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Elementy statystyki STA - Wykład 5

Zadanie 1. Analiza Analiza rozkładu

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Analizy wariancji ANOVA (analysis of variance)

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Zadania ze statystyki cz.8. Zadanie 1.

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

166 Wstęp do statystyki matematycznej

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Analiza wariancji i kowariancji

Wydział Matematyki. Testy zgodności. Wykład 03

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA 1

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Metody Statystyczne. Metody Statystyczne

Wykład 9 Testy rangowe w problemie dwóch prób

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Analiza wariancji - ANOVA

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Statystyka w analizie i planowaniu eksperymentu

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Testowanie hipotez statystycznych.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Ekonometria. Zajęcia

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Zawartość. Zawartość

Przykład 1. (A. Łomnicki)

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Zadania ze statystyki, cz.6

WNIOSKOWANIE STATYSTYCZNE

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

Statystyka i Analiza Danych

Analiza wariancji. dr Janusz Górczyński

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

TABLICE PODSTAWOWYCH ROZKŁADÓW PRAWDOPODOBIEŃSTWA. T4. Tablica kwantyli rozkładu chi-kwadrat (I część - poziomy kwantyli 0,5)

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Prawdopodobieństwo i rozkład normalny cd.

Statystyka matematyczna

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

(LMP-Liniowy model prawdopodobieństwa)

Testowanie hipotez statystycznych.

Statystyka matematyczna i ekonometria

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Transkrypt:

Zadanie 1: Skompletuj poniższą tablicę analizy wariancji dwutorowej. Źródło SS? Wariancja? A 1828,09 2 MSFA=914,045? B 1102,34 3 =367,447 17,09? 88,91??? Błąd? 12??? 3277,34 23?? Rozwiązanie powyższego zadania polega na wpisaniu (lub usunięciu) niektórych symboli i wartości liczbowych. Korzystać w tym celu będziemy ze standardowej postaci tablicy ANOVA (patrz np. str. 51 tab. 2.10). A zatem, - w pierwszej kolumnie: zastępujemy pierwszy znak? przez czynnik AB, a drugi znak? przez słowa łącznie, - w drugiej kolumnie korzystamy z podstawowej równości analizy wariancji dwutorowej: SST = SSFA + SSFB + SSAB + SSE i wpisujemy zamiast znaku? wartość 258 otrzymując: 3277,34 = 1828,09 + 1102 + 88,91 + 258, - w trzeciej kolumnie podobną równość otrzymujemy dla stopni swobody. Stąd, pierwszy pytajnik zastępujemy oznaczeniem stopni swobody (najczęściej jest to df ), a drugi pytajnik liczbą 6 otrzymując: 2 + 3 + 6 + 12 = 23, - w czwartej kolumnie znajdują się odpowiednie wariancje związane z poszczególnymi źródłami zmienności. A zatem, po pierwsze uzupełniamy drugi wiersz o symbol MSFA, po drugie wyliczamy wartość wariancji dla oddziaływania łącznego (dzieląc 88,91 SSAB przez odpowiadającą mu liczbę stopni swobody): MSAB = = 14, 81, oraz 6 258 dla błędu: MSE = = 21, 5, po trzecie: ostatni pytajnik usuwamy, jako że 12 sumowanie podobne do sum z poprzedniej kolumny nie zachodzi, - w ostatniej kolumnie zawarte są wartości statystyki F-Snedecora. A zatem jej MSFA MSAB nagłówek to najczęściej litera F, a dalej wartości: = 42, 51, = 0, 69. MSE Dwa ostatnie pytajniki usuwamy. A zatem uzupełniona tablica będzie miała następującą postać: MSE Źródło SS Df Wariancja F A 1828,09 2 MSFA =914,045 42,51 B 1102,34 3 MSFB =367,447 17,09 AB 88,91 6 MSAB =14,81 0,69 Błąd 258 12 MSE =21,5 Łącznie 3277,34 23 Zadanie 2: Analizowano trzy metody karmienia kurczaków: 1, 2 i 3, które używano od momentu wylęgu do momentu uboju otrzymując następujące wyniki dotyczące wagi ubojowej:

Metody karmienia 1 2 3 1,42 1,24 1,40 1,12 1,28 0,96 1,32 1,36 0,92 1,06 1,34 1,20 1,46 1,24 1,42 a) używając powyższych danych dowieść, że występują znaczące różnice w wadze ubojowej kurcząt karmionych według różnych metod, b) dokonać 95% estymacji różnicy średnich w wadze ubojowej pomiędzy metodami 2 i 3, c) rozwiązać problem z punktu a) stosując analizę rangową. a) Chcąc dowieść znaczących różnic w wadze ubojowej kurcząt karmionych różnymi metodami przyjmiemy jako czynnik różnicujący wagę kurcząt metodę karmienia i zastosujemy analizę wariancji. Mamy tutaj do czynienia z jednoczynnikową analizą wariancji, której standardowa postać tablicy wyników przedstawiona zastała w tab. 2.2. Aby otrzymać tablicę analizy wariancji dla tego problemu użyjemy arkusza kalkulacyjnego Excel. Dane wpisujemy do arkusza a następnie uruchamiamy analizę wariancji jednoczynnikową - wybieramy na pasku narzędziowym: Narzędzia Analiza danych Analiza wariancji: jednoczynnikowa: Stawiamy następujące hipotezy: H 0 : (wartości średnie poszczególnych grup są sobie równe); przeciwko hipotezie alternatywnej: H 1 : (nie wszystkie wartości średnie poszczególnych grup są sobie równe).

Wyniki są następujące: Analiza wariancji: jednoczynnikowa PODSUMOWANIE Grupy Licznik Suma Średnia Wariancja 1 5 6,46 1,292 0,01512 2 5 5,62 1,124 0,04168 3 5 6,66 1,332 0,01252 ANALIZA WARIANCJI Źródło warian SS df MS F Wartość-p Test F Pomiędzy g 0,121813 2 0,060907 2,635892 0,112477 3,88529 W obrębie 0,27728 12 0,023107 Razem 0,399093 14 A zatem: nie mamy podstaw do odrzucenia hipotezy zerowej o tym, że nie występują znaczące różnice w wadze ubojowej kurcząt karmionych według różnych metod. Wniosek: metody karmienia nie mają wpływu na wagę ubojową kurcząt. b) Obliczmy na początek różnice średnich wag ubojowych kurcząt karmionych metodą drugą i trzecią: - waga średnia dla metody drugiej wynosi (dane zawarte są w powyższej tabeli analizy wariancji): 1,124, - dla metody trzeciej: 1,332 Stawiamy hipotezy: H 0 : średnie wagi kurcząt karmionych metodą drugą i trzecią nie różnią się, oraz H 1 : średnie wagi kurcząt karmionych metodą drugą i trzecią są istotnie różne. Aby zweryfikować powyższą hipotezę użyjemy dwustronnego testu t-studenta o równości średnich. Ponownie użyjemy arkusza kalkulacyjnego Excel - Narzędzia Analiza danych test t z dwiema próbkami zakładający równe wariancje: Test t: z dwiema próbami zakładający równe wariancje 2 3 Średnia 1,124 1,332 Wariancja 0,04168 0,01252 Obserwacje 5 5 Wariancja sumaryczna 0,0271 Różnica średnich wg hipotezy 0 df 8 t Stat -1,99778475 P(T<=t) jednostronny 0,04039651 Test T jednostronny 1,85954832 P(T<=t) dwustronny 0,08079302 Test t dwustronny 2,30600563

Wartość obliczona prawdopodobieństwa prawdziwości hipotezy zerowej dla testu dwustronnego wynosi 0,0808. Ponieważ zazwyczaj używamy poziomu istotności α = 0, 05 to, w tym przypadku nie mamy podstaw do odrzucenia hipotezy zerowej. Ponieważ użyliśmy tutaj testu t-studenta zakładającego równość wariancji zweryfikujmy zatem to założenie. Stawiamy hipotezy: H 0 : wariancje obu grup są równe, przeciwko hipotezie alternatywnej H 1 : wariancje obu grup są różne. Hipotezę zerową zweryfikujemy przy pomocy testu F-Snedecora. Ponownie w arkuszu Excel uruchamiamy - Narzędzia Analiza danych test F z dwiema próbkami, otrzymując: Test F: z dwiema próbami dla wariancji 2 3 Średnia 1,124 1,332 Wariancja 0,04168 0,01252 Obserwacje 5 5 df 4 4 F 3,32907348 P(F<=f) jednostronny 0,13542629 Test F jednostronny 6,38823394 Widzimy, że prawdopodobieństwo prawdziwości hipotezy zerowej wynosi 0,1354 (większe od α = 0, 05, a zatem wcześniejsze założenie o równości wariancji może być utrzymane. Wniosek: średnie wagi kurcząt karmionych metodą drugą i trzecią nie różnią się istotnie. c) Przekształćmy najpierw dane z zadania w tablicę rangową. Najmniejsza zaobserwowana wartość wagi kurczęcia wynosi 0,92. Ta zatem wartość otrzymuje rangę 1. Następna w kolejności zaobserwowana waga wynosi 0,96. Otrzymuje zatem rangę 2. Postępując tak dalej otrzymujemy poniższą tablicę rang (podobnie do tab. 2.5): Metody karmienia rangi 1 2 3 13,5 6,5 12 4 8 2 9 11 1 3 10 5 15 6,5 13,5 T 1 =40 T 2 =26 T 3 =50 Stawiamy hipotezę zerową: mediany poszczególnych grup są równe; przeciwko hipotezie alternatywnej, że nie wszystkie równości zachodzą i stosujemy test Kruskala-Wallisa: c 12 T H = n( n + 1) j = 1 n 2 j j 3( n + 1)

2 Otrzymujemy wyliczona wartość testu równą 3,12. Test ten ma rozkład χ z 2 stopniami swobody, o wartości krytycznej dla α = 0, 05 wynoszącej (ponownie odczytujemy to z arkusza excelowskiego: Wstaw funkcje statystyczne ROZKŁAD.T.ODW.): 4,3026. Ponieważ wartość krytyczna jest większa bezwzględnie od wartości testu obliczonej, zatem nie ma podstaw do odrzucenia hipotezy o równości median. Wniosek: także i w tym przypadku potwierdziliśmy, że metody karmienia nie mają wpływu na wagę ubojową kurcząt. Zadanie 3: Badano szybkość czytania tekstów napisanych przy pomocy różnych krojów pisma. Tekst napisany przy użyciu czterech różnych czcionek został w sposób losowy przeczytany przez pięciu czytelników. Czas czytania zanotowano i przedstawiono w następującej tabeli: Czytelnicy 1 2 3 4 5 Rodzaj czcionki 1 15 18 13 21 15 2 19 19 16 22 15 3 13 20 14 21 16 4 11 18 12 17 12 a) czy rodzaj czcionki ma wpływ na szybkość czytania? b) czy czytelnicy czytają z rózną prędkością teksty pisane różnymi czcionkami? a) Ponownie użyjemy analizy wariancji jednotorowej (jednoczynnikowej) zawartej w arkuszu Excel, pamiętając, że tym razem grupowanie danych odbywa się wierszami. Analiza wariancji: jednoczynnikowa PODSUMOWANIE Grupy Licznik Suma Średnia Wariancja 1 5 82 16,4 9,8 2 5 91 18,2 7,7 3 5 84 16,8 12,7 4 5 70 14 10,5 ANALIZA WARIANCJI Źródło warian SS df MS F Wartość-p Test F Pomiędzy g 45,75 3 15,25 1,498771 0,252885 3,238867 W obrębie 162,8 16 10,175 Razem 208,55 19

Ponieważ obliczona wartość prawdopodobieństwa istotności (Wartość-p) wynosi 0,252885, to nie mamy podstaw do odrzucenia hipotezy zerowej na poziomie istotności α = 0, 05, która w tym przypadku mówiła o równości średnich prędkości czytania dla różnych czcionek. Wniosek: krój czcionki nie ma wpływu na prędkość czytania statystycznego czytelnika. b) Ponownie uruchamiamy analizę wariancji jednoczynnikową, tym razem grupując dane kolumnami. Otrzymujemy: Analiza wariancji: jednoczynnikowa PODSUMOWANIE Grupy Licznik Suma Średnia Wariancja 1 4 58 14,5 11,66667 2 4 75 18,75 0,916667 3 4 55 13,75 2,916667 4 4 81 20,25 4,916667 5 4 58 14,5 3 ANALIZA WARIANCJI Źródło warian SS df MS F Wartość-p Test F Pomiędzy g 138,3 4 34,575 7,382562 0,001706 3,055568 W obrębie 70,25 15 4,683333 Razem 208,55 19 Tym razem hipotezy zerowej o równym tempie czytania przez różnych ludzi różnych tekstów odrzucić nie mamy prawa (Wartość-p wynosi 0,0001706 i jest mniejsza od α = 0, 05). Wniosek (dosyć oczywisty): ludzie teksty czytają z różnymi prędkościami. Uwaga: czytelnik powinien przedyskutować ewentualną konieczność randomizacji bloków związaną z różnymi rodzajami czcionek. Zadanie 4. Badano wpływ efektu treningu w zarządzaniu wśród kadry kierowniczej pewnej firmy. W tym celu rozpatrzono wpływ dwóch czynników: czynnika A posiadanie lub nie treningu kierowniczego, oraz czynnik B wpływ sytuacji stresowej na podejmowanie decyzji. Badaniu poddano 16 decydentów różnego szczebla, z których 8 poddano treningowi kierowniczemu. Wyniki przedstawione w poniższej tabeli odzwierciedlają osiągnięte rezultaty mierzone w pewnej umownej skali. Czynnik A Czynnik B Z treningiem Bez treningu Sytuacja standardowa Sytuacja stresowa 85 91 80 78 76 67 82 53 49 38 45 40 52 46

71 39 a) czy trening wpływa na podwyższenie zdolności kierowniczej kadry zarządzającej w tej firmie? b) czy kadra ta lepiej sprawuje się w sytuacji stresowej czy też bezstresowej? c) jakie jest oddziaływanie łączne obu czynników? d) proszę sporządzić właściwy raport dla zarządu firmy. Analysis of Variance for Col_1 - Type I Sums of Squares Source Sum of Squares Df Mean Square F-Ratio P-Value MAIN EFFECTS A:Col_2 4489,0 1 4489,0 117,49 0,0000 B:Col_3 132,25 1 132,25 3,46 0,0875 INTERACTIONS AB 56,25 1 56,25 1,47 0,2483 RESIDUAL 458,5 12 38,2083 TOTAL (CORRECTED) 5136,0 15 All F-ratios are based on the residual mean square error. The StatAdvisor --------------- The ANOVA table decomposes the variability of Col_1 into contributions due to various factors. Since Type I sums of squares have been chosen, the contribution of each factor is measured having removed the effects of factors above it in the table. The P-values test the statistical significance of each of the factors. Since one P-value is less than 0,05, this factor has a statistically significant effect on Col_1 at the 95,0% confidence level. Z przedstawionego wydruku programu Statgraph Plus znajdujemy, że tylko czynnik A (brak lub nie treningu kadry) jest czynnikiem różnicującym obserwacje. Fakt, że sytuacje mogą być standardowe lub stresowe nie ma wpływu istotnego na wyniki. Podobnie zauważamy, że brak jest oddziaływania łącznego. A zatem, odpowiadając na postawione w zadaniu pytania stwierdzamy: a) trening wpływa na zdolność kierowniczą badanej kadry, b) kadra ta sprawuje się jednakowo w sytuacji stresowej i standardowej, c) oddziaływanie łączne obu czynników nie występuje d) raport dla zarządu firmy powinien zawierać wymienione powyżej wnioski, lecz jego pełne stworzenie pozostawiamy czytelnikowi.