(Wykład 13) Jednoczynnikowa analiza wariancji Wnioskowanie dla jednoczynnikowej ANOV-y Format danych Hipotezy i model ANOVA Tabela ANOVA i test F Porównywanie poszczególnych średnich
Jednoczynnikowa ANOVA Interesują nas są wartości zmiennej ilościowej, np. poziomu cholesterolu. Porównujemy zmienność w kilku grupach z zmiennością pomiędzy grupami, aby ocenić, czy grupy różnią się znacznie. To jest Analiza Variancji = ANOVA Grupy będą etykietowane jedną zmienną jakościową, np. płcią: jednoczynnikowa ANOVA.
Typowe dane Czas gojenia rany po różnych zabiegach. Płace różnych grup etnicznych w firmie. Żywotność różnych marek opon. Jeśli zmienna kategoryczna ma tylko 2 wartości, ANOVA jest równoważna dwustronnemu testowi t. ANOVA pozwala jednak na 3 lub więcej grup.
Przypomnijmy: dwie populacje, nieznane wariancje populacji H 0 : μ 1 = μ 2 przeciwko H a : μ 1 μ 2 σ 1, σ 2 nieznane. Statystyka t: Jeżeli n 1 =n 2 =n, to t 2 = n(x 1 x 2 ) 2 s 1 2 +s 1 2. Uogólnimy ten iloraz. t x x 1 2 s n s n 2 2 1 2 1 2
Średnia redukcja cholesterolu w trzech grupach terapeutycznych.
Porównaj zmienność wewnątrz i pomiędzy grupami Badanie graficzne: jednoczesne wykresy pudełkowe wiele histogramów Istotność różnic między grupami zależy od: różnicy średnich odchylenia standardowego każdej grupy rozmiarów prób
Wykresy pudełkowe dla grup. Czy średnie są znacząco różne??
Zredukowana zmienność w każdej grupie. Różnice w średnich są bardziej wiarygodne.
Hypotezy w ANOV-ie ANOVA testuje następujące hipotezy: H 0 : Średnie wszystkich grup są równe. H a : Nie wszystkie środki są równe. Nie mówi, jak i które średnie się różnią. Kontroluje "wielokrotne porównania". "Grupa" oznacza "podpopulację". Dla danych "grupa" oznacza "podpróbę".
n = liczba osób łącznie I = liczba grup x Notacja dla ANOV-y = (wielka) średnia dla wszystkich danych i-ta grupa ma: n i = # jednostek (w grupie i) x ij = wartość dla jednostki j (w grupie i) x j = średnia próbkowa (dla grupy i) s i = próbkowe odchylenie standardowe (dla grupy i)
Model ANOV-y x ij i ij, where ij independen t with distributi on N(0, ) µ i oznacza (nieznane) średnie populacji dla grupy i σ jest (nieznanym) odchyleniem standardowym, o którym zakładamy, że jest takie samo dla wszystkich grup.
Szacowanie parametrów populacji: Reguła do badania odchyleń standardowych dla ANOV-y: Jeśli największe s jest mniejsze niż dwukrotność najmniejszego s, to możemy bezpiecznie zakładać, że σ jest stała wśród grup (i używać ANOV-y). Łączone odchylenie standardowe s s, where s p 2 p ( n 1) s... ( n 1) s 2 2 2 1 1 I I p ( n1 1)... ( ni 1)
Jednoczynnikowa ANOV-a. Hipotezy: H 0 : 1 = 2 = 3 = = I H a : Nie wszystkie średnie są równe.
SD rozkładów są takie same, różnica jest tylko w średnich.
Przykład: Przeanalizujemy 3 grupy dzieci w wieku przedszkolnym przed i po zastosowaniu różnych technik nauczania.
Wstępne pytanie naukowe: Czy grupy były podobne pod względem umiejętności czytania przed instrukcją? Symbolicznie: Czy średnie 1, 2, 3 są równe? H 0 : 1 = 2 = 3 H a : Nie wszystkie średnie są równe.
Boxploty czytania ze zrozumieniem "przed rozpoczęciem nauczania.
Normalny wykres kwantylowy dla grupy Basal przed rozpoczęciem nauczania
Normalny wykres kwantylowy dla grupy DRTA przed rozpoczęciem nauczania
Normalny wykres kwantylowy dla grupy Strat przed rozpoczęciem nauczania
Podsumowanie dla każdej grupy. Czy grupy istotnie różnią się od siebie?
Dlaczego nie skorzystać z wielu testów t? Wielokrotne porównania (tutaj 3) między wszystkimi parami grup zwiększają prawdopodobieństwo fałszywego odrzucenia hipotezy zerowej. Szacowanie odchylenia standardowego (σ): technika ANOVA wykorzystuje wszystkie informacje zawarte w danych i zwykle zapewnia wyższą precyzję. Użyjemy ANOV-y i testu F. F=Fisher.
ANOVA table. Three categories of calculations: within, between, total. Three things to calculate: SS, df, MS. We will use computer output (homework and exams). Zmienność DF Stopnie swobody SS Sumy kwadratów MS Średnie kwadraty Pomiędzy Grupami Wewnątrz grup (tzw. Error) I-1 z danych SSG/DFG n-i z danych SSE/DFE Łącznie (Total) n-1 z danych SST/DFT
Wzory (nie zapamiętuj): SSG n ( x x) groups SSE ( n 1) s groups SST ( x x) obs ij i i i 2 2 i 2 Note: SST=SSG+SSE, DFT=DFG+DFE.
Wyjście ANOVA w SAS
Statystyka testowa: F-test F s = MSG/MSE. Przy H 0, F s ma rozkład F z DFG, DFE. W Tabeli E znajdujemy P-wartości dla F s Degrees of freedom in the numerator" = DFG. Degrees of freedom in the denominator" = DFE. Duże wartości F s odrzucają H 0.
Krzywa gęstości rozkładu F. p F s
Ćwiczenie: Sprawdź wynik ANOV-y i P-wartość testu F.
Wniosek: Badane grupy uczniów szkół podstawowych nie różniły się istotnie (P = 0,33) w wynikach czytania przed instruktażem. Oznacza to również, że późniejsze różnice wynikają z zastosowanych metod nauczania. Ważne: że SD dla grup były podobne.
Współczynnik determinacji: R 2 =SSG/SST Pokazuje, jaka część całkowitej zmienności wynika z różnic między grupami. Tutaj tylko 3%. Na wyjściu SAS: R-square Podobna rola jak z r 2 w regresji liniowej.
Pytanie naukowe: Po miesiącach nauki według trzech różnych metod, w każdej klasie podano inny test czytania. Wynik będzie oznaczony jako COMP. Czy metody różnią się skutecznością? (= Czy populacje różnią się po instruktażu?) Hipotezy:
Podsumowanie wyników czytania po instruktażu:
Wyjście SAS dla zmiennej COMP:
Wniosek:
Uwagi: Czy możemy bardziej konkretnie sformułować wnioski? DRTA i Strat to nowe methody (o wspólnej filozofii). Basal to metoda standardowa.
Kontrasty: Rozważmy: H 0 : ½( D + S )= B H a : ½( D + S )> B i dalszy problem: H 0 : D = S H a : D S Uwaga: Kontrasty powinny wyrażać pytanie z góry przyjęte w badaniu naukowym.
Contrasts: Contrast: a, where a. Sample contrast: c a x. SE s a / n 2 c p i i i i i i i 2 0 Dla testowania H 0 : ψ = 0, użyj t-testu t=c/se c z df=dfe. H A może być jednostronna lub dwustronna. CI: c±t * SE c
Przykład: Czy nowe metody są lepsze niż tradycyjna? Znajdź PU dla średniej poprawy.
Przykłąd: Która z nowych metod jest lepsza? Znajdź PU dla różnicy średnich.
Wyjście SAS-a The GLM Procedure Dependent Variable: COMP Contrast DF Contrast SS Mean Square F Value Pr > F Compare 1st with 2nd & 3rd group 1 291.0303030 291.0303030 7.30 0.0088 Compare 2nd with 3rd group 1 66.2727273 66.2727273 1.66 0.2020
Uwagi Uzasadnij, że F(1,df)=(t df ) 2. Dla dwóch próbek o równej wielkości n, F s = n(x 1 x ) 2 +n(x 2 x ) 2 [(n 1)s 1 2 +(n 1)s1 2 ]: 2n 2 =... Użyj wyjścia SAS, aby sprawdzić wcześniej obliczone testy t dla kontrastów. Tutaj df = DFE = 63.
Wielokrotne porównań: Gdy H 0 jest odrzucone, chcemy wiedzieć, które pary średnich się różnią. Podczas gdy (z góry przyjęte) kontrasty mogą być badane niezależnie od H 0, wielokrotne porównania są wykonywane tylko po odrzuceniu H 0. x x t t t 1 1 sp n n i j ** ij, if ij,declare means i, j different i j
Wybór t ** dla wielokrotnych porównań Korekta Bonferroniego: aby szansa na fałszywe odrzucenie któregokolwiek z testów k była nie większa niż (α = 0.05), użyj use t ** =t * (DFE, α/k). Minimalna znacząca różnica (MSD) - podobnie jak próg odrzucenia. MSD ** 1 1 t sp n n i j
Równoczesne przedziały ufności: 1 1 CI for is x x t ** s i j i j p n n i j Interpretacja (dla pojedynczego porównania albo dla wszystkich różnic) zależy od wyboru t **.
Założenie, że σ jest stała, można zweryfikować za pomocą normalnego wykresu kwantylowego:
Dane wyjściowe programu Excel (dla innego problemu):