Analizę ANOVA wykorzystujemy do wykrycia różnic pomiędzy średnimi w więcej niż dwóch grupach/więcej niż w dwóch pomiarach JEDNOCZYNNIKOWA ANOVA porównania jednej zmiennej pomiędzy więcej niż dwoma grupami niezależnymi ANOVA Z POMIAREM POWTARZALNYM porównania między grupami zależnymi (skorelowanymi) (jedna grupa więcej niż dwa pomiary tej samej zmiennej) Czynnik to zmienna niezależna: - klasyfikacyjna (płeć, miejsce zamieszkania, kierunek/rok studiów, wiek, itp. ) = mówimy o korelacji, zróżnicowaniu - manipulacyjna (dawka leku, typ reklamy, rodzaj muzyki, presja, itp. ) = mówimy o wpływie 1
1. Czy studenci studiów licencjackich, magisterskich i doktoranckich mają rożne wyniki studiowania? 2. Czy wykształcenie różnicuje liczbę książek przeczytanych w roku? 3. Czy stacje telewizyjne przeznaczają różny czas na wyświetlanie reklamy? 4. Czy zadowolenie ze studiów zmienia się na każdym roku studiów? 5. Czy dawkowanie leku na trzy różne sposoby zmienia samopoczucie? 6. Czy poparcie dla rządu różni się w kolejnych latach sprawowania władzy? 7. Czy poziom cholesterolu zależy od rodzaju diety? 8. Czy BMI jest różne wśród osób uprawiających różne dyscypliny sportu? 9. Czy oglądanie przemocy w różnym nasileniu wpływa na poziom agresji? 10.Czy typ szkoły średniej różnicuje czas przeznaczany na naukę? 11.Czy poparcie dla partii X zależy od miejsca zamieszkania? 12.Czy poziom zadowolenia z pracy jest różny po kolejnych podwyżkach? 13.Czy bardziej lubimy piosenki, które znamy? 14.Czy trwałość produktów z poszczególnych partii jest różna? 15.Czy w poniedziałki zdarza się więcej wypadków niż w inne dni tygodnia? 16.Czy klienci różnych banków są różnie oszczędni? 17.Czy pracownicy we wszystkie dni tygodnia pracują z różną wydajnością? 18.Czy stosowanie różnych technik wpływu społecznego wpływa na gotowość zakupienia produktu 19.Czy w zależności od pory roku zmienia się gotowość zakupienia produktu 20. Czy korzystanie z różnych podręczników do nauki języka angielskiego prowadzi do różnych efektów nauczania JEDNOCZYNNIKOWA ANOVA porównania pomiędzy grupami niezależnymi Obliczamy statystykę F weryfikującą hipotezę zerową, że wszystkie średnie w porównywanych grupach są równe 2
Odchylenie pomiaru od średniej w całej grupie Suma kwadratów ogólna Suma kwadratów odchyleń pomiaru od średniej Suma wszystkich odległości pomiarów od średniej podniesionych do kwadratu Odchylenie pomiaru od średniej w poszczególnej grupie Suma kwadratów wewnątrzgrupowa Suma kwadratów wszystkich odchyleń od średnich w poszczególnych grupach Odchylenie średniej w poszczególnej grupie od średniej ogólnej Suma kwadratów międzygrupowa Suma odchyleń średniej w grupach od średniej ogólnej pomnożona przez odpowiednią liczbę elementów w grupie (tak jakby w grupach nie było zupełnie zróżnicowania, wszystkie pomiary równe) 5 Możemy policzyć wariancję uwzględniając wszystkie pomiary (bez podziału na grupy). Jest to tzw. wariancja całkowita (całkowite zróżnicowanie między wynikami) Jest to suma kwadratów/liczbę stopni swobody (n-1) (do kwadratu podnoszone są różnice między pomiarami w próbie a średnią dla całej prób) (wzór na wariancję w próbie ) Możemy policzyć wariancję w każdej grupie. W każdej grupie pomiary są zróżnicowane, a to zróżnicowanie wynika z losowości. Miarą tego zróżnicowania jest tzw. (1) wariancja wewnątrzgrupowa (wariancja błędu lub resztowa) Jest to suma kwadratów wewnątrz grup /liczbę stopni swobody (n-k) (do kwadratu podnoszone są różnice między każdym pomiarem a średnią w odpowiedniej grupie) Możemy policzyć również jak średnie wyliczone dla każdej grupy różnią się od średniej wyliczonej dla całej grupy. Średnie uzyskane dla grup również są zróżnicowane. To zróżnicowanie wynika z losowości (średnie uzyskane zostały z losowego pomiaru) oraz z efektu działania czynnika (o ile taki efekt występuje) Miarą tego zróżnicowania jest tzw. (2) wariancja międzygrupowa (wariancja wyjaśniona). Jest to suma kwadratów między grupami /liczba stopni swobody (k-1) (do kwadratu podnoszone są różnice między średnimi w grupach a średnią dla całej próby i przemnażane przez liczebność odpowiedniej grupy) Całkowite zróżnicowanie między wynikami = (1) Zróżnicowanie wewnątrzgrupowe + (2) różnicowanie międzygrupowe 3
Jeśli nie ma efektu oddziaływania to F=1, im większy efekt oddziaływania czynnika tym większe F Miara siły związku miedzy zmienną niezależna a zależną O,01 efekt mały (1% wyj. war.) 0,06 efekt przeciętny (6% wyj. war.) 0,14 efekt duży (14% wyj. war.) Procent wyjaśnionej wariancji (zmienność, którą możemy wyjaśnić działaniem czynnika) byłaby równa 100% jeśli nie byłoby żadnego zróżnicowania wynikającego z losowości, a całe zróżnicowanie pochodziłoby z działania czynnika. 4
Jeśli hipoteza zerowa została odrzucona (średnie nie są równe) to w dalszej części analiz przeprowadzamy testy wielokrotnych porównań post hoc/a posteriori Przy założeniu równości wariancji : Test T Tukey a Przy braku założenia o równości wariancji: Test T3 Dunnetta Nie jest konieczne wykonanie testu F, należy wykonać testy zaplanowanych porównań kontrastów/a priori Porównywane grupy powinny być wystarczająco duże (n>30) i równoliczne (układy zrównoważone) ponieważ wtedy tracą na znaczeniu założenia dotyczące rozkładu normalnego w porównywanych grupach i homogeniczności wariancji (patrz: wykład ANOVA) Homogeniczność (jednorodność) wariancji można testować testem Levene a Jeśli wariancje są różne można użyć do testowania założenia o równości średnich testu Browna-Forsythe a lub (bardziej konserwatywnego) testu Welcha (interpretacja wyniku taka sama) Jeśli wariancje są różne, a średnie i odchylenia w poszczególnych grupach są skorelowane (korelacja oznacza tu występowanie wartości odstających) można przeprowadzić przekształcenia zmiennych lub wykonać porównania z użyciem testów nieparametrycznych. 5