Analiza waiancji ANOVA (ANalyi Of VAiance) Analiza waiancji t paametyczne nazędzie pzwalające pównywać więcej niż dwie badane gupy wydzielne pzez kategie jednej zmiennej (analiza jednczynnikwa) lub wielu zmiennych (analiza wielczynnikwa). O niepaametycznych dpwiednikach już wpminaliśmy cza pznać mcniejzy, paametyczny tet. Ideą analizy waiancji jet pównywanie zpzenia (waiancji) zmiennej zależnej w analizwanych gupach wydzielnych ze względu na watści zmiennych niezależnych. Mżna bwiem pkazać (c zauważył R. Fihe), że więkza óżnica w śedniej watści zmiennej zależnej pmiędzy pównywanymi gupami pzekłada ię na więkzą waiancję międzygupwą (patz też: P.Fancuz, R.Mackiewicz, Liczby nie wiedzą kąd pchdzą, Wydawnictwa KUL, 005). P dbaniu zmiennych niezależnych, któych wpływ na zmienną zależną badacz chce analizwać (a więc ównież pdzieleniu póby na pdgupy ppzez watści tych zmiennych), badacz kntluje międzygupwą waiancję zmiennej zależnej i nie kntluje (nie zna źódła zmiennści zmiennej zależnej) w amach każdej z gup (waiancji wewnątzgupwej). Waiancja wewnątzgupwa, z uwagi, że analiza nie tłumaczy jej źódła, nazywana jet waiancją eztwą. Idea tetu plega na mżliwści zdekmpnwania waiancji całkwitej na umy waiancji kntlwanych (międzygupwych) i waiancję niekntlwaną (wewnątzgupwą; eztwą). iptezami analizy waiancji ą: l : = chć w paktyce (z uwagi na ptać hiptezy altenatywnej) znacza t, że l=,..., L l=,..., L l Oznaczenia: L ilść czynników w analizie waiancji (ilść zmiennych niezależnych), l - waiancja międzygupwa związana z czynnikiem l, - waiancja eztwa. ipteza zewa mówi, że waiancja międzygupwa związana z czynnikiem l jet niewiękza niż waiancja eztwa, a więc zmienna niezależna (czynnik l) w c najwyżej takim amym tpniu wpływa na zmiennść zmiennej zależnej jak wzytkie czynniki, któych w amach badania nie kntlwaliśmy. Tym amym, uznać mżna, że óżnice w waiancji pmiędzy gupami wydzielnymi ze względu na czynnik l ą na tyle nieznaczne, że mżna pzyjąć, że ą pzypadkwe. Ddatkw, kzytając z uwagi, któa ztała pczynina dnśnie elacji pmiędzy międzygupwymi waiancjami i takimi śednimi, uznać mżna, że śednie w gupach nie ą ittnie óżne. iptezy altenatywne t: l l=,..., L ipteza altenatywna implikuje pawtnny bza kytyczny. Mówi ównież, że waiancja międzygupwa związana z czynnikiem l jet więkza niż waiancja eztwa (niekntlwana), ą więc pdtawy, aby uważać czynnik l za czynnik mający wpływ na międzygupwe zóżnicwanie zmiennej zależnej, a więc ównież na ittne óżnice w śednich pmiędzy gupami.
Dwu- i wiel-czynnikwa analiza waiancji mżliwści ddatkwej analizy Dla pzypadku analizy waiancji, w któym zpatywany jet więcej niż jeden czynnik (ą c najmniej dwie zmienne niezależne; l ) mżemy ównież mówić wpływie inteakcji pzczególnych zmiennych niezależnych, a więc tym, czy w ittnie óżny pób (pamiętamy, że fmalnie chdzi waiancje, ale niefmalnie śednie) zmienna zależna zachwuje ię w pdgupach utwznych wpólnie pzez kategie zmiennych niezależnych. I tak pzykładw, dla dwóch zmiennych niezależnych (dla utalenia uwagi: A i B dajmy na t, że dpwiedni znaczają ne gupę wykztałcenie i płeć), ddatkwym wynikiem ANOVA-y będzie ittnść óżnic pmiędzy gupami twznymi pzez inteakcję kategii zmiennych (A i B pzykładwy pdział t mężczyźni z wykztałceniem pdtawwym): AB AB Dla tzech zmiennych niezależnych (A, B, C) ddatkwy wynik (4 ddatkwe wyniki) t ittnść óżnic pmiędzy kategiami twznymi pzez inteakcję (A z B), (A z C), (B z C) az (A z B i z C). AB AB, AC AC, BC BC az ABC ABC Dla więcej niż tzech zmiennych niezależnych ptępuje ię analgicznie. Również analgicznie wygląda am pce tetwania ittnści óżnic w pdgupach twznych pzez inteakcje kategii dwóch lub więcej zmiennych. Jednczynnikwa analiza waiancji Jet t najptzy pzypadek analizy waiancji (c nie znaczy, że jet n zadk wykzytywany w paktyce, węcz pzeciwnie). W jeg amach badacz zatanawia ię, czy itnieją óżnice w śednich watściach ciągłej zmiennej zależnej w pdgupach wydzielnych ze względu na watści jednej zmiennej niezależnej (znaczmy ją A) k kategiach. Od tny fmalnej, tetwany jet zetaw hiptez dtyczących waiancji: A A gdzie A t waiancja międzygupwa dla czynnika A, zaś - waiancja eztwa (wewnątzgupwa dla A, niekntlwana pzez badacza).
Statytyka tetwa pzyjmuje ptać: k ( x j x ) n j ( k ) j= F = F k n k n j k ( xij x j ) ( n k ) i= j= ~ (, ) gdzie n j i x j t dpwiedni liczebnści gup i ich śednie, zaś x jet śednią gólną zmiennej zależnej. Waunki twalnści jednczynnikwej analizy waiancji Analiza waiancji zalicza ię d gna tetów paametycznych. Żeby mżna był ją wyknać, muzą być pełnine natępujące załżenia (pdawane ą załżenia dla jednczynnikwej analizy waiancji (ne-way ANOVA)):. zkład zmiennej zależnej w analizwanych pdpóbkach jet zkładem nmalnym.. jedndnść waiancji pmiędzy pównywanymi gupami. 3. zmienna zależna miezna jet na kali c najmniej pzedziałwej. 4. analizwane gupy ą ównliczne (niektóe źódła pdają, że ich licznść nie pwinna óżnić ię więcej niż 0%). Jak już wiemy, bak mżliwści zatwania jednczynnikwej analizy waiancji nie jet czynnikiem uniemżliwiającym jakąklwiek analizę, a jedynie zmuza d zatwania niepaametyczneg dpwiednika tej analizy waiancji. Pzykład Aby zapezentwać pób wykzytania analizy waiancji, pzeanalizujmy natępujący pzykład: zbió danych tet.av zawiea infmacje dtyczące wyników badania wpływu na epndentów działania pewneg leku. Itniał pdejzenie, że lek ten pwduje zabuzenia umiejętnści ceny dległści, c w znamienny pób mże wpływać pzykładw na mżliwść pwadzenia pjazdów pzez zażywających g. Pddan więc badaniu tzy gupy: piewzej z nich nie pdan leku i ppzn jej człnków cenę dległści d utalneg pzedmitu zmienna dl. Duga gupa pzed ceną tej amej dległści dtała placeb (myśląc, że t lek), zaś tzecia zażyła mawiany lek. Jedynie gupa, któa dtała placeb ztała pinfmwana, że itnieje pdejzenie, że p zażyciu leku mżna pzezacwywać dległść, ppzn ją jednak, żeby w takcie ekpeymentu w mżliwie zetelny pób taała ię ją ceniać. Pzy kazji ekpeymentu, ptanwin jezcze zbadać czy lek wpływa na zdlnści umyłwe. W tym celu pddan uczetników dwóm pzeciętnie kmplikwanym tetm na zumienie tektu i lgiczne myślenie (w dugim teście za niepawidłwą dpwiedź tzymywał ię punkty ujemne) tak pwtały zmienne tet i tet. Uczetnicy ekpeymentu byli dbieali d gup lw, taan ię ównież całą póbę wybać pśód ób zbliżnych chaakteytykach. Głównym pytaniem, któe mżna bie ptawić w amach teg pblemu jet pytanie t, czy analizwany lek zeczywiście ma wje niepżądane właściwści. Pytanie t, ptawine w języku tatytyki bzmiałby: czy dane dają pdtawę d dzucenia hiptezy zewej ównści śednich cen dległściw pdppulacjach wydzielnych ze względu na watści zmiennej gupa?
Pnieważ ta tatnia zmienna dzieli póbę na tzy kategie, t nie mżna w tym pzypadku użyć tetu t. Zatanówmy ię nad pełnieniem załżeń analizy waiancji. P piewze analizwana zmienna jet ilściwa (miezna jet na kali ilazwej) t pzwala nam ealnie zważyć użycie analizy waiancji. Spawdźmy pztałe załżenia:. nmalnść zkładu w badanych pdgupach (tet Klmgva-Sminva): Nie mżna dzucić hiptez nmalnści zkładu zmiennej dl w każdej z gup.. jedndnść waiancji (tet Levene e): A więc waiancja jet jedndna. 3. ównlicznść gup: Czyli mżna uznać, że t załżenie ównież jet pełnine.
Mamy więc wzelkie pdtawy, żeby użyć ANOVA-y. T, że w tym pzypadku używamy jednczynnikwej analizy waiancji jet knekwencją teg, jet tylk jedna zmienna niezależna w nazej analizie (gupa). Wybiezmy: Analyze Cmpae Mean One-Way ANOVA: i wzućmy w dpwiednie miejca zmienną zależną i zmienną niezależną. Wyknywanie tetu Levene a jak ddatkwej czynnści tyle nie był ptzebne, że jeśli w knie One-Way ANOVA klikniemy ddatkw pzycik, t mżemy zażądać wyknania tetu Levene a zaznaczając:
A t wynik całej analizy waiancji: Pzepizmy wynik: F(, 379) = 06, 78, p < 0, 05. Mamy więc pdtawy, żeby pzy dwlnie pzyjętym pzimie ittnści dzucić hiptezę zewą i pzyjąć altenatywną, że w ittny tatytycznie pób śednie w gupach óżnią ię między bą. Dla pzypadku pównywania dwóch gup lub też w pzypadku, gdyby nie był pdtaw d dzucenia hiptezy zewej, każdy wynik jet jedncześnie kńcem analizy (bądź t z uwagi na t, że wiedząc ittnści óżnic dla dwóch gup jeteśmy w tanie utalić elacje pmiędzy śednimi, bądź t z uwagi na fakt, że twiedzenie baku óżnic jet już tatecznym wynikiem badania). Odzucenie hiptezy zewej w analizie waiancji nie tanwi jednak kńca tej analizy. Jet t jedynie infmacja tym, że pmiędzy analizwanymi gupami wytępują ittne tatytycznie óżnice w śedniej wielkści badanej zmiennej. Wynik nic jednak nie mówi któe gupy ię w ittny pób pmiędzy bą óżnią. Teetycznie w takim pzypadku mżna póbwać tetwać każdą paę (np. gupę placeb i gupę lek) bn, za pmcą tetu t, naażamy ię jednak wtedy na niebezpieczeńtw wielktneg tetwania (patz np. Jezy Mycielki, Skypt d eknmetii. Semet dugi, 008). Pblem ten związują tzw. tety pt hc, któe bią pd uwagę wielktnść pównań. D tetów tych zaliczamy m.in. tet LSD (Leat Significant Diffeence), Tuckey a, Sidaka az Bnfenieg. Mamy d nich dtęp w mmencie pecyfikwania ANOVA-y (Analyze Cmpae Mean One-Way ANOVA) p kliknięciu.
W wykakującym knie wybieamy pzykładw: I tzymujemy wynik:
Pzykładw póbujmy zintepetwać wynik tet LSD: Wynik pkazuje jak óżniła ię śednia pmiędzy pzczególnymi gupami. I tak śednia óżnica pmiędzy gupą kntlną i placeb wyniła,86763, zaś tet na jej ittnść daje wynik z p-value ównym 0,9. Nie ma więc pdtaw d dzucenia hiptezy zewej ównści śednich w tych gupach. Pównując jednak gupę lek i placeb, widzimy, że śednia óżnica w wynikach (63,86486) jet ittna tatytycznie (p-value niedóżnialne d zea). D pdbnych wników dzlibyśmy pównując gupę kntlną i lek. Intepetacja wyniku Nazym zadaniem był dpwiedzieć na pytanie, czy lek, pdejzewany zabuzanie zetelnści ceny dległści (pzezacwywanie jej) zeczywiście ma takie działanie. Wynikiem pzepwadznej analizy waiancji jet, że śednie ceny dległści d teg ameg pzedmitu óżnią ię ittnie pmiędzy gupami (kntlną, placeb i lek). Tet(y) pt hc dkywają ddatkw, któe gupy w ittny pób ię pmiędzy bą óżnią. Okazuje ię, że by, któe zażyły lek zeczywiście ceniały badaną dległść na więkzą niż w zeczywitści była. Nie mżna upawiedliwić teg efektem wmówienia uczetnikwi ekpeymentu, że p pdaniu leku będzie pzezacwywał tę dległść, gdyż by, któe pzyjęły placeb nie ppełniały ytematycznych błędów. ZADANIE Czy lek lub świadmść pzyjęcia g (efekt placeb) miał wpływ na wynik tetu? ZADANIE Czy lek lub świadmść pzyjęcia g (efekt placeb) miał wpływ na wynik tetu? ZADANIE3 Otwóz zbió danych cime. Dane piane ą w pliku cime_pi.pdf. Czy mżna pzyjąć, że zecznictw ądwe w USA (ameykańkie dane) na pzetzeni lat 98-87 w knekwentny pób adza każnych w więzieniach (czyli, że pawdpdbieńtw tzymania wyku w więzieniu jet śedni zecz biąc takie am na pzetzeni mawianych lat pbpi )? A jak ię pawa ma ze kutecznścią tóżów pawa (z pawdpdbieńtwem bycia aeztwanym pba )? ZADANIE4 ( cime ) Czy na pzetzeni la 98-87 pacwnicy zatudniani pzez Pańtw dtawali pdwyżki?
Dwuczynnikwa analiza waiancji W tym pzypadku analizy waiancji zatanawiamy ię, czy pób kztałtwania ię zmiennej zależnej zależy d watści dwóch zmiennych dyketnych pwiedzmy A i B, któe mają dpwiedni a i b pzimów. Obazw mówiąc, gdybyśmy zapiali A i B dpwiedni w wiezach i klumnach tabeli kzyżwej, t mglibyśmy mówić efektach wiezwych (związanych p ptu z pzimami zmiennej A) az efektach klumnwych (związanych z pzimami zmiennej B). Dwuczynnikwa analiza waiancji, pócz badania wytępwania efektów wiezwych i efektów klumnwych daje nam jednak ównież mżliwść pzeanalizwania łączneg wpływu zmiennych A i B na zmienną zależną, czyli pzeanalizwania ich inteakcji (gupę w takim pzypadku tanwi każda paa pzimów A i B). Tetwane więc będą tzy główne zetawy hiptez: A A az B B az AB AB dpwiedni, za pmcą natępujących tatytyk tetwych: A F ~ (, ) ( A) = F a N a b B F ~ (, ) ( B) = F b N a b AB F( AB) = ~ F ( a )( b ), N a b ( ) Pzykład Spóbujmy zbudwać analizę z ppzednieg pzykładu (baza danych tet.av ). Pwiedzmy, że ą pzełanki, żeby twiedzić, że lek inaczej wpływa na zabuzanie ceny dległści wśód kbiet i inaczej wśód mężczyzn. Odpwiedź na tak zadane pytanie mże być udzielna z wykzytaniem dwuczynnikwej ANOVA-y. Głównymi wynikami analizy dla teg pzypadku pwinny być: efekty wiezwe (dajmy na t, że ą ne związane ze zmienną gupa: czy cena dległści jet śedni taka ama w gupie kntlnej, gupie placeb i lek), efekty klumnwe (związane ze zmienną płeć: czy cena dległści jet śedni taka ama w gupie kbiet i mężczyzn wynik, któy tzymamy niejak ddatkw ) az efekty związane z inteakcją (mówiące, czy śednia cena dległści zależy d pdziału gupa-płeć).
Pzepwadźmy analizę: Analyze Geneal Linea Mdel Univaiate: P kliknięciu, mżemy wyłączyć z analizy tałą (epezentująca wpólny paamet płżenia dla wzytkich bewacji). Mżemy ównież dwlnie wypecyfikwać mdel, tak żeby pzykładw nie zawieał efektu wiezweg, klumnweg lub/i związaneg z inteakcją.
Jak klikniemy, t pjawia ię kn, w któym mżemy wybać tety pt hc: Tetu pt hc dla zmiennej płeć nie ma enu wyknywać, gdyż zmienna ta piada jedynie dwie kategie. Wyknajmy tateczną analizę: W wyniku widzimy, że ittne ą efekty związane z gupą az z płcią. Ittny jet ównież naz mdel analizy waiancji jak całść (efekty wiezwe, klumnwe i inteakcyjne ą łącznie ittne). Nieittny kazał ię być jednak łączny wpływ płci i gupy na cenę dległści. Intepetacja wyniku Pnieważ ittne ą efekty wiezwe i klumnwe, t zmienne gupa i płeć dzielą póbę na pdpóby, w któych epndenci w ittnie óżny ze tatytyczneg punktu widzenia pób ceniali dległść d utalneg pzedmitu. I tak, w pzypadku płci, z uwagi, że piada na tylk dwie kategie, wytaczy pjzeć na śednią cenę dległści w pdgupach:
żeby twiedzić, że kbiety ceniają tę dległść na śedni więkzą. Żeby cenić zdiagnzwany wpływ zmiennej gupa na dległść, z uwagi na t, że piada na tzy kategie, należy kzytać z wyników tetu pt hc: Intepetując wyniki tetu pt hc djdziemy d pdbnych wników, d jakich dzliśmy już pzy jednczynnikwej analizie waiancji. Otatnim wynikiem, p depawaniu indywidualneg wpływu gupy i płci, jet bak ddatkwej zależnści związanej z inteakcją tych zmiennych i ceną dległści. Wnikwać z teg mżna, że analizwany lek nie wpływa inaczej na kbiety i na mężczyzn w kntekście ceny dległści d analizwaneg pzedmitu. UWAGA! W zaadzie w dwuczynnikwej analizie waiancji ównież waiancje pmiędzy póbami pwinny być jedndne az badana zmienna pwinna w nich mieć zkład nmalny, w liteatuze mówi ię jednak mżliwściach łagdzenia tych ganiczeń. ZADANIE5 Otwóz dane ana_wa i pzepwadź dwuczynnikwą analizę waiancji, gdzie zmienna zależna t cza ptzebny na związanie zadania ( cza ), zaś zmienne niezależne t pzim zaptzebwania na tymulacje ( tymulacja ) i pzim teu ( te ). Pzepwadź pdbną analizę dla ilści pjzeń na zegaek ( pjzenia ). ZADANIE6 Otwóz dane machine. Spawdź jak ilść pduktu wytwazaneg pzez każdą z mazyn ( utput ) zależy d amej mazyny ( machine ) i by bługującej mazynę ( peat ).