Analiza wariancji Źródło: Aczel A. D. Statystyka w zarządzaniu
Analiza wariancji jednoczynnikowa
Populacja Pole trójkąty 4 5 3 7 4 8 kwadraty 0 3 4 3 kółka 3 3
Populacja Pole trójkąty 4 5 3 7 4 8 SUMA 4 Średnia 6 kwadraty 0 SUMA Średnia 3 4 3 kółka SUMA 3 3 Średnia
Średnie w populacjach Populacja Pole trójkaty 4 5 3 7 4 8 SUMA 4 Średnia 6 kwadraty 0 3 4 3 SUMA 46 Średnia,5 kółka 3 3 SUMA 6 Średnia
Wariancje w populacjach Populacja Pole trójkaty 4-4 5-3 7 4 8 4 SUMA 4 0 Średnia 6 x x ( x x) 3,333 MAX kwadraty 0 -,5,5-0,5 0,5 3 0,5 0,5 4 3,5,5 SUMA 46 5 Średnia,5,667 kółka - 0 0 3 3 SUMA 6 Średnia MIN
Test Bartlett a równości wariancji ( ) ZAŁ.: k populacji o rozkładach normalnych N µ, δ Liczność prób: n i, i =,,..., k i i H 0... H : : δ = δ = = δ k Nie wszystkie wariancje są równe.
Χ =,303 ( ) k ( ) n k log sˆ n i log sˆ i c i= -rozkład Χ ( k ) gdzie: n = n i= n i sˆ = n k k i= ( n ) ˆ i s i k ( ) k = + + c 3 k i= ni n k c = = + 3 k + ( n k ) gdy n =... nk,
Obszar krytyczny testu:
Test Bartlett a równości wariancji ( ) ZAŁ.: k populacji o rozkładach normalnych N µ, δ Liczność prób: n i, i =,,..., k i i H 0... H : : δ = δ = = δ k Nie wszystkie wariancje są równe. Χ =,303 c k ( n k) log sˆ ( ) log ˆ = 0, 68 i= n i s i 0,68 < Χ 0 =,05 ( ) 5, 99 Nie ma podstaw do odrzucenia hipotezy o równości wariancji. H 0
Analiza wariancji jednoczynnikowa H 0 : µ = µ =... = µ r H : Nie wszystkie średnie są równe. F = MSTr MSE -rozkład F-Snedecora o (r-,n-r) stopniach swobody gdzie: MSTr MSE - średnie odchylenie kwadratowe między populacjami - średnie odchylenie kwadratowe błędu losowego Obszar krytyczny testu:
Średnia w populacji (i) x i = n i j n x i ij Średnia z całej próby x r i= = n i j n x ij
Suma odchyleń kwadratowych od średnich w populacjach SSE = r n ( i x ) ij xi i= j= Średnie odchylenie kwadratowe od średnich w populacjach MSE = = r i= SSE n r Suma odchyleń kwadratowych między populacjami SSTr n i ( x x ) Średnie odchylenie kwadratowe od średnich między populacjami MSTr i SSTr = r
x ( x ) ( ) x i x Populacja Pole ij x i ij x i x i trójkaty 4-4 6 0,86 5-6 0,86 3 7 6 0,86 4 8 4 6 0,86 kwadraty 0 -,5,5,5,076-0,5 0,5,5,076 3 0,5 0,5,5,076 4 3,5,5,5,076 kółka - 4,099 0 0 4,099 3 3 4,099 SUMA 76 SSE= 7 SSTr 59,909 średnia n= 6,909 x SSE 7 MSE = = 59,9 = = 79, 95 n r 8 = SSTr r MSTr = MSE 79,95,5 MSSTr F = = 37, 6
Analiza wariancji jednoczynnikowa H H : µ = = 0 : µ µ 3 Nie wszystkie średnie są równe. F = MSTr MSE = 79,95,5 = 37,6 Poziom istotności testu α = 0, 05 Wartość krytyczna F (3-,-3)=4,46 0,05 37,6 > 4,46 -> odrzucamy hipotezę o równości średnich
Test Tuckeya jednorodności dla jednakowych liczebności w grupach Statystyka testowa dla róŝnic studentyzowanych T ( r, n r ) α = q α MSE n i Wnioskowanie: x i x j > < T T α α ( r, n r) ( r, n r) średnie średnie rózne równe
Test Tuckeya jednorodności dla róŝnych liczebności w grupach Statystyka testowa dla róŝnic studentyzowanych T ( r, n r ) α = q α MSE min ( ) n i Wnioskowanie: x i x j > < T T α α ( ) r, n r ( r, n r) średnie średnie rózne równe
Test Tuckeya jednorodności dla jednakowych liczebności w grupach Statystyka testowa dla róŝnic studentyzowanych T α MSE,5 ( r, n r ) = q = 4,04 = 3, 4 α n i 3 Wnioskowanie: x x x ko ko kw x xt x kw t = 9,5 > 3,4 pola rózne = 4 > 3,4 pola rózne = 5,5 > 3,4 pola rózne
Test Tuckeya jednorodności
Analiza wariancji dwuczynnikowa (z n powtórzeniami)
LOKALIZACJA (A) MARKA (B) I II III Centrum 4 3 35 39 8 3 43 33 36 Peryferia 7 9 7 3 3 6 3 5 Źródło: Mercik J., Szmigiel Cz. Ekonometria Cena produktu w zaleŝności od lokalizacji sklepu i firmy produkcyjnej
Test Hartley a równości wariancji ZAŁ.: k populacji o rozkładach normalnych Liczność prób: n = n =... = nk = n 5 N ( µ, δ ) i i H 0... H : : δ = δ = = δ k Nie wszystkie wariancje są równe. H = Sˆ Sˆ max min -rozkład H (n,k- ) Obszar krytyczny testu:
wariancje sˆi LOKALIZACJA (A) FIRMA (B) I II III Centrum 4 6,33 4,33 Peryferia 7 4,33 4 H H 0 : δ = δ = δ3 = δ = δ = δ 3 : Nie wszystkie wariancje są równe. H = S S 7 4 max = = min,75 Wartość krytyczna H (6,3-)=66 0,05,75 < 66 -> nie ma postaw do odrzucenia hipotezy o równości wariancji UWAGA: n<5!
Test Bartlett a równości wariancji ( ) ZAŁ.: k populacji o rozkładach normalnych N µ, δ Liczność prób: n i, i =,,..., k i i H 0... H : : δ = δ = = δ k Nie wszystkie wariancje są równe.
Χ =,303 ( ) k ( ) n k log sˆ n i log sˆ i c i= -rozkład Χ ( k ) gdzie: n = n i= n i sˆ = n k k i= ( n ) ˆ i s i k ( ) k = + + c 3 k i= ni n k c = = + 3 k + ( n k ) gdy n =... nk,
LOKALIZACJA (A) FIRMA (B) I II III Centrum 4 6,33333 4,33333 Peryferia 7 4,33333 4 wariancje sˆi k = n k ( n i ) sˆ = 4, 99 ˆ i i= s Χ =,303 c k ( n k) log sˆ ( ) log ˆ =, 03 i= n i s i < Χ 0 =,05 ( 5), 07 Nie ma podstaw do odrzucenia hipotezy o równości wariancji. H 0
Obszar krytyczny testu:
ANALAZA WARIANCJI DWUCZYNNIKOWA a liczba poziomów czynnika A, b liczba poziomów czynnika B, n liczba obserwacji w klasie. xijk k - ta obserwacja dla poziomu i czynnika A oraz poziomu j czynnika B
Wpływ czynnika A na wartość oczekiwaną badanej cechy. H 0... µ H : µ.. = µ.. = = a.. : Nie wszystkie powyŝsze równości zachodzą. Wpływ czynnika B na wartość oczekiwaną badanej cechy. H 0... µ H : : µ.. = µ.. = =. b. Nie wszystkie powyŝsze równości zachodzą. Łączny wpływ czynników A i B na wartość oczekiwaną badanej cechy. H : µ 0. = µ. =... = µ ab. = 0 H : Nie wszystkie powyŝsze równości zachodzą.
X = a i b j n k abn X ijk - wartość średnia dla wszystkich obserwacji, X i.. = b j n k bn X ijk - wartość średnia dla poziomu i czynnika A, X. j. = a i n k an X ijk - wartość średnia dla poziomu j czynnika B, X ij. = n k X n ijk - wartość średnia dla poziomu i czynnika A oraz dla poziomu j czynnika B.
LOKALIZACJA (A) MARKA (B) I II III Centrum 4 3 35 39 8 3 43 33 36 4,00 30,67 34,33 35,33 Peryferia 7 9 7 3 3 6 3 5 8,00,33 5,00 4,78 34,50 6,00 9,67 30,06
SST = SSA+ SSB + SSAB + SSE gdzie: SST = a b n i= j= k= ( ) X X ijk - łączna suma kwadratów odchyleń, SSA = bn ( a ) X i.. X i= - suma kwadratów odchyleń dla czynnika A, SSB = an ( b ( ) X. j. X j= - suma kwadratów odchyleń dla czynnika B, SSAB = n a b ( X ij. X i.. X. j. + X ) i= j= - suma kwadratów odchyleń dla interakcji AxB, SSE = a b n ( X ) ijk X ij. i= j= k= - suma kwadratów odchyleń dla błędu.
SST SSA 3 3 = i= j= k= a = bn i= ( ) X ijk X = ( 4 30,05) + ( 3 30,05) +... + ( 5 30,05) = 79, 94 ( ) [( ) ( ) ] X i X = 3 3 35,33 30,05 + 4,78 30,05 50, 39.. = SSB = an b j= ( ) X X = [ ( ) + ( ) + ( ) ] 3 34,50 30,05 6,00 30,05 9,67 30,. j. 05 = 3 SSAB a b = n i= j= ( ) X X X + X = ij. i.. [( ) ( ) ] 4,00 35,33 34,50 + 30,05 +... + 5,00 4,78 9,67 + 30,05 = 3, 44. j. SSE 3 3 = ( ) X ijk X ij. = ( 4 4) + ( 39 4) +.. + ( 5 5) = 60 i= j= k =
Źródło zmienności Suma kwadratów odchyleń Liczba stopni swobody Średnie odchylenie kwadratowe Wartość statystyki F-Snedecora Czynnik A SSA a- Czynnik B SSB b- Interakcja SSAB (a-)(b-) Błąd SSE ab(n-) SSA MSA = a SSB MSB = b MSAB = SSE MSE = ab SSAB a b ( )( ) ( n ) MSA F = MSE F = MSB MSE MSAB F = MSE Suma SST abn-
Źródło zmienności Lokalizacja (A) Suma kwadratów odchyleń Liczba stopni swobody Średnie odchylenie kwadratowe Statystyka F- Snedecora Istotnoś ć F 50,39 50,39 00,8 ~0,000 Marka (B) 8, 09,06,8 0,000 Interakcja 3,44 6,7,34 0,973 Błąd 60 5 Całkowita 79,94 7
Obszar krytyczny.
Łączny wpływ lokalizacji i marki (A x B) na wartość oczekiwaną ceny. H : µ = µ = = µ... 0.. 3. H : Nie wszystkie powyŝsze równości zachodzą. F =, 34 <,05 (, ) 3, 89 F 0 = Nie ma podstaw do odrzucenia hipotezy H 0 o braku łącznego wpływu lokalizacji i marki na cenę.
45,00 40,00 35,00 30,00 5,00 0,00 5,00 0,00 5,00 0,00 I II III Centrum Peryferia średnia
H µ = H :.. µ.. Wpływ lokalizacji (A) na wartość oczekiwaną ceny. 0 :.. µ.. F = 00, 8 > F (, ) = 4, 75 0,05 Odrzucamy hipotezę H 0 na korzyść hipotezy Lokalizacja sklepu ma wpływ na cenę. H
Wpływ marki (B) na wartość oczekiwaną ceny. H : µ = µ = µ 0.....3. H : zachodzą. Nie wszystkie powyŝsze równości F =, 8 > F (, ) = 3, 89 0,05 H H Odrzucamy hipotezę 0 na korzyść hipotezy Marka ma wpływ na cenę.
45,00 40,00 35,00 30,00 5,00 0,00 5,00 0,00 5,00 0,00 Centrum Peryferia I II III średnia
Obliczenia w Excelu
Analiza wariancji dwuczynnikowa PRZYKŁAD INTERAKCJI
POLE FIGURA KOLOR (A) (B) 4 trójkąt czerwony 5 trójkąt czerwony 7 trójkąt czarny 8 trójkąt czarny 0 kwadrat czarny kwadrat czarny kwadrat czarny 3 kwadrat czerwony koło czerwony koło czerwony 3 koło czarny
Table of Least Squares Means for Col_ with 95,0 Percent Confidence Intervals ------------------------------------------------------------------------------ Stnd. Lower Upper Level Count Mean Error Limit Limit ------------------------------------------------------------------------------ GRAND MEAN 6,58333 Col_ ko³o 3,5 0,43303,369 3,363 kwadrat 4,5 0,353553 0,59,4088 trójk¹t 4 6,0 0,353553 5,096 6,90884 Col_3 czarny 5 7,0 0,333333 6,434 7,85686 czerwony 6 6,6667 0,88675 5,446 6,90873 Col_ by Col_3 ko³o czarny 3,0 0,70707,83 4,8768 ko³o czerwony,5 0,5 0,4706,7859 kwadrat czarny 0,5 0,5 9,47,7853 kwadrat czerwony,5 0,5,47 3,7853 trójk¹t czarny 7,5 0,5 6,47 8,7859 trójk¹t czerwony 4,5 0,5 3,47 5,7859 ------------------------------------------------------------------------------ The StatAdvisor --------------- This table shows the mean Col_ for each level of the factors. It also shows the standard error of each mean, which is a measure of its sampling variability. The rightmost two columns show 95,0% confidence intervals for each of the means. You can display these means and intervals by selecting Means Plot from the list of Graphical Options.
Analysis of Variance for Col_ - Type III Sums of Squares -------------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value -------------------------------------------------------------------------------- MAIN EFFECTS A:Col_ 45,0 7,5 45,00 0,0000 B:Col_3,7857,7857 3,57 0,74 INTERACTIONS AB 3,0 6,5 3,00 0,004 RESIDUAL,5 5 0,5 -------------------------------------------------------------------------------- TOTAL (CORRECTED) 76,909 0 -------------------------------------------------------------------------------- All F-ratios are based on the residual mean square error. The StatAdvisor --------------- The ANOVA table decomposes the variability of Col_ into contributions due to various factors. Since Type III sums of squares (the default) have been chosen, the contribution of each factor is measured having removed the effects of all other factors. The P-values test the statistical significance of each of the factors. Since P-values are less than 0,05, these factors have a statistically significant effect on Col_ at the 95,0% confidence level.
Interaction Plot 5 Col_3 czarny czerwony Col_ 9 6 3 0 ko³o kwadrat trójk¹t Col_
ANOVA dla danych zblokowanych w kwadrat łaciński Dzień tygodnia Sklep 3 4 5 Poniedziałek B C A D E Wtorek A D C E B Środa C E B A D Czwartek D B C E A Piątek E A D B C Źródło: Aczel A. D. Statystyka w zarządzaniuc Rodzaj reklamy
ANOVA dla danych zblokowanych
DANE ZBLOKOWANE W KWADRAT ŁACIŃSKI Dzień tygodnia Sklep S S S3 S4 S5 Poniedziałek B C A D E Wtorek A D C E B Środa C E B A D Czwartek D B E C A Piątek E A D B C Źródło: Aczel A. D. Statystyka w zarządzaniuc Rodzaj reklamy
Dzień tygodnia Sklep S S S3 S4 S5 Poniedziałek B=5 C=4 A=6 D=4 E=3 Wtorek A=7 D=3 C=5 E= B=4 Środa C=4 E=3 B=4 A=8 D=4 Czwartek D=3 B=5 E=4 C=5 A=7 Piątek E=3 A=7 D=3 B=6 C=5 SprzedaŜ
Dzień tygodnia Sklep SprzedaŜ w dniach tygodnia S S S3 S4 S5 SUMA Poniedziałek 5 4 6 4 3 Wtorek 7 3 5 4 Środa 4 3 4 8 4 3 Czwartek 3 5 4 5 7 4 Piątek 3 7 3 6 5 4 SprzedaŜ w sklepach (SUMA) 5 3 4 SprzedaŜ ogółem
Dzień tygodnia Sklep S S S3 S4 S5 Poniedziałek B=5 C=4 A=6 D=4 E=3 Wtorek A=7 D=3 C=5 E= B=4 Środa C=4 E=3 B=4 A=8 D=4 Czwartek D=3 B=5 E=4 C=5 A=7 Piątek E=3 A=7 D=3 B=6 C=5 REKLAMA Sklep S S S3 S4 S5 SUMA A 7 7 6 8 7 35 B 5 5 4 6 4 4 C 4 4 5 5 5 3 D 3 3 3 4 4 7 E 3 3 4 3 5
H : µ = µ =... = µ 0 H : A B E Nie wszystkie powyŝsze równości zachodzą. - sprzedaŝ nie zaleŝy od rodzaju reklamy - sprzedaŝ zaleŝy od rodzaju reklamy
Źródło zmienności Suma kwadratów odchyleń Liczba stopni swobody Średnie odchylenie kwadratowe Wartość statystyki F-Snedecora Bloki -wiersze SSRB r- MSRB Bloki - kolumny SSCB r- MSCB Zabiegi SSTr r- MSTr F=MSTR/MSE Błąd losowy SSE (r-)(r-) MSE Suma SST r -
OBLICZENIA SST= (suma kwadratów wszystkich liczb w tablicy) (suma wszystkich liczb w tablicy)^/r^ SSRB = suma kwadratów sum w wierszach/r (suma wszystkich liczb w tablicy)^/r^ SSCB = suma kwadratów sum w kolumnach/r (suma wszystkich liczb w tablicy)^/r^ SSTr = suma kwadratów sum efektów zabiegów/r (suma wszystkich liczb w tablicy)^/r^ SSE = SST SSRB SSCB - SSTr
Analiza wariancji dla danych zblokowanych w kwadratach łacińskich H 0 : µ = µ =... = µ r H : Nie wszystkie średnie są równe. F = MSTr MSE -rozkład F-Snedecora o (r-,(r-)(r-)) stopniach swobody gdzie: MSTr MSE - średnie odchylenie kwadratowe względem zabiegów - średnie odchylenie kwadratowe błędu losowego Obszar krytyczny testu:
PODSUMOWANIE Licznik Suma Średnia Wariancja Poniedziałek 5 4,4,3 Wtorek 5 4, 3,7 Środa 5 3 4,6 3,8 Czwartek 5 4 4,8, Piątek 5 4 4,8 3, S 5 4,4,8 S 5 4,4,8 S3 5 4,4,3 S4 5 5 5 5 S5 5 3 4,6,3
ANALIZA WARIANCJI Źródło wariancji SS df MS F Wartość-p Test F Bloki wiersze dni tygodnia,36 4 0,34 Bloki kolumny sklepy,36 4 0,34 Zabiegi reklama 48,96 4,4,67,60483E-05 3,5967 Błąd 6,48 3,465 Razem 58,6 4
H : µ = µ = µ = = µ 0 H : A B C D Nie wszystkie średnie są równe. E F = MSTr MSE,4 = 3,465 =,67 Poziom istotności testu α = 0, 05 Wartość krytyczna F (5-,(5-)(5-))=3,6 0,05,67 > 3,6 -> odrzucamy hipotezę o równości średnich
Analiza wariancji ulosowiony, całkowicie zblokowany plan eksperymentu H 0 : µ = µ =... = µ r H : Nie wszystkie średnie są równe. F = MSTr MSE -rozkład F-Snedecora o (r-,(r-)(r-)) stopniach swobody gdzie: MSTr MSE - średnie odchylenie kwadratowe względem zabiegów - średnie odchylenie kwadratowe błędu losowego Obszar krytyczny testu:
Źródło zmienności Suma kwadratów odchyleń Liczba stopni swobody Średnie odchylenie kwadratowe Wartość statystyki F-Snedecora Bloki SSBL n- MSRB Zabiegi SSTr r- MSTr F=MSTR/MSE Błąd losowy SSE (n-)(r-) MSE Suma SST nr-
H0: Nie ma róŝnicy w przeciętnej ocenie aktorek w opinii społecznej Losowy porządek prezentacji aktorek pierwszy wybrany widz Aktorka B Aktorka C Aktorka A drugi wybrany widz Aktorka C Aktorka B Aktorka A trzeci wybrany widz Aktorka A Aktorka C Aktorka B czwarty wybrany widz Aktorka B Aktorka A Aktorka C