Statystyka matematyczna. Wykład V. e-mail:e.kozlovski@pollub.pl
Spis treści 1 Weryfikacja hipotezy o równości wartości średnich w dwóch populacjach 2 3
Weryfikacja hipotezy o równości wartości średnich Na poziomie istotności α konstrujemy hipotezę roboczą H 0 : µ 1 = µ 2 wobec hipotezy alternatywnej H 1 : µ 1 µ 2 (lub H 1 : µ < µ 0, H 1 : µ > µ 0 ).
Cechy X 1 i X 2 mają rozkłady normalne N ( µ 1, σ 2 1) i N ( µ2, σ 2 2), gdzie znane są ochylenia standardowe σ 1 i σ 2. Statystyka U = X 1 X 2 σ 2 1 n 1 + σ2 2 n 2 ( ma rozkład( normalny )] [ N (0, ( 1). Zbiór ) ) krytyczny, u 1 α 2 u 1 α 2,. Jeżeli u ( ) ( ) 1 α 2 < U < u 1 α 2 to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, co nie oznacza że hipoteza H 0 jest prawdziwa (na podstawie jednej próby przy przyjętym ryzyku błędu α stwierdzamy tylko że wyniki tej próby nie przeczą hipotezie H 0 ). Jeżeli natomiast U (, u ( )] [ ( ) ) 1 α 2 u 1 α 2, to hipotezę roboczą H 0 odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : µ 1 < µ 2 zbiór krytyczny określamy jako (, u (1 α)], w przypadku hipotezy alternatywnej H 1 : µ 1 > µ 2 zbiór krytyczny określamy jako (u (1 α), ].
Cechy X 1 i X 2 mają rozkłady normalne N ( ( µ 1, σ1) 2 i N µ2, σ2) 2, gdzie nieznane są ochylenia standardowe σ 1 i σ 2, natomiast możemy założyć σ 1 =σ 2 Statystyka t = X 1 X 2 n 1+n 2 n 1 Ŝ1 2+n2Ŝ2 2 n 1n 2 n 1+n 2 2 ma rozklad t-studenta o n 1 + n 2 2 stopniach swobody, gdzie X 1 = 1 n 1 X i1, X2 = 1 n 2 n 1 n 2 Ŝ 2 1 = i=1 n 1 1 n 1 1 i=1 i=1 X i2 ( Xi1 X 1 ) 2, Ŝ 2 2 = 1 n 2 1 n 2 i=1 ( Xi2 X 2 ) 2 Zbiór krytyczny (, t ] [t, ), gdzie t = t ( 1 α 2, n 1 + n 2 2 ) jest kwantylem rzędu 1 α 2 rozkładu t-studenta o n 1 + n 2 2 stopniach swobody.
Jeżeli t < t < t to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, jeżeli natomiast t (, t ] [t, ) to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : µ 1 < µ 2 zbiór krytyczny określamy jako (, t (1 α, n 1 + n 2 2)], w przypadku hipotezy alternatywnej H 1 : µ 1 > µ 2 zbiór krytyczny określamy jako (t (1 α, n 1 + n 2 2), ]
Cechy X 1 i X 2 mają dowolne rozkłady o nieznanych wartościach średnich µ 1,µ 2 i nieznanych odchyleniach standardowych σ 1 i σ 2. Dla dużych prób n 1 100 i n 2 100 statystyka U = X 1 X 2 S 2 1 n 1 + S2 2 n 2 ma asymptotyczny rozkład N (0, 1) Jeżeli u ( ) ( ) 1 α 2 < U < u 1 α 2 to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, jeżeli natomiast U (, u ( )] [ ( ) ) 1 α 2 u 1 α 2, to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : µ 1 < µ 2 zbiór krytyczny określamy jako (, u (1 α)], w przypadku hipotezy alternatywnej H 1 : µ 1 > µ 2 zbiór krytyczny określamy jako (u (1 α), ].
Jeżeli obserwację cech X 1 i X 2 prowadzimy jednocześnie, to na podstawie próby (x i1, x i2 ) dla i = 1, 2,..., n (liczebności prób cech X 1 i X 2 są jednakowe) definiujemy ciąg różnic z i = x i1 x i2. Wartości ciągu {z i } 1 i n traktujemy jako wartości cechy Z o rozkładzie normalnym N ( µ, σ 2) i nieznanym odchyleniu stantardowym σ. Statystyka t = Z µ 0 n 1 S ma rozklad t-studenta o n 1 stopniach swobody, gdzie Z = 1 n S 2 = 1 n n z i, i=1 n ( zi Z ) 2. i=1
Zbiór krytyczny (, t ] [t, ), gdzie t = t ( 1 α 2, n 1) jest kwantylem rzędu 1 α 2 rozkładu t-studenta o n 1 stopniach swobody. Jeżeli t < t < t to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, jeżeli natomiast t (, t ] [t, ) to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : µ < µ 0 zbiór krytyczny określamy jako (, t (1 α, n 1)], w przypadku hipotezy alternatywnej H 1 : µ > µ 0 zbiór krytyczny określamy jako (t (1 α, n 1), )
Weryfikacja hipotezy o równości wariancji w dwóch populacjach Cechy X 1 i X 2 mają rozkłady normalne N ( µ 1, σ 2 1) i N ( µ2, σ 2 2), gdzie nieznane są ochylenia standardowe σ 1 i σ 2 Na poziomie istotności α konstrujemy hipotezę roboczą wobec hipotezy alternatywnej Statystyka H 0 : σ 1 = σ 2 H 1 : σ 1 σ 2 F = Ŝ2 1 Ŝ 2 2 ma rozkład Fishera Snedecora o n 1 1 i n 2 1 stopniach swobody. Wyznaczamy kwantyle rzędu α 2 i 1 α 2 postaci f α (n 2 1 1, n 2 1) i f 1 α (n 2 1 1, n 2 1) odpowiednio.
Jeżeli f α (n 2 1 1, n 2 1) < F < f 1 α (n 2 1 1, n 2 1) to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, jeżeli natomiast F (, f α (n 2 1 1, n 2 1) ] [ f 1 α (n 2 1 1, n 2 1), ) to hipotezę roboczą H 0 odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : σ 1 < σ 2 zbiór krytyczny określamy jako (, f α (n 1 1, n 2 1)), w przypadku hipotezy alternatywnej H 1 : σ 1 > σ 2 zbiór krytyczny określamy jako [ f1 α 2 (n 1 1, n 2 1), )
Weryfikacja hipotezy o równości wariancji w wielu populacjach Na poziomie istotności α konstrujemy hipotezę roboczą H 0 : σ 1 = σ 2 =... = σ k (wariancje/odchylenia standardowe są równe), wobec hipotezy alternatywnej H 1 : nie wszystkie wariancje/odchylenia standardowe są równe Test Bartletta Zakładamy: niezależność prób, liczba populacji k > 2, liczności pób dla każdej populacji co najmniej 5. Niech wielkość n i oznacza liczebność i tej próby, Ŝ 2 i = 1 n i 1 n i j=1 ( Xji X j ) 2 oznacza estymator nieobciążony wariancji dla i tej próby.
oraz c = 1 + n = n 1 +... + n k, S 2 = 1 k (n j 1) n k j 1 3 (k 1) j=1 k 1 n j 1 1 n k dla dowolnego i = 1,..., k. Jeżeli liczności próbek są jednakowe (n 1 =... = n k ), to przyjmujemy c = 1 + j=1 1 3 (n k)
Statystyka χ 2 = 2.303 c ( (n k) ln S 2 ) k (n i 1) ln Ŝ2 i, ma asymptotyczny rozkład chi-kwadrat o k 1 stopniach swobody. Dla rozkładu chi-kwadrat wyznaczamy kwantyl rzędu 1 α o k 1 stopniach swobody oraz oznaczamy χ 2 1 α (k 1). Jeżeli χ 2 < χ 2 1 α (k 1) to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, jeżeli natomiast χ 2 χ 2 1 α (k 1) to hipotezę roboczą H 0 odrzucamy na korzyść hipotezy alternatywnej H 1. i=1
Test Hartleya Zakładamy: niezależność prób, liczba populacji 2 k 12 oraz liczności prób dla każdej z populacji są jednakowe (n 5). Statystyka testowa max (Ŝ2 1, Ŝ2 2,..., Ŝ2 k F max = ). min (Ŝ2 1, Ŝ2 2,..., Ŝ2 k ) Z tablic dla testu Harleya odczytujemy wartość krytyczną f 1 α (k, n 1) kwantyl rzędu 1 α dla liczby populacji k i (n 1) stopniach swobody. Jeżeli F max < f 1 α (k, n 1) to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, jeżeli natomiast F max f 1 α (k, n 1) to hipotezę roboczą H 0 odrzucamy na korzyść hipotezy alternatywnej H 1.
Table Critical values for the Hartley test (right-sided) Level of significance = 0.01 k n - 1 2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 12 15 20 30 60 199 47.5 23.2 14.9 11.1 8.89 7.50 6.54 5.85 4.91 4.07 3.32 2.63 1.96 448 85 37 22 15.5 12.1 9.9 8.5 7.4 6.1 4.9 3.8 3.0 2.2 729 120 49 28 19.1 14.5 11.7 9.9 8.6 6.9 5.5 4.3 3.3 2.3 1036 151 59 33 22 16.5 13.2 11.1 9.6 7.6 6.0 4.6 3.4 2.4 1362 184 69 38 25 18.4 14.5 12.1 10.4 8.2 6.4 4.9 3.6 2.4 1705 216* 79 42 27 20 15.8 13.1 11.1 8.7 6.7 5.1 3.7 2.5 2069 249* 89 46 30 22 16.9 13.9 11.8 9.1 7.1 5.3 3.8 2.5 2432 281* 97 50 32 23 17.9 14.7 12.4 9.5 7.3 5.5 3.9 2.6 2813 310* 106 54 34 24 18.9 15.3 12.9 9.9 7.5 5.6 4.0 2.6 3204 337* 113 57 36 26 19.8 16.0 13.4 10.2 7.8 5.8 4.1 2.7 3605 361* 120 60 37 27 21 16.6 13.9 10.6 8.0 5.9 4.2 2.7 *The third-digit figures for n - 1 = 3 are uncertain. Level of significance = 0.05 k n - 1 2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 12 15 20 30 60 39.0 15.4 9.6 7.15 5.82 4.99 4.43 4.03 3.72 3.28 2.86 2.46 2.07 1.67 87.5 27.8 15.5 10.8 8.38 6.94 6.00 5.34 4.85 4.16 3.54 2.95 2.40 1.85 142 39.2 20.6 13.7 10.4 8.44 7.18 6.31 5.67 4.79 4.01 3.29 2.61 1.96 202 50.7 25.2 16.3 12.1 9.70 8.12 7.11 6.34 5.30 4.37 3.54 2.78 2.04 266 62.0 29.5 18.7 13.7 10.8 9.03 7.80 6.92 5.72 4.68 3.76 2.91 2.11 333 72.9 33.6 20.8 15.0 11.8 9.78 8.41 7.42 6.09 4.95 3.94 3.02 2.17 Kanji, Gopal K. 100 Statistical Tests. London : SAGE Publication Ltd., 1993. 403 83.5 37.5 22.9 16.3 12.7 10.5 8.95 7.87 6.42 5.19 4.10 3.12 2.22 475 93.9 41.1 24.7 17.5 13.5 11.1 9.45 8.28 6.72 5.40 4.24 3.21 2.26 550 104 44.6 26.5 18.6 14.3 11.7 9.91 8.66 7.00 5.59 4.37 3.29 2.30 626 114 48.0 28.2 19.7 15.1 12.2 10.3 9.01 7.25 5.77 4.49 3.36 2.33 704 124 51.4 29.9 20.7 15.8 12.7 10.7 9.34 7.48 5.93 4.59 3.39 2.36
Test Cochrana Zakładamy: niezależność prób, liczba populacji k 3 oraz liczności prób dla każdej z populacji są jednakowe (n 4). Statystyka testowa ) max (Ŝ2 1, Ŝ2 2,..., Ŝ2 k G = Ŝ1 2 + Ŝ2 2 +... +. Ŝ2 k Z tablic dla testu Cochrana odczytujemy wartość krytyczną g 1 α (k, n 1) kwantyl rzędu 1 α dla liczby populacji k i (n 1) stopniach swobody. Jeżeli G < g 1 α (k, n 1) to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0, jeżeli natomiast G g 1 α (k, n 1) to hipotezę roboczą H 0 odrzucamy na korzyść hipotezy alternatywnej H 1.
Funkcje w R test równości wartości średnich w dwóch populacjach > t.test(x,y) test równości wariancji w dwóch populacjach > var.test(x,y) test równości wariancji w wielu populacjach > bartlett.test(data,nazwy)