Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl
Spis treści 1 2 3
Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej losowej w populacji generalnej uzyskane w oparciu o próbę losową. Wyróżniamy dwa rodzaje hipotez statystycznych: parametryczne, związane z wartościami parametrów, nieparametryczne, związane z postacią rozkładów. Weryfikację postawionych hipotez statystycznych przeprowadzamy w oparciu o wyniki próby losowej.
Konstrukcja testów parametrycznych Niech θ oznacza parametr populacji generalnej, natomiast Θ 0 dopuszczalną (hipotetyczną) wartość parametru populacji generalnej. Stawiamy hipotezę zerową (roboczą) H 0 postaci H 0 : θ = Θ 0 (stawiamy hipotezę zerową głoszącą, że wartość parametru θ jest równa Θ 0 lub że różnicą pomiędzy parametrem θ a jego oceną Θ 0 jest statystycznie nieistotna (jest na poziomie zerowym stąd nazwa hipoteza zerowa). Następnie konstruujemy hipotezę alternatywną (dla każdej hipotezy zerowej określa się hipotezę alternatywną) o postaci: H 1 : θ Θ 0 (hipoteza alternmatywna oznacza, że wartość parametru θ jest różna od Θ 0 lub że różnicą pomiędzy parametrem θ a jego oceną Θ 0 jest statystycznie istotna).
Dla próby losowej X 1,..., X n możemy utworzyć różne funkcje. W celu weryfikacji hipotezy statystycznej wybieramy statystykę testową g (X 1,..., X n ) (najbardziej odpowiednią funkcję dla próby losowej X 1,..., X n ). Dla różnych prób statystyka g (X 1,..., X n ) przyjmuje różne wrtości. Dla poziomu istotności α wyznaczamy zbiór krytyczny W P (g (X 1,..., X n ) W ) = α lub P (g (X 1,..., X n ) W ) α jest to zbiór odrzuceń hipotezy roboczej. Również okresślamy zbiór przyjęć W hipotezy roboczej H 0 P (g (X 1,..., X n ) W ) = 1 α lub P (g (X 1,..., X n ) W ) 1 α
Na podstawie próbki nie mamy całkowitej informacji o zbiorowości, z której została pobrana próbka. Dlatego weryfikując postawioną hipotezę w oparciu o zaobserwowane wyniki istnieje ryzyko podjęcia błędnej decyzji. Podejmując ostateczną decyzję możemy popełnić jeden z dwóch błędów: 1. odrzucić hipotezę roboczą H 0 gdy jest ona prawdziwa (błąd pierwszego rodzaju); 2. przyjąć hipotezę roboczą H 0 gdy jest ona fałszywa (błąd drugiego rodzaju). Hipoteza H 0 Decyzja prawdziwa fałszywa przyjąć hipotezę H 0 poprawna błędna (błąd II rodzaju) odrzucić hipotezę H 0 błędna (błąd I rodzaju ) poprawna
Prawdopodobieństwo popełnienia błędu wynosi α, które jest poziomem istotności. Jeżeli w oparciu o próbę X 1,..., X n wartość statystyki g (X 1,..., X n ) wpadnie do zbioru krytycznego, to można twierdzić że zaszło zdarzenie o małym prawdopodobieństwie, a więc praktycznie ńiemożliwe do zajsćia (zrealizowania) w przypadku jednej próby, a zatem hipotezę roboczą nalezy odrzucić. W przypadku innej próby X 1,..., X n oczywiście mogłaby nastąpić inna sytuacja, statystyka g (X 1,..., X n ) mogłaby należeć do zbioru przyjęć. W większości przypadków przyjmujemy poziom istotności α = 0.01, α = 0.05.
Procedura postępowania dla zweryfikowania parametrycznej hipotezy zerowej H 0 określić hipotezę zerową H 0 oraz jej alternatywę H 1
Procedura postępowania dla zweryfikowania parametrycznej hipotezy zerowej H 0 określić hipotezę zerową H 0 oraz jej alternatywę H 1 przyjąć poziom istotności α oraz liczebność próby
Procedura postępowania dla zweryfikowania parametrycznej hipotezy zerowej H 0 określić hipotezę zerową H 0 oraz jej alternatywę H 1 przyjąć poziom istotności α oraz liczebność próby określić rozkład zbiorowości generalnej
Procedura postępowania dla zweryfikowania parametrycznej hipotezy zerowej H 0 określić hipotezę zerową H 0 oraz jej alternatywę H 1 przyjąć poziom istotności α oraz liczebność próby określić rozkład zbiorowości generalnej określić test dla weryfikacji hipotezy zerowej H 0
Procedura postępowania dla zweryfikowania parametrycznej hipotezy zerowej H 0 określić hipotezę zerową H 0 oraz jej alternatywę H 1 przyjąć poziom istotności α oraz liczebność próby określić rozkład zbiorowości generalnej określić test dla weryfikacji hipotezy zerowej H 0 obliczyć wartość statystyki g (X 1,..., X n ) na podstawie próby
Procedura postępowania dla zweryfikowania parametrycznej hipotezy zerowej H 0 określić hipotezę zerową H 0 oraz jej alternatywę H 1 przyjąć poziom istotności α oraz liczebność próby określić rozkład zbiorowości generalnej określić test dla weryfikacji hipotezy zerowej H 0 obliczyć wartość statystyki g (X 1,..., X n ) na podstawie próby odczytać z tablic rozkładu statystyki g (X 1,..., X n ) wartość krytyczną, która wyznaczającza obszar odrzuceń i przyjąć hipotezy zerowej H 0.
Procedura postępowania dla zweryfikowania parametrycznej hipotezy zerowej H 0 określić hipotezę zerową H 0 oraz jej alternatywę H 1 przyjąć poziom istotności α oraz liczebność próby określić rozkład zbiorowości generalnej określić test dla weryfikacji hipotezy zerowej H 0 obliczyć wartość statystyki g (X 1,..., X n ) na podstawie próby odczytać z tablic rozkładu statystyki g (X 1,..., X n ) wartość krytyczną, która wyznaczającza obszar odrzuceń i przyjąć hipotezy zerowej H 0. podjęcie decyzji: jeżeli g (X 1,..., X n ) W to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej (zerowej) H 0, w przeciwnum razie hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1.
Przypadek I Zakładamy, ze badana cecha X ma rozkład normalny N (µ, σ), gdzie prametr µ jest nieznany, natomiast znane jest ochylenie standardowe σ. Na poziomie istotności α konstrujemy hipotezę roboczą wobec hipotezy alternatywnej H 0 : µ = µ 0 H 1 : µ µ 0 (lub H 1 : µ < µ 0, H 1 : µ > µ 0 ). Statystyka U = X µ 0 n σ ma rozkład normalny N (0, 1). Zbiór krytyczny (, u ( 1 α 2 )] [ u ( 1 α 2 ), ).
Jeżeli u ( ) ( ) 1 α 2 < U < u 1 α 2 to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0 : µ = µ 0, co nie oznacza że hipoteza H 0 jest prawdziwa (na podstawie jednej próby przy przyjętym ryzyku błędu α stwierdzamy tylko że wyniki tej próby nie przeczą hipotezie H 0 ). Jeżeli natomiast U (, u ( 1 α 2 )] [ u ( 1 α 2 ), ) to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : µ < µ 0 zbiór krytyczny określamy jako (, u (1 α)], w przypadku hipotezy alternatywnej H 1 : µ > µ 0 zbiór krytyczny określamy jako (u (1 α), ].
Przykład 1. Z populacji wylosowano próbkę 10 elementową w której badana cecha ma rozkład normalny N (µ; 3), gdzie średnia z próbki X = 4.3. Na poziomie istotności α = 0.05 zweryfikować hipotezę że średnia populacji µ = 5. Rozwią: Na poziomie istotności α = 0.05 konstrujemy hipotezę roboczą wobec hipotezy alternatywnej Statystyka H 0 : µ = 5 H 1 : µ 5 U = 4.3 5 10 = 0.737 86 3 Kwantyl rzędu 1 0.05 2 dla rozkładu normalnego N (0, 1) wynosi 1.959963, zatem zbiór krytyczny (, 1.959963] [1.959963, ). Ponieważ 1.959963 < U < 1.959963 to na poziomie istotności α = 0.05 nie ma podstaw do odrzucenia hipotezy roboczej że średnia z populacji wynosi 5.
Przypadek II Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ są nieznane. Na poziomie istotności α konstrujemy hipotezę roboczą wobec hipotezy alternatywnej H 0 : µ = µ 0 H 1 : µ µ 0 (lub H 1 : µ < µ 0, H 1 : µ > µ 0 ). Statystyka t = X µ 0 n 1 S ma rozklad t-studenta o n 1 stopniach swobody, gdzie X = 1 n X i n i=1 S = 1 n ( Xi n X ) 2 i=1 ( Edward ( Kozłowski Weryfikacja )] [ hipotez ( statystycznych ) )
Jeżeli t ( 1 α 2, n 1) < t < t ( 1 α 2, n 1) to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0 : µ = µ 0, jeżeli natomiast t (, t ( 1 α 2, n 1)] [ t ( 1 α 2, n 1), ) to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : µ < µ 0 zbiór krytyczny określamy jako (, t ( 1 α 2, n 1)], w przypadku hipotezy alternatywnej H 1 : µ > µ 0 zbiór krytyczny określamy jako ( t ( 1 α 2, n 1), ]
Przypadek III Cecha X ma dowolny rozkład o nieznanych wartości średniej µ i odchyleniu standardowym σ ( σ < ). Dla dużych populacji n 100 z twierdzenia Lindeberga - Levy ego statystyka U = X µ 0 n S ma asymptotyczny rozkład N (0, 1), gdzie S = 1 n ( Xi n 1 X ) 2 i=1 jest nieobciążonym estymatorem odchylenia standardowego σ.
Na poziomie istotności α konstrujemy hipotezę roboczą wobec hipotezy alternatywnej H 0 : µ = µ 0 H 1 : µ µ 0 (lub H 1 : µ < µ 0, H 1 : µ > µ 0 ). Zbiór krytyczny (, u ( 1 α 2 )] [ u ( 1 α 2 ), ). Jeżeli u ( ) ( ) 1 α 2 < U < u 1 α 2 to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0 : µ = µ 0, jeżeli natomiast U (, u ( )] [ ( ) ) 1 α 2 u 1 α 2, to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : µ < µ 0 zbiór krytyczny określamy jako (, u (1 α)], w przypadku hipotezy alternatywnej H 1 : µ > µ 0 zbiór krytyczny określamy jako (u (1 α), ].
Przypadek I Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ są nieznane. Na poziomie istotności α konstrujemy hipotezę roboczą wobec hipotezy alternatywnej H 0 : σ 2 = σ 2 0 H 1 : σ 2 σ 2 0 (lub H 1 : σ 2 < σ 2 0, H 1 : σ 2 > σ 2 0). Dla próby o liczbności n 50 statystyka χ 2 = ns2 σ 2 0 ma rozkład χ 2 (chi-kwadrat) o n 1 stopniach swobody. Z tablic rozkładu χ 2 odczytujemy kwantyle rzędu 1 α 2 oraz α 2 i oznaczamy χ 2 ( α 2, n 1), χ 2 ( 1 α 2, n 1).
Zbiór krytyczny ( ( 0, χ 2 α )] 2, n 1 [χ ( 2 1 α ) ) 2, n 1, + Jeżeli χ ( 2 α 2, n 1) < χ 2 < χ ( 2 1 α 2, n 1) to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0 : σ 2 = σ0, 2 jeżeli natomiast χ 2 ( 0, χ ( 2 α 2, n 1)] [ χ ( 2 1 α 2, n 1), + ) to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : σ 2 > σ 2 0 zbiór krytyczny określamy jako [ χ 2 (1 α, n 1), + ), w przypadku hipotezy alternatywnej H 1 : σ 2 < σ 2 0 zbiór krytyczny określamy jako ( 0, χ 2 (α, n 1) ]
Przykład 2. Z populacji wylosowano próbkę 10 elementową w której badana cecha ma rozkład normalny N (µ; σ), gdzie wariancja z próbki wynosi S 2 = 4. Na poziomie istotności α = 0.1 zweryfikować hipotezę że wariancja w populacji σ 2 0 = 5. Rozwiązanie: Na poziomie istotności α = 0.1 konstrujemy hipotezę roboczą H 0 : σ 2 = 5 wobec hipotezy alternatywnej Statystyka χ 2 = ns2 σ 2 0 H 1 : σ 2 5 = 10 4 5 = 8 Kwantyle rzędu χ 2 (0.05, 9) = 3.325, χ 2 (0.95, 9) = 16.919. Ponieważ 3.325 < χ 2 < 16.919 to na poziomie istotności α = 0.1 nie ma podstaw do odrzucenia hipotezy roboczej.
Przypadek II Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ są nieznane. Na poziomie istotności α konstrujemy hipotezę roboczą wobec hipotezy alternatywnej H 0 : σ 2 = σ 2 0 H 1 : σ 2 σ 2 0 (lub H 1 : σ 2 > σ0, 2 H 1 : σ 2 < σ0). 2 Dla próby o liczbności n 50 statystyka 2 ns2 σ0 2 = S 2n σ ma rozkład normalny N ( 2n 3, 1 ), natomiast statystyka U = 2 ns2 σ0 2 2n 3 ma rozkład normalny N (0, 1).
Z tablic rozkładu N (0, 1) odczytujemy kwantyl rzędu 1 α 2 i oznaczamy u ( 1 α 2 ). Zbiór krytyczny (, u ( )] [ ( ) ) 1 α 2 u 1 α 2,. Jeżeli u ( ) ( ) 1 α 2 < U < u 1 α 2 to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0 : σ 2 = σ0, 2 jeżeli natomiast U (, u ( )] [ ( ) ) 1 α 2 u 1 α 2, to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : σ 2 < σ 2 0 zbiór krytyczny określamy jako (, u (1 α)], w przypadku hipotezy alternatywnej H 1 : σ 2 > σ 2 0 zbiór krytyczny określamy jako (u (1 α), ].
Przykład 3. Z populacji wylosowano próbkę 100 elementową, w której badana cecha ma rozkład normalny N (µ; σ) Wariancja z próbki wynosi S 2 = 0.4. Na poziomie istotności α = 0.1 zweryfikować hipotezę, że wariancja w populacji jest równa 1. Na poziomie istotności α = 0.1 konstrujemy hipotezę roboczą i alternatywną Statystyka H 0 : σ 2 = 1 H 1 : σ 2 1 100 0.4 U = 2 2 100 3 5.0914 1 Kwantyl u ( ) 1 0.1 2 = 1.64. Ponieważ U (, 1.64] [ 1.64, ), to na poziomie istotności α = 0.1 odrzucamy hipotezę roboczą H 0 na korzyść hipotezy alternatywnej H 1.
Przypadek III Cecha X ma dowolny rozkład o skończonym odchyleniu standardowym σ <. Na poziomie istotności α konstrujemy hipotezę roboczą wobec hipotezy alternatywnej (lub H 1 : σ 2 > σ 2 0, H 1 : σ 2 < σ 2 0). H 0 : σ 2 = σ 2 0 H 1 : σ 2 σ 2 0 Dla dużych populacji n 100 statystyka U = S 2 σ 2 0 σ 2 0 n 2 ma asymptotyczny rozkład N (0, 1), gdzie S = 1 n 1 n ( Xi X ) 2 i=1 jest nieobciążonym estymatorem odchylenia standardowego σ.
Z tablic rozkładu N (0, 1) odczytujemy kwantyl rzędu 1 α 2 i oznaczamy u ( 1 α 2 ). Zbiór krytyczny (, u ( 1 α 2 )] [ u ( 1 α 2 ), ). Jeżeli u ( ) ( ) 1 α 2 < U < u 1 α 2 to na poziomie istotności α nie ma podstaw do odrzucenia hipotezy roboczej H 0 : σ 2 = σ0, 2 jeżeli natomiast U (, u ( )] [ ( ) ) 1 α 2 u 1 α 2, to hipotezę roboczą odrzucamy na korzyść hipotezy alternatywnej H 1. W przypadku hipotezy alternatywnej H 1 : σ 2 < σ 2 0 zbiór krytyczny określamy jako (, u (1 α)], w przypadku hipotezy alternatywnej H 1 : σ 2 > σ 2 0 zbiór krytyczny określamy jako (u (1 α), ]