Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza sprawdzaną, podlegającą weryfikacji Wyróżnia się spośród innych hipotez statystycznych, dlatego że przypisuje się jej specjalną interpretację w rozważanym problemie Hipoteza alternatywna (H ) to hipoteza przeciwna lub częściowo przeciwna do hipotezy zerowej Testem statystycznym nazywamy postępowanie statystyczne, w wyniku którego decydujemy czy na podstawie zaobserwowanego zbioru liczb (próby) weryfikowaną hipotezę H 0 przyjąć czy odrzucić Przy takim postępowaniu możemy popełnić następujące błędy:
a) odrzucić hipotezę prawdziwą ( błąd rodzaju) b) przyjąć hipotezę fałszywą ( błąd rodzaju) Prawdopodobieństwo popełnienia błędu rodzaju oznaczamy przez i nazywamy poziomem istotności Jeśli zadanie polega na sprawdzeniu czy wyniki doświadczenia przeczą ustalonej hipotezie zerowej, to odpowiedni test nazywamy testem istotności Przy budowie testu istotności -korzysta się z rozkładów odpowiedniej dla H 0 statystyki Z n zbudowanej z wyników n- elementowej próby -wyznacza się zbiór Z wartości tej statystyki powodujących odrzucenie H 0 Zbiór Z nazywamy zbiorem krytycznym Spełniony musi być przy tym warunek: Test istotności jest testem statystycznym, którego stosowanie pozwala na odrzucenie hipotezy H 0, gdy
wyniki z próby prowadzą do wartości należącej do zbioru krytycznego W przeciwnym przypadku nie mamy podstaw do odrzucenia H 0 Sposób konstrukcji testu istotności nie pozwala na przyjęcie H 0, gdyż prawdopodobieństwo błędu rodzaju może być zbyt wysokie Typy testów istotności: ) testy dotyczące parametrów, gdy kształt rozkładu populacji jest znany ) testy zgodności dotyczące kształtu rozkładu populacji 3) testy jednorodności dotyczące kilku populacji (jednakowe parametry lub kształt rozkładów) 4) testy niezależności dotyczące kilku cech i ich wzajemnej zależności Testy istotności dla wartości oczekiwanej Testy istotności dla jednej wartości oczekiwanej
Model I Populacja generalna ma rozkład normalny Wielkości szacujemy na podstawie małej próby Stawiamy hipotezy H 0 : = 0 H : gdzie 0 jest wartością daną Obliczamy wartość statystyki: t obl x 0 n s Wyznaczone t obl porównujemy z wartością t odczytaną z tablic rozkładu Studenta dla z góry ustalonego poziomu istotności i n- stopni swobody tak, aby tzn obszar krytyczny jest dwustronny, postaci
Jeśli to H 0 należy odrzucić W przeciwnym przypadku nie ma podstaw do odrzucenia H 0 Przy powyższych wstępnych ustaleniach można przyjąć jako alternatywną również hipotezę postaci: ) H : < 0 Wówczas obszar krytyczny jest jednostronny t<t czyli }= -t Oznacza to, że t jest ujemne Aby skorzystać z tablic trzeba uwzględnić fakt, że Oznacza to odczyt wartości dodatniej t dla Jeżeli t obl -t to H 0 odrzucamy ) H : > 0
Obszar krytyczny jest jednostronny t>t czyli P{t>t }= t Tzn t jest dodatnie, a z tablic t odczytujemy zgodnie z równością Oznacza to odczyt wartości t dla Jeżeli t obl t to H 0 odrzucamy Przykład Automat produkuje części o nominalnej grubości 0,04 mm Zakładając, że grubość produkowanych części jest zmienną losową o rozkładzie normalnym Zweryfikować na poziomie istotności =0,05 hipotezę, że średnia grubość wynosi 0,04, gdy dla 7-elementowej próby [mm], a s=0,005 [mm]
Rozwiązanie: H 0 : =0,04 H : Obliczamy wartość statystyki: t obl 0,037 0,04 0,005 7,4 Mamy dwustronny obszar krytyczny: Wartość t odczytana z tablic rozkładu Studenta dla poziomu istotności =0,05 i 6 stopni swobody wynosi, Odpowiedź: Skoro t obl =,4 to t obl t Mamy podstawy aby odrzucić H 0 Model II Populacja generalna ma dowolny rozkład o wartości oczekiwanej i wariancji Parametry te szacujemy na podstawie dużej próby Stawiamy hipotezy H 0 : = 0 H : gdzie 0 jest wartością daną Obliczamy wartość statystyki:
x s 0 u obl n Wyznaczone u obl porównujemy z wartością u odczytaną z tablic rozkładu Studenta dla z góry ustalonego poziomu istotności i stopni swobody tak, aby tzn obszar krytyczny jest dwustronny, postaci Jeśli to H 0 należy odrzucić W przeciwnym przypadku nie ma podstaw do odrzucenia H 0 Przy powyższych wstępnych ustaleniach można przyjąć jako alternatywną również hipotezę postaci: ) H : < 0 Wówczas obszar krytyczny jest jednostronny u<u czyli }=
-u Oznacza to, że t jest ujemne Aby skorzystać z tablic trzeba uwzględnić fakt, że Oznacza to odczyt wartości dodatniej u dla Jeżeli u obl -u to H 0 odrzucamy ) H : > 0 Obszar krytyczny jest jednostronny u>u czyli P{u>u }= u Tzn u jest dodatnie, a z tablic u odczytujemy zgodnie z równością Oznacza to odczyt wartości u dla
Jeżeli u obl u to H 0 odrzucamy Testy istotności dla dwóch średnich Badamy dwie populacje i porównujemy dwie średnie tej samej cechy Model I Dane są populacje o rozkładach normalnych Parametry są nieznane, ale Dwie próby wylosowane z odpowiedniej populacji mają liczność n, n (małe) Stawiamy hipotezy H 0 : = H : Obliczamy wartość statystyki: t obl ns n n n s n n x x Wyznaczone t obl porównujemy z wartością t odczytaną z tablic rozkładu Studenta dla z góry ustalonego poziomu istotności
i n +n - stopni swobody tak, aby tzn obszar krytyczny jest dwustronny, postaci Jeśli to H 0 należy odrzucić W przeciwnym przypadku nie ma podstaw do odrzucenia H 0 Model II Uwaga: Podobnie jak dla testów dla jednej średniej możemy uwzględnić inne alternatywne hipotezy Dane są dwie populacje o rozkładach dowolnych, ale o skończonych wariancjach Dwie próby wylosowane z obu populacji mają liczność n, n (duże) Stawiamy hipotezy H 0 : = H : Obliczamy wartość statystyki:
u obl x s n x s n Wyznaczone u obl porównujemy z wartością u odczytaną z tablic rozkładu Studenta dla z góry ustalonego poziomu istotności i liczby stopni swobody tak, aby tzn obszar krytyczny jest dwustronny, postaci Jeśli to H 0 należy odrzucić W przeciwnym przypadku nie ma podstaw do odrzucenia H 0 Uwaga: Podobnie jak dla testów dla jednej średniej możemy uwzględnić inne alternatywne hipotezy
Przykład: W celu sprawdzenia hipotezy, że zastosowanie innego materiału zwiększa żywotność pewnej części trącej maszyny, zbadano na próbach żywotność tej części ze starego i nowego materiału Otrzymano: n =90, =9,3, =4, n =0, =9,9, =3,8 Przyjmując poziom istotności =0,05 sprawdzić hipotezę o większej średniej żywotności części z nowego materiału Rozwiązanie: Stawiamy hipotezy H 0 : = H : Obliczamy wartość statystyki: u obl x 9,3 9,9 s s n x n 4, 3,8 90 0,6 Ze względu na postać hipotezy alternatywnej mamy obszar jednostronny P{u<u }=
Stąd u =-,645 dla =0, Ponieważ u obl =-,6 to u obl <u Hipotezę H 0 należy odrzucić Testy dotyczące wariancji Test istotności dla jednej wariancji Populacja ma rozkład dowolna Liczebność n jest Stawiamy hipotezy: H 0 : = 0 H : > 0 Wyznaczamy wartość statystyki: obl Porównujemy z wartością krytyczny, gdzie ns 0 wyznaczającą obszar Wartość odczytujemy z tablic rozkładu chi-kwadrat dla danego poziomu istotności i n- stopni swobody
Jeśli to H 0 należy odrzucić Przykład: W celu oszacowania dokładności pomiarów wykonywanych pewnym przyrządem dokonano 8 pomiarów i otrzymano s =0,0575 Na poziomie istotności =0,05 zweryfikować hipotezę, że wariancja >0,06 Rozwiązanie: H 0 : =0,06 H : >0,06 Wyznaczamy wartość statystyki: obl ns 0 8 0,0575 0,06 7,667 Wartość odczytujemy z tablic rozkładu chi-kwadrat dla poziomu istotności =0,05 i 7 stopni swobody Stąd =4,067 i nie ma podstaw do odrzucenia H 0