Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy parametryczne dotyczą wyłącznie wartości parametrów. Przykład: Wiadomo, że badana cecha ma rozkład wykładniczy o nieznanej wartości oczekiwanej. Wysuwamy hipotezę, że E[]5. Hipotezy, które nie są parametryczne nazywamy nieparametrycznymi. Przykład: Niech T oznacza odstęp czasu pomiędzy przejazdami samochodów ulicą. Wysuwamy hipotezę, że T ma rozkład wykładniczy. Hipotezę parametryczną nazywamy prostą jeśli precyzuje dokładne wartości wszystkich nieznanych parametrów rozkładu badanej cechy. Przykład: Wiadomo, że badana cecha ma rozkład N (; µ1,σ. Wysuwamy hipotezę, że σ. W przeciwnym wypadku hipotezę parametryczną nazywamy złożoną. Przykład: Cecha ma rozkład N (; µ1,σ. Wysuwamy hipotezę, że σ. Wykład 1-
Hipotezy statystyczne Testem statystycznym nazywamy metodę postępowania, która każdej możliwej realizacji próby losowej 1,, n, przyporządkowuje, z ustalonym p-twem, decyzję przyjęcia bądź odrzucenia sprawdzanej hipotezy. Testowaną hipotezę nazywamy hipotezą zerową H. Hipotezę, którą jesteśmy skłonni przyjąć, jeśli okaże się, że weryfikowaną hipotezę H należy odrzucić, nazywamy hipotezą alternatywną. Statystyką testową nazywamy taką funkcję próby losowej δ( 1,, n, która spełnia następujące warunki: pozwala na porównanie punktowej estymaty parametru θ na podstawie próby losowej z wartością θ występującą w hipotezie H, jest związana z rozkładem p-twa, który jest znany przy założeniu, że testowana hipoteza H jest prawdziwa. Zbiorem krytycznym W nazywamy zbiór wartości statystyki testowej δ( 1,, n, których wystąpienie skłania nas do odrzucenia testowanej hipotezy H na rzecz hipotezy alternatywnej. Wykład 1-3
Błędy I-go I i II-go rodzaju Przykład: Na pewnej drodze istnieje ograniczenie prędkości do 1 km/h. Urządzenie pomiarowe działa w ten sposób, że wykonuje trzy niezależne pomiary 1, i, a następnie oblicza średnią 3 3, której wartość decyduje o tym czy kierowca otrzymuje mandat czy nie. Ile powinna wynosić minimalna wartość 3 powyżej której kierowca otrzymuje mandat, aby tylko 5% kierowców otrzymywało mandat niesłusznie. Urządzenie pomiarowe jest wykalibrowane w ten sposób, że błąd pomiaru podlega rozkładowi normalnemu N (,σ σ, a sam pomiar rozkładowi N ( µ, σ gdzie µ jest prawdziwą prędkością pojazdu. Formułujemy problem: możliwe wartości δ: H : µ1 przeciw : µ>1 Statystyka testowa: δ 3 1 wartości preferujące Możliwe rodzaje błędów przy podejmowaniu decyzji co do prawdziwości hipotezy H : Decyzja przyjąć H odrzucić H Hipoteza H jest prawdziwa jest fałszywa decyzja poprawna błąd II-go rodzaju błąd I-go rodzaju decyzja poprawna Wykład 1-4
Błędy I-go I i II-go rodzaju P: (cd Chcemy aby p-two niesłusznego ukarania kierowcy było co najwyżej równe 5%, tzn. aby p-two popełnienia błędu I-go rodzaju było nie większe niż 5%. Poziomem istotności α testu nazywamy p-two popełnienia błędu I-go rodzaju. P: (cd Dla jakich wartości statystyki testowej δ powinniśmy na poziomie istotności α 5% odrzucić hipotezę H : µ 1 na rzecz hipotezy alternatywnej : µ>1? Sprawdźmy co się dzieje dla δ>11 oraz δ>1: P( P δ 1 11 1 δ 11 P ( z. 87. 19 / 3 / 3 P( P δ 1 1 1 δ 1 P ( z 1. 73. 416 / 3 / 3 3 > α. 5 < α. 5 Jaka powinna być więc graniczna wartość c? c P( c P 1 z δ c 1. 5 z (. 95 1. 645 / 3 / 3 c 11. 9 A więc na poziomie istotności α.5 powinniśmy odrzucić hipotezę H : µ1 na rzecz hipotezy : µ>1 wtedy gdy wartość statystyki testowej δ Œ W 11.9,. Wykład 1-5
( W H P δ (,..., α Błędy I-go I i II-go rodzaju P: (cd Jakie jest p-two nie ukarania kierowcy który przekroczył dozwoloną prędkość? (czyli popełnienia błędu II-go rodzaju. P (. P δ 15 11 9 15 δ < 11 9 µ 15 Φ (. 68. 36 / 3 / 3. P (. P δ 13 11 9 13 δ < 11 9 µ 13 Φ (. 95. 1711 / 3 / 3 β P ( δ W H P ( δ W H 1 n 1 1 1 Testem najmocniejszym nazywamy test, który przy ustalonym α, minimalizuje p-two β błędu II-go rodzaju. Wykład 1-6
Weryfikacja hipotez statystycznych Schemat postępowania przy testowaniu hipotezy zerowej: wybierz hipotezę zerową H i hipotezę alternatywną, wybierz poziom istotności testu α, wybierz statystykę testową δ oraz zdefiniuj zbiór krytyczny W, oblicz wartość statystyki testowej dla wylosowanej próby prostej, sprawdź czy obliczona wartość statystyki testowej należy do zbioru krytycznego i zdecyduj czy przyjąć czy też odrzucić H na rzecz. Niech zbiorem krytycznym dla hipotezy H : θ θ będzie zbiór W: ( W P δ (,..., θ α 1 n Mocą testu nazywamy funkcję: M ( θ, W P ( δ W θ Niech : θ θ 1, wówczas (, W P ( W M θ δ θ β 1 1 1 Zbiór krytyczny W należy zawsze wybierać tak aby moc testu, dla wszystkich wartości parametru θ ze zbioru hipotez alternatywnych była możliwie największa. Wykład 1-7
Moc testu statystycznego Przykład: Badana cecha ma rozkład N (; µ, σ o znanej wariancji σ. Weryfikujemy hipotezę H : µµ na podstawie n5 elementowej próby losowej, przy wykorzystaniu jako statystyki testowej: µ 5( µ z σ / n σ Dla poziomu istotności α.5 wyznaczyć moc testu w przypadku gdy: a zbiorem krytycznym jest W c,+, gdzie P(z c H α 5( µ 5( µ 5( µ µ M1 ( µ, W P( z 1. 64 µ P 1. 64 µ P 1. 64 + σ σ σ 1 Φ ( 1. 64 + λ b zbiorem krytycznym jest W (-,-c 1 c 1,+, gdzie P( z c 1 H α M 5 µ µ, P 1. 96 µ P 1. 96 µ σ 1 Φ ( λ + 1. 96 + Φ ( λ 1. 96 ( W ( z Wniosek: Gdy : µ>µ (λ< to należy wybrać jako zbiór krytyczny W c,+. Natomiast gdy : µ µ to W (-,-c 1 c 1,+. λ 5 ( µ µ σ Wykład 1-8
Testowanie hipotez a przedziały y ufności Przykład (mandaty: Hipotezę H : µ 1 odrzucamy na rzecz hipotezy : µ>1, na poziomie istotności α.5, gdy: 3 c. 5 1 + 1. 645 3 µ - 3 1. 645 1 3 1 nie mieści się w jednostronnym przedziale ufności dla parametru µ, na poziomie ufności 1-α 95% Ogólnie, dla dowolnego testowanego parametru θ, przy H : θ θ, zachodzi: odrzucamy H na rzecz : θ>θ ( : θ<θ poziomie α wtedy i tylko gdy θ nie należy do odpowiedniego jednostronnego przedziału ufności na poziomie ufności 1-α dla parametru θ. odrzucamy H na rzecz : θ θ na poziomie α wtedy i tylko gdy θ nie należy do obustronnego przedziału ufności na poziomie ufności 1-α dla parametru θ. Wykład 1-9
Testy istotności dla wartości oczekiwanej Badana cecha populacji ma rozkład normalny N (µ,σ o znanym σ. Do weryfikacji hipotezy H : µµ wykorzystujemy statystykę: µ z σ / n która przy założeniu prawdziwości hipotezy H ma rozkład N (,1. H. alternatywna : µµ <µ 1 : µµ >µ 1 : µµ 1 µ Zbiór krytyczny (-, -z(1 (1-α α z(1 (1-α, (-,-z(1 (1-α/ α/ z(1 (1-α/ /, Wykład 1-1 1
Testy istotności dla wartości oczekiwanej Przykład: Chcemy ocenić czy nowo opracowane baterie pracują zdecydowanie dłużej niż baterie używane dotychczas. Wiemy, że czas pracy dotychczas używanych baterii w kalkulatorze ma rozkład normalny o µ 1.3 min oraz σ6.5 min. Z przeprowadzonych testów nowych baterii wynika, że czas ich pracy podlega również rozkładowi normalnemu o σ6.5 min. Na podstawie próbki n15 pomiarów stwierdzono, że średni czas ich pracy wynosi 15.6 min. Sprawdzić na poziomie istotności α.1 hipotezę H : µ µ wobec hipotezy alt. H 1 : µ µ. H : µ1.3 min, : µ 1.3 min α.1, z(1 α/.58 µ 15. 6 1. 3 z 15 3. 8 σ / n 6. 5 P P( z > z H P( z > 3. 8 H ( 1 Φ ( 3. 8 ( 1. 9995. 1 W (, z( 1 α / z( 1 α /, + (,. 58. 58, + Ponieważ P < α (z W więc odrzucamy hipotezę H na rzecz hipotezy. Oznacza to, że na poziomie istotności α.1 jest znacząca różnica pomiędzy średnim czasem życia nowych baterii i dotychczas używanych w kalkulatorach. Wykład 1-11 11
Testy istotności dla wartości oczekiwanej Przykład: Powtarzamy badania nowych baterii. Załóżmy, że zwiększając próbkę do n znajdujemy 15. min. Zakładając, że czas pracy nowych baterii podlega rozkładowi normalnemu o σ6.5 min. przeprowadź na poziomie istotności α.5 prawostronny test hipotezy H : µ1.3 min. H : µ1.3 min, : µ>1.3 min α.5, z(1-α1.645 µ 15. 1. 3 z 3. 36 σ / n 6. 5 P P(z > z H P(z > 3. 36 H 1 Φ ( 3. 36 1. 9996. 4 W z( 1 α, + 1. 645, + Ponieważ P < α (z W więc odrzucamy hipotezę H na rzecz hipotezy. Oznacza to, że na poziomie istotności α.5 jest znacząca różnica pomiędzy średnim czasem życia nowych baterii i dotychczas używanych w kalkulatorach. Uwaga: Dla α.1 mamy z(1 α.33 co również prowadzi do odrzucenia hipotezy H na rzecz hipotezy, tym razem na poziomie istotności α.1 Wykład 1-1
Testy istotności dla wartości oczekiwanej Badana cecha populacji ma rozkład normalny N (µ,σ o nieznanych µ i σ. Do weryfikacji hipotezy H : µ µ wykorzystujemy statystykę: t s / która przy założeniu prawdziwości hipotezy H ma rozkład S n-1 (t. µ n 1 H. alternatywna : µµ <µ 1 : µµ >µ 1 : µµ 1 µ Zbiór krytyczny (-,-t(1 (1-α, n-1 1 t(1 (1-α, n-1, (-,-t(1 (1-α/, n-1 1 t(1 (1-α/, n-1,, Wykład 1-13 13
Testy istotności dla wartości oczekiwanej Przykład: Standardowy środek znieczulający zaczyna działać średnio po µ1.5 min od chwili podania. Producent nowego środka znieczulającego twierdzi, że jego specyfik działa zdecydowanie szybciej. Dentysta aplikuje nowy środek N1 pacjentom, mierząc czas (w min po którym pacjent przestaje odczuwać ból: 9.3, 9.5, 9., 9., 9.3, 9.5, 9.4, 9.3, 9., 9.1. Ponieważ wiadomo, że rozkład czasu po którym zaczynał działać dotychczas stosowany środek jest normalny, więc można przypuszczać, że rozkład ten dla nowego środka też jest normalny. Sprawdzić na poziomie istotności α.1 czy nowy środek działa szybciej. H : µ1.5 min, : µ<1.5 min α.1, t(1 (1 α, ν 1 1.81 n n 1 9. 8 1. min s ( i. min n 9 8 n 1619 1 1 i i 1 i 1 µ 9. 8 1. 5 t 9. 61 s. / n 1619 P P(t < t H P(t <. 61 H W (, t( 1 α, n 1 (,. 81 Ponieważ P < α (t W więc odrzucamy hipotezę H na rzecz hipotezy. Wykład 1-14 14
Testy istotności dla wartości oczekiwanej Badana cecha populacji ma dowolny rozkład o nieznanych wartości oczekiwanej µ i skończonym σ. Duża (n 1 próbka. Do weryfikacji hipotezy H : µ µ wykorzystujemy statystykę: µ która przy założeniu prawdziwości hipotezy H ma rozkład N (,1. H. alternatywna : µµ 1 : µµ 1 : µµ 1 µ Zbiór krytyczny (-,-z(1 (1-α α z(1 (1-α, (-,-z(1 (1-α/ α/ z(1 (1-α/ /, Przykład: Na podstawie obserwacji przez n315 dni w roku, stwierdzono, że średnie dzienne zużycie wody w fabryce wynosi 19 m 3, a wariancja s 191 m 6. Zweryfikować na poziomie istotności α.1 hipotezę H : µ 1 m 3 wobec hipotezy alternatywnej : µ > 1 m 3. α.1, z(1-α.33, W z(1 α,.33, µ 19 1 z 315 37. 4 s / n 191 Ponieważ z W więc odrzucamy na poziomie istotności α.1 hipotezę H na rzecz hipotezy. z s / n Wykład 1-15 15
Testy istotności dla wariancji Badana cecha populacji ma rozkład normalny N (µ,σ o nieznanych µ i σ. Do weryfikacji hipotezy H : σ σ wykorzystujemy statystykę: u ( n 1s która przy założeniu prawdziwości hipotezy H ma rozkład χ n-1 (u. σ H. alternatywna : σ σ <σ 1 : σ σ >σ 1 : σ σ 1 σ Zbiór krytyczny (, u(α (α, n-1 1 u(1 (1-α, n-1, (, u(α (α/, n-1 u(1 (1-α/, n-1, Wykład 1-16 16
Testy istotności dla wariancji Przykład: Producent twierdzi, że pojemnik zawierający 355 ml soli dietetycznej zawiera jedynie 35 mg sodu. Aby zagwarantować te dane, w procesie produkcyjnym utrzymywane są warunki, takie aby zawartość sodu w soli miała rozkład normalny o µ34.5 mg oraz σ.4 mg. W procesie kontroli losuje się n1 pojemników i sprawdza, na poziomie istotności α.5, czy odchylenie standardowe jest większe niż.4 mg. Jeśli tak to proces produkcyjny jest zatrzymywany i odpowiednie poprawki są wprowadzane. W jednym z testów uzyskano s.9 mg. Czy proces produkcyjny powinien zostać zatrzymany? H : σ.4 mg, : σ>.4 mg α.5, n1, u(1-α, n 1 u(.95, 9 16.9 ( n 1s ( 1 1. 9 u 13. 14 σ. 4 P P(u > u H P(u > 13. 14 H. 156 W u( 1 α, n 1, + 16. 9, + Ponieważ P > α (u W więc nie ma podstaw do odrzucenia hipotezy H. Oznacza to, że na poziomie istotności α.5 odchylenie standardowe próbki nie jest znacząco większe od wymaganego σ.4 mg. Wykład 1-17 17
Testy istotności dla wariancji Przykład: Korzystając z danych z poprzedniego przykładu, przeprowadzić dwustronny test na poziomie istotności α.5. H : σ.4 mg, : σ.4 mg α.5, n1, u(α/,n 1 u(.5, 9.7, u(1 α/,n 1 u(.975, 9 19. W (, u( α /, n 1 u( 1 α /, n 1, + (,. 7 19., + Ponieważ u W więc nie ma podstaw do odrzucenia hipotezy H. Oznacza to, że na poziomie istotności α.5 odchylenie standardowe próbki nie jest znacząco różne od σ.4. Badana cecha populacji ma rozkład normalny N(µ,σ o nieznanych µ i σ. Duża próbka (n 5. Do weryfikacji hipotezy H : σσ wykorzystujemy statystykę: ( n 1s z n 3 która przy założeniu prawdziwości hipotezy H ma rozkład N(,1. σ H. alternatywna : σσ <σ 1 : σσ >σ 1 : σσ 1 σ Zbiór krytyczny (, -z(1 (1-α α z(1 (1-α, (-, -z(1 (1-α/ α/ z(1 (1-α/ /, Wykład 1-18 18
Testy istotności dla wariancji Przykład: Do tarczy oddano n5 strzałów. Mierząc odległości trafień od środka tarczy okazało się, że ich wariancja jest równa s 19.5 cm. Zakładając, że odległości te mają rozkład normalny, zweryfikować na poziomie istotności α.5, hipotezę H : σ 1 cm jeśli hipotezą alternatywną jest : σ >1 cm. H : σ 1 cm, : σ >1 cm α.5, n5, z(1 α z(.95 1.64 ( n 1s ( 5 1 19. 5 z n 3 5 3. 51 σ 1 W z( 1 α, + 1. 64, + z W a więc nie ma podstaw do odrzucenia hipotezy H. Oznacza to, że na poziomie istotności α.5 odchylenie standardowe próbki nie jest znacząco różne od σ1. Rachunki z wykorzystaniem statystyki χ : α.5, n5, u(1 α,n-1 u(.95,49 66.34 ( n 1s ( 5 1 19. 5 u 53. 66 σ 1 W u( 1 α, n 1, + 66. 34, + u W Wykład 1-19 19