STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z następujących postaci H ( θ >, H θ <, H θ θ ( θ ( θ
Postępowanie przy weryfikacji powyższych hipotez jest następujące. Wybieramy pewną statystykę U n o rozkładzie zależnym od parametru θ oraz pewną liczbę α z przedziału (, i wyznaczamy podzbiór K zbioru liczb rzeczywistych tak by spełniony był warunek P n θ = θ = α ( U K czyli aby prawdopodobieństwo, iż statystyka U n przyjmie wartość ze zbioru K, przy założeniu, że prawdziwa jest hipoteza zerowa było równe α. 3
. Pobieramy próbę i obliczamy wartość un statystyki 3. Podejmujemy decyzje gdy gdy odrzucenia H. u n K odrzucamy H, u n K przyjmujemy H (nie ma podstaw do U n 4
Uzasadnienie: Hipotezę H odrzucamy gdy u n K bowiem prawdopodobieństwo zajścia zdarzenia U n K jest bardzo małe przy założeniu, że prawdziwa jest hipoteza H i skoro takie zdarzenie dla pobranej próby zaszło, należy sądzić, że założenie o prawdziwości hipotezy H było niesłusznie przyjęte. 5
Terminologia. U n - sprawdzian, (statystyka testowa K zbiór krytyczny (zbiór odrzuceń, α - poziom istotności (typowe wartości α :,;,5;,. αˆ - krytyczny poziom istotności (poziom istotności przy którym następuje zmiana decyzji. 6
Błędy decyzji w teście sprawdzającym hipotezę H. Decyzja Przyjmujemy H Odrzucamy H H - prawdziwa Decyzja właściwa Błąd I rodzaju H - fałszywa Błąd II rodzaju Decyzja właściwa Prawdopodobieństwo popełnienia błędu I rodzaju wynosi: P( U n K H = α Prawdopodobieństwo popełnienia błędu II rodzaju wynosi: P( U n K H = β 7
Testy do weryfikacji hipotez o wartości oczekiwanej I. Cecha X populacji ma rozkład normalny N(m, σ, σ jest znane Hipoteza zerowa H ( m = m H H ( m > m X σ / U Zbiór kryt. K Wyznaczanie n liczby k Φ = α m H ( m < m ( ; k > n < k ; H m ( ; k > < k ; ( m Nr testu (k Φ(k = α α Φ ( k = II. Cecha X populacji ma rozkład normalny N(m, σ, σ nie jest znane. Hipoteza zerowa H ( m = m H U n Zbiór kryt. K Wyznaczanie liczby k H ( m > m < k ; ( T k = α H ( m < m X m ( ; k > P( Tn k = α 5 H ( S / n m m ( ; k > < k ; P( Tn k = α 6 III. Cecha X populacji ma dowolny rozkład, próba jest liczna n >. Hipoteza zerowa H ( m = m H U Zbiór kryt. K Wyznaczanie n liczby k 3 Nr tes tu P n 4 Nr test u H ( m > m X m < k ; Φ(k = α 7 H ( m < m ( ; k > Φ(k = α S / n 8 H ( m m ( ; > < k ; α k Φ ( k = 9 8
Test do weryfikacji hipotezy o prawdopodobieństwie sukcesu Cecha X populacji ma rozkład zerojedynkowy P ( X = = p, P( X = = p, p (; Hipoteza zerowa H ( p = p Próba liczna n> H Nr testu (k U n Zbiór kryt. K Wyznaczanie liczby k p < k ; Φ = α H ( p > p W n H p ( p ( p < p ( ; k > Φ(k = α H W średnia ( p p ( ; k > < k ; α Φ( k = częstość sukcesu k W = n 9
H Test do weryfikacji hipotez o odchyleniu standardowym Cecha X populacji ma rozkład normalny N(m, σ. Hipoteza zerowa H ( σ = σ H ( σ > σ Nr testu U n Zbiór kryt. K Wyznaczanie liczb k i l < k ; P( Y n k = α 3 ns ( ; k P( Y n k = α 4 σ ( ; k > < l ; P( Y n l = α / 5 H ( σ < > σ H ( σ σ P n ( Y k = α / Uwaga: dla n>3 można stosować statystykę U o rozkładzie N(,. ns = ( n σ
Testy do porównywania wartości oczekiwanych Badane są dwie cechy X i Y różnych populacji. Zakładamy, że cechy te są zmiennymi losowymi niezależnymi. Z populacji, w której badana jest cecha X pobrano próbę n elementową, natomiast z drugiej populacji pobrano próbę n elementową.. Cechy X i Y mają rozkłady normalne odpowiednio N ( m, σ, N( m, σ, przy czym odchylenia standardowe σ i σ są znane. Hipoteza zerowa H ( m = m H U n n Zbiór kryt. K Wyznaczanie liczby k Nr testu H ( m > m X Y < k ; Φ(k = α 6 H ( m < m ( ; k > Φ(k = α σ σ 7 H ( + m m ( ; k > < k ; α n n Φ( k = 8
. Cechy X i Y mają rozkłady normalne odpowiednio N ( m, σ, N( m, σ, przy czym odchylenia standardowe obu cech są sobie równe i nie są znane. Hipoteza zerowa H ( m = m H U Zbiór kryt. Wyznaczanie n n K liczby k H ( m > m X Y < k ; ns + ns n + n H ( m < m n + n nn ; k > H( m m ( ; k > Wielkość P( T = α + n k Nr testu n 9 ( P( T + n k = α < k ; n P( Tn + n k = α ns + ns n + n S p = n + n nn nazywamy wariancją połączonych populacji. 3. Cechy X i Y mają rozkłady dowolne o wartościach oczekiwanych m, m, przy czym próby są liczne, n >. H m = n, H H ( m > m U n n X Y ( m Zbiór kryt. K Wyznaczanie liczby k Nr testu < k ; Φ(k = α S S + H ( m < m n n ( ; k > Φ(k = α 3 H ( m ( ; k > < k ; m α Φ( k = 4
Test do porównywania prawdopodobieństw sukcesu. Badane są dwie cechy X i Y różnych populacji o rozkładach zerojedynkowych, P X = = p, P( X = =, P ( p ( Y = = p, P( Y = = p, Z populacji, której badana jest cecha X pobrano próbę n elementową, natomiast z drugiej populacji pobrano próbę n elementową. Obie próby są liczne n, n >. Hipoteza zerowa: H ( p = p H U n n Zbiór kryt. K Wyznaczanie liczby k Nr testu H ( p > p W W < k ; Φ(k = α 5 H ( p < p ( ; k > Φ(k = α n + n 6 H ( W( W p p ( ; k > < k ; α nn Φ( k = 7 W, W średnie częstości sukcesów w poszczególnych próbach, W = k / n, W = k / n, W k + k /( n + = ( n - średnia częstość sukcesu w połączonych próbach, n n W = W + W n + n n + n 3
Test do weryfikacji hipotez o porównywaniu wariancji Cechy X i Y mają rozkłady normalne odpowiednio N ( m, σ, N( m, σ. Z populacji, w której badana jest cecha X pobrano próbę n elementową, natomiast z drugiej populacji pobrano próbę n elementową. Tak dobieramy oznaczenia populacji aby Sˆ n S n ˆ Hipoteza zerowa H ( σ = σ H H( σ > σ U ˆ Sˆ n n n n Zbiór kryt. K S < k ; Wyznaczanie liczby k P ( Fn ; n k (F - rozkład Snedecora = α Nr testu 8 4
Przykłady Przykład. Według danych producenta, określony typ samochodu zużywał l/km. Po dokonaniu pewnych usprawnień w tym typie samochodu oczekuje się, że zużycie paliwa spadnie. Aby to sprawdzić dokonano pomiaru zużycia paliwa w 5 losowo wybranych samochodach tego typu po modernizacji i otrzymano wynik x = 9, 5 3 l/km. Zakładając, że zużycie paliwa ma rozkład normalny N(m, sprawdzić czy modernizacja istotnie zmniejszyła zużycie paliwa. Przyjąć α =,5. 5
Rozwiązanie. Zastosujemy test. H ( m =, H( m <, α =,5 zatem Φ(k = α =,95 stąd k =,64 Zbiór krytyczny K = (- ; -,64> Wartość statystyki 9,3 u = 5 =,75 interpretacja graficzna:,5 -,75 --,64 Ponieważ u K to hipotezę H odrzucamy. Zatem zmiany konstrukcyjne istotnie zmniejszyły zużycie paliwa. 6
Obliczymy dla jakich wartości średniej z próby 5 - elementowej decyzja byłaby taka sama: x < 9, 5 <,64 x < 9, 34 Zatem dla x 34 wartość U należy do zbioru krytycznego. 7
Wyznaczymy krytyczny poziom istotności αˆ. Φ (,75 = αˆ,96 stąd αˆ,4. Zatem dla α <,4 podjęlibyśmy inną decyzję. Zauważmy, że odrzucając hipotezę H narażamy się na popełnienie błędu I rodzaju (prawdopodobieństwo jego popełnienia wynosi,5. 8
Przykład. Dla sytuacji z poprzedniego przykładu niech x = 9,44 5. Rozpatrzmy hipotezy H ( m =, H( m = 9, Zastosujemy test. 9
Zbiór krytyczny jak poprzednio K = (- ; -,64> Wartość statystyki 9,44 u = interpretacja graficzna: 5 =,4,5 -,64 -,4 Ponieważ u K to nie ma podstaw do odrzucenia hipotezy H. Przyjmując hipotezę H narażamy się na popełnienie błędu II rodzaju. Wyznaczymy krytyczny poziom istotności αˆ. Φ (,4 = αˆ,9 stąd αˆ,8. Zatem dla α >,8 podjęlibyśmy inną decyzję.
Obliczymy prawdopodobieństwo popełnienia błędu II rodzaju. X β = P( U K m = 9 = P 5 >,64 m = 9 = = ( > 9,344m = 9 P X = X 9 9,344 9 P 5 > 5 = Φ(,86, Zatem przyjmując hipotezę H możemy zakwalifikować około % samochodów mających zużycie 9 l/km jako samochody o zużyciu l/km.
Interpretacja powyższych wyników na wykresie gęstości rozkładów N(9, /5 i N(, /5. 9,5 9,44, Uwaga. Z powyższego wykresu widać, że gdy n rośnie (wykresy są bardziej smukłe to maleje p-stwo popełnienia błędu II rodzaju dla danego zbioru krytycznego, gdy maleje p-stwo popełnienia błędu I rodzaju to rośnie p-stwo popełnienia błędu II rodzaju
Moc testu Niech H ( θ = θ, H( θ = θ, K = zbiór krytyczny, określamy moc testu w punkcie θ = θ jako M ( θ = P( U K θ = θ Jest to prawdopodobieństwo odrzucenia hipotezy H, gdy θ = θ Uwaga M ( θ = α θ β = ( M (im większa moc testu tym mniejsze prawdopodobieństwo popełnienia błędu II rodzaju 3
Uwaga Test dla weryfikacji hipotez H ( θ = θ, H ( θ = θ, jest nazywany testem najmocniejszym, jeśli jego moc dla θ = θ jest największa w porównaniu z innymi testami (poziom istotności ten sam. Dla testu najmocniejszego prawdopodobieństwo popełnienia błędu II rodzaju jest najmniejsze. 4
Przykład Wyznaczymy funkcję mocy testu z poprzedniego przykładu. Rozpatrzmy hipotezy H ( m =, H( m = 9, α =,5, zbiór krytyczny K = ( ;, 64>. 5
X M ( m = P 5 = P <,64 m = m 9,344 m ( X < 9,344 m = m = Φ 5 = 6
Wartości funkcji zestawiamy w tabeli: 8, 8,5 9, 9,5, 9,344 m m' 5 Wykres funkcji M (m 3,36,,86,39,64 M(m',9996,98,85,348,5 7
Przykład Dwie brygady produkują detale. Z partii detali wyprodukowanych przez I brygadę wylosowano szt. i wśród nich było braków. Z partii detali wyprodukowanych przez II brygadę wylosowano 9 szt. i wśród nich było 3 braków. Na poziomie istotności α =, sprawdzić hipotezę, że odsetek braków w I brygadzie jest niż niższy niż w II brygadzie. 8
Rozwiązanie. Zastosujemy test 6. H ( p = p, H( p < p, α =, Zbiór krytyczny K = ( ;,33> Obliczamy: w ; w = 3/ 9 = / w = 5 /9 Wartość statystyki u =,8 9
interpretacja graficzna:, --,33 -,8 Ponieważ u K to nie ma podstaw do odrzucenia hipotezy H. Oznacza to, że w granicach błędu statystycznego obie brygady mają ten sam odsetek braków. 3
Wyznaczymy krytyczny poziom istotności αˆ. Φ (,8 = αˆ,96485 stąd αˆ,35. Zatem dla α >,35 podjęlibyśmy inną decyzję. 3
Przykład. Dokładność pracy obrabiarki sprawdza się wyznaczając odchylenie standardowe średnicy toczonego detalu, powinno ono wynosić σ =,. Zmierzono średnice (mm losowo wybranych detali i otrzymano:,6; 99,6;,;,;,3;,; 99,9;,;,4;,6;,5. Zakładając, że średnice detali mają rozkład normalny, sprawdzić na podstawie powyższych danych, że obrabiarka ma pożądaną dokładność. Przyjąć poziom istotności,5. 3
Rozwiązanie. Zastosujemy test 5. H ( σ =,, H( σ >,, α =,5 Zbiór krytyczny K = <8,37; Obliczamy: x =, s, 9 = Wartość statystyki u = interpretacja graficzna:,9,4 = 5,5 8,37 5 Ponieważ u K to hipotezę H odrzucamy. Zatem należy sądzić, że obrabiarka ma gorszą dokładność niż pożądana. Wyznaczymy krytyczny poziom istotności αˆ. Y (5 = αˆ,5 Zatem dla α <,5 podjęlibyśmy inną decyzję. 33