VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15
WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady konstrukcji testu statystycznego, testy porównawcze, test Fishera, test t-studenta, testy sprawdzające, porównywanie próbek).
Standardowy przebieg procedury weryfikacyjnej Reguły postępowania przy weryfikacji hipotez są określane mianem testów statystycznych 1. Sformułowanie hipotezy zerowej i alternatywnej Hipoteza zerowa (H 0 ) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako: Hipoteza alternatywna (H 1 ) - hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu: 2. Wybór statystyki testowej Wyznaczamy pewną funkcję wyników z próby losowej, i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję x ϴ nazywa się statystyką testową lub funkcją testową.
Standardowy przebieg procedury weryfikacyjnej 3. Określenie poziomu istotności α Na tym etapie procedury weryfikacyjnej przyjmujemy maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Prawdopodobieństwo to jest oznaczane symbolem α i nazywane poziomem istotności. Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy aby ryzyko popełnienia błędu było jak najmniejsze. Najczęściej zakładamy poziom istotności α=0.05, czasem przyjmuje się np. α=0.01 ; α=0.1 4. Podjęcie decyzji Wyznaczoną na podstawie próby wartość statystyki porównujemy z wartością krytyczną testu. Jeżeli wartość ta znajdzie się w obszarze krytycznym, to hipotezę zerową należy odrzucić jako nieprawdziwą. Stąd wniosek, że prawdziwa jest hipoteza alternatywna. Jeżeli natomiast wartość ta znajdzie się poza obszarem krytycznym, oznacza to, że brak jest podstaw do odrzucenia hipotezy zerowej. Stąd wniosek, że hipoteza zerowa może, ale nie musi, być prawdziwa, a postępowanie nie dało żadnych dodatkowych informacji uprawniających do podjęcia decyzji o przyjęciu lub odrzuceniu hipotezy zerowej.
BŁĘDY I i II RODZAJU DECYZJA Odrzucić H o H o jest prawdziwa Błąd I rodzaju p(błędu I rodz.) =α H o jest fałszywa Poprawna decyzja Nie odrzucić H o Poprawna decyzja Błąd II rodzaju p(błędu II rodz.) =β
OBSZAR KRYTYCZNY Obszar krytyczny- obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze, to weryfikowaną przez nas hipotezę H 0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną. DWUSTRONNY OBSZAR KRYTYCZNY test dwuśladowy (two-tail test)
OBSZAR KRYTYCZNY LEWOSTRONNY OBSZAR KRYTYCZNY Test jednośladowy (one- tail test) PRAWOSTRONNY OBSZAR KRYTYCZNY Test jednośladowy (one- tail test)
DECYZJE Obszar krytyczny od pozostałej części rozkładu statystyki oddzielony jest przez tzw. wartości krytyczne testu czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H 1.
WARYFIKACJA HIPOTEZ dla μ: H o : µ= µ o (µ o -hipotetyczna wartość) H 1 : µ µ o lub: µ > µ o lub: µ <µ o Dane: próba losowa: P (n), poziom istotności: α PRÓBA LOSOWA P (n) Próba duża Mała (n <30) Gdy: σ znane (jest to słuszne też dla małej próby) Gdy: σ nieznane TYLKO dla dużej próby σ nieznane dla małej próby Z α N(0,1) : ROZKLAD.N.S.ODWR prawdopodobieństwo : a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α t α : ROZKLAD.T.ODWR Stopnie swobody: k=n-1, prawdopodobieństwo: a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α
TESTY DLA DWÓCH ŚREDNICH POPULACJI Przypadek 1. Dwie populacje generalne o rozkładach normalnych N(µ 1, σ 1 ) i N(µ 2, σ 2 ). Odchylenia standardowe σ 1 i σ 2 są znane. W oparciu o wyniki dwu niezależnych prób, o liczebnościach n 1 i n 2 wylosowanych z tych populacji sprawdzić hipotezę: H o : µ 1 = µ 2, wobec hipotezy alternatywnej: H 1 : µ 1 µ 2 Rozwiązanie: Statystyka testowa: ma rozkład N(0,1) Przypadek 2. Dwie populacje generalne o rozkładach normalnych N(µ 1, σ 1 ) i N(µ 2, σ 2 ) Odchylenia standardowe σ 1 i σ 2 są nieznane, ale jednakowe: σ 1 = σ 2. W oparciu o wyniki dwu niezależnych prób, o liczebnościach n 1 i n 2 wylosowanych z tych populacji sprawdzić hipotezą: H o : µ 1 = µ 2, wobec hipotezy alternatywnej: H 1 : µ 1 µ 2 Rozwiązanie: Statystyka testowa: ma rozkład t-studenta o k= n 1 + n 2-2 stopniach swobody.
TESTY DLA DWÓCH ŚREDNICH POPULACJI Przykład 5. Opracowano nową metodę (2) produkcji wykonywania pewnego detalu. Zmierzony czas wykonywania losowo wybranych sztuk wynosił w min: dla nowej metody(2) : 15, 12, 10, 18, 14, 15, 13 dla starej (1): 17, 11, 22, 18, 19, 13, 14, 16. Na poziomie istotności 0,05 zweryfikować hipotezę, że nowa metoda obniża czas produkcji tych detali. Można zastosować test dany przypadkiem. H o : t 1 =t 2 ; H 1 : t 1 > t 2 ; gdzie t- czas średni wytwarzania detalu. Z postaci prawostronny H 1 wynika, że należy zastosować prawostronny test. Z rozkładu t-studenta mamy t α =1,771 dla k=13. Z wartości prób mamy: x 1,sr =16 min; x 2,sr =14 min; n 1 s 12 =88; n 2 s 22 =39. Wstawiając do: mamy: t= 1,23. Ponieważ nie znaleźliśmy się w obszarze krytycznym, więc nie ma podstaw do odrzucenia H o
TESTY DLA DWÓCH ŚREDNICH POPULACJI Uwaga: Często zdarza się, że wyniki obu prób możemy traktować jako wyniki pomiarów na tych samych elementach. Typową sytuacją jest przypadek: wynik x i przed jakąś operacją i wynik y i po niej dla tego samego i. Można wtedy analizować wyniki obu prób jako wyniki jednej próby różnicowej z i = y i - x i. Wówczas testujemy hipotezę: H o : µ z =0, gdzie µ z średnia w populacji różnic. Statystyka testowa: ma rozkład t-studenta o k=n-1. Przypadek 3. Dwie populacje generalne o rozkładach normalnych lub innych. Odchylenia standardowe σ 1 i σ 2 są nieznane. W oparciu o wyniki dwu niezależnych dużych prób, o liczebnościach n 1 i n 2 wylosowanych z tych populacji sprawdzić hipotezę: H o : µ 1 = µ 2, wobec hipotezy alternatywnej: H 1 : µ 1 µ 2 Rozwiązanie: Postępujemy tak samo, jak w Przypadku 1, z tym że przy obliczaniu wartości statystyki testowej w miejsce σ 1 i σ 2 wstawiamy : s 1 i s 2
TESTY DLA DWÓCH ŚREDNICH POPULACJI Przykład 6. Wylosowano 8 elementów oporników, ich opór (wyrażony w kω) wynosił (Próba 1) : 16, 13, 14, 21, 19, 18, 26, 17. Następnie poddano je specjalnej obróbce, po której wykazywały one opory (Próba 2) : 21, 17, 20, 26, 23, 22, 21, 18. Na poziomie istotności 0,05 zweryfikować hipotezę, że obróbka ta zwiększa oporność oporników. Rozwiązanie H o : R 1 = R 2 ; H 1 : R 1 < R 2 gdzie R 1 i R 2 wartości oczekiwane oporów w populacji przed i po obróbce. Stosujemy test dla par: R_1,i R_2,i z_i 16 21 5 13 17 4 14 20 6 21 26 5 19 23 4 18 22 4 26 21-5 17 18 1 H o należy odrzucić, tzn. obróbka zwiększa oporność z_sr= 3 s_z= 3,545621 t= 2,238608 z_i=r_2,i -R_1,i t=z_sr/s_z *(n-1)^0,5
WARYFIKACJA HIPOTEZ dla DWÓCH POPULACJI PRÓBY LOSOWE P(n 1 ) i P(n 2 ) H o : µ 1 = µ 2 H 1 : µ 1 µ 2 lub: µ 1 > µ 2 lub: µ 1 <µ 2 Dane: próby losowe: P(n 1 ) i P(n 2 ) poziom istotności: α Małe (n <30) Próby duże Gdy: σ 1 i σ 2 znane (jest to słuszne też dla małej próby) Gdy: σ 1 i σ 2 nieznane TYLKO dla dużej próby σ 1 i σ 2 nieznane, ale σ 1 =σ 2 dla małej próby; k=n 1 +n 2-2 Populacja generalna przed (X i ) oraz po (Y i ) MODYFIKACJI z i =y i -x i H o : z =0 k= n-1 Z α N(0,1) : ROZKLAD.N.S.ODWR prawdopodobieństwo : a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α t α : ROZKLAD.T.ODWR a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α
TEST DLA WSKAŹNIKA STRUKTURY (PROCENTU) Populacja generalna ma rozkład dwupunktowy z parametrem p. Z populacji tej wylosowano próbę n-elementową (n>100) próbę. W oparciu o wynik tej próby zweryfikować hipotezę: H o : p=p o wobec hipotezy alternatywnej: H 1 : p p o, gdzie p o jest hipotetyczna wartość parametru p Statystyka testowa: Gdzie m- liczba wyróżnionych elementów w próbie. Statystyka z ma rozkład N(0,1)
TEST DLA WSKAŹNIKA STRUKTURY (PROCENTU) Przykład 7. Na 800 zbadanych pacjentów pewnego szpitala 320 miało grupę krwi 0. Na poziomie istotności 0,05 zweryfikować hipotezę, że procent pacjentów z tą grupą wynosi 35 %. Rozwiązanie: H o : p=35%; H 1 : p 35% m= 320; n=800, p o =0,35 z= (320/800-0,35)/[0,35*0,65/800]^0,5= 2,97 z α/2 = z 0,025 =1,96, Ponieważ z> z α/2 więc H o należy odrzucić
TEST DLA DWÓCH WSKAŹNIKÓW STRUKTURY Dwie populacje generalne o rozkładach dwupunktowych z parametrami p 1 i p 2. W oparciu o wyniki dwu niezależnych prób, o liczebnościach n 1 i n 2 (n 1 >100 i n 2 >100) wylosowanych z tych populacji sprawdzić hipotezę, że parametry p 1 i p 2 są jednakowe, tzn: H o : p 1 =p 2 wobec hipotezy alternatywnej: H 1 : p 1 p 2. Statystyka testowa: gdzie: m 1 i m 2 oznaczają ilość wyróżnionych elementów w obu próbach, a: z- ma rozkład N(0,1)
TEST DLA DWÓCH WSKAŹNIKÓW STRUKTURY Przykład 8. Badano odporność na korozję blaszek niklowanych chemicznie i elektrolitycznie. Na 100 blaszek niklowanych chemicznie 5 wykazywało punkty rdzawe, natomiast na 120 niklowanych elektrolitycznie 10 wykazywało takie punkty. Na poziomie istotności 0,05 zweryfikować hipotezę o jednakowej odporności na korozję blach niklowanych chemicznie i elektrolitycznie. Rozwiązanie: H o : p 1 =p 2 ; H 1 : p 1 p 2 m 1 = 5; n 1 =100; m 2 = 10; n 2 =120 n=100*120/220=54,55 z=(5/100 10/120)/[ 0,068*0,932/54,55]^0,5 = -0,978 z =0,978 < 1,96= z α nie ma podstaw do odrzucenia hipotezy zerowej
TEST DLA WARIANCJI POPULACJI Populacja generalna ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ. Z populacji tej wylosowano próbę n-elementową próbę, na jej podstawie sprawdzić hipotezę: H o : wobec hipotezy alternatywnej:h 1 :, gdzie jest hipotetyczną wartością wariancji Rozwiązanie: Statystyka testowa: Statystyka ta ma rozkład χ 2 z k=n-1 stopniami swobody
TEST DLA WARIANCJI POPULACJI Przykład 9. Dokonano 11 niezależnych pomiarów średnicy rur ceramicznych w mm: 50,2; 50,4; 50,6; 50,5; 49,9; 50,0; 50,3; 50,1; 50,0; 49,6; 50,6. Na poziomie istotności 0,05 zweryfikować hipotezę, że wariancja średnicy rur jest równa 0,04. Rozwiązanie: H o : σ 2 =σ o 2 =0,04 H 1 : σ 2 > 0,04 d_i 50,2 50,4 s_d= 0,316228 50,6 (n-1)s_d^2= 1 50,5 chi^2= 25 49,9 ch^2_alfa= 18,30704 50 50,3 50,1 50 49,6 50,6 Ponieważ: χ 2 =25 >χ α2 =18,31 więc H o należy odrzucić, tzn., że wariancja jest większa
TEST DLA DWÓCH WARIANCJI POPULACJI Dane są dwie populacje generalne o rozkładach normalnych N(µ 1, σ 1 ) i N(µ 2, σ 2 ). Ich parametry są nieznane. W oparciu o wyniki dwu niezależnych prób, o liczebnościach n 1 i n 2 wylosowanych z tych populacji sprawdzić hipotezę: H o : wobec hipotezy alternatywnej: H 1 : Statystyka testowa: ma rozkład F-Snedecora z k 1 =n 1-1 oraz k 2 =n 2-1 stopniami swobody. R Gdy F F odrzucamy H o
TEST DLA DWÓCH WARIANCJI POPULACJI Przykład 10: Dokonano po 5 niezależnych pomiarów ciśnienia w komorze spalania silnika rakietowego dla dwóch rodzajów paliwa; A i B. Dla A otrzymano wyniki w kg/cm 2 : 40,32; 39,85; 41,17; 40,62; 40,04. Dla B: 51,07; 49,60; 50,45; 50,59; 50,29. Na poziomie istotności 0,05 sprawdzić hipotezę o jednakowym odchyleniu standardowym ciśnienia uzyskiwanego obu rodzajami paliwa. Rozwiązanie: H o : H 1 : F= 1,06 ; F α = 4,39 Ponieważ F < F α więc nie ma podstaw do odrzucenia hipotezy zerowej
Alternatywne podejście: p-wartości (p Value of a test) Powyższa standardowa procedura wymaga przyjęcia arbitralnego poziomu istotności α a wynikiem weryfikacji jest odpowiedź binarna albo statystyka testowa mieści się w przedziale ufności, albo nie. Alternatywnym i nowocześniejszym, choć mniej popularnym podejściem jest obliczenie zamiast tego surowej p-wartości (prawdopodobieństwa popełnienia błędu I rodzaju) i podawanie jej jako wyników weryfikacji. Dzięki temu nie ma potrzeby przyjmowania a priori żadnych wartości α, pozwala to również na porównywanie istotności różnych konkurencyjnych hipotez statystycznych. Definicja: p-wartość (p-value) testowania hipotezy jest to najmniejsza wartość (poziomu istotności), która prowadzi do odrzucenia hipotezy zerowej, H o. Ćwiczenie 3 W oparciu o wartości w Ćwiczeniu 2 wyznaczmy p- wartość. Mamy obliczoną wartość z=-2,36, z ROZKŁAD.NORMALNY.S dla tej wartości z uzyskujemy: 0,009137 jest to p/2 i p wartość odpowiednio dla testów dwu- i jednostronnych.
Alternatywne podejście: p-wartości PRZYKŁAD z 1-α/2 p=α 100 0 0,5 1 101 0,2 0,57926 0,841481 102 0,4 0,655422 0,689157 103 0,6 0,725747 0,548506 104 0,8 0,788145 0,423711 105 1 0,841345 0,317311 110 2 0,97725 0,0455 115 3 0,99865 0,0027 120 4 0,999968 6,33E-05 130 6 1 1,97E-09 160 12 1 0 180 16 1 0 Mała p-wartość wskazuje na poparcie hipotezy alternatywnej H 1 Duża p-wartość dostarcza mało argumentów na poparcie hipotezy alternatywnej
Wyznaczanie prawdopodobieństwa błędu II rodzaju: β Błąd II rodzaju (β) występuje gdy fałszywa hipoteza zerowa nie jest odrzucona. DECYZJA Odrzucić H o Nie odrzucić H o H o jest prawdziwa Błąd I rodzaju p(błędu I rodz.) =α Poprawna decyzja H o jest fałszywa Poprawna decyzja Błąd II rodzaju p(błędu II rodz.) =β Błąd I rodzaju jest określony jako odrzucenie prawdziwej hipotezy H o czyli : p(h o odrzucona H o jest prawdziwa), lub: Odpowiada to w rozkładzie standaryzowanym N(0,1) :
Wyznaczanie prawdopodobieństwa błędu II rodzaju: β Z kolei błąd II rodzaju (fałszywa hipoteza H o ) nie odrzucona jest określony jakko: Przykład liczbowy: Niech α=0,05, s=5000, n=400 ; H o : μ=μ o =20000 ; H 1 : μ μ o wtedy z N(0,1) mamy: z α/2 = 1,96 => x min =19,510 => x max =20,490 Dlatego, obszar odrzucenia jest: < 19,510 lub > 20,490 Błąd II rodzaju odpowiada wówczas: Obliczmy ten błąd, przyjmując jako aktualną wartość μ o =21 000, tj. Oznacza to, że jeśli µ=21 000 to prawdpodobieństwo nie odrzucenia H o jest 0,0207 (see Rys)
Wyznaczanie prawdopodobieństwa błędu II rodzaju: β