VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15
WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady konstrukcji testu statystycznego, testy porównawcze, test Fishera, test t-studenta, testy sprawdzające, porównywanie próbek).
WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych parametrów lub rozkładu Hipoteza statystyczna PARAMETRYCZNA (parametryczne testy istotności) precyzuje wartość parametru w rozkładzie populacji gen. NIEPARAMETRYCZNA (nieparametryczne testy istotności) orzeka o typie rozkładu TESTY ZGODNOŚCI Sprawdzają hipotezę, że populacja ma określony typ rozkładu. TESTY SPRAWDZAJĄCE CZY 2 PRÓBY POCHODZĄ Z JEDNEJ POPULACJI
PRZYKŁADY Wiemy, że wzrost człowieka jest zmienną losową ciągłą. Stwierdzenie wzrost badanej populacji jest określony rozkładem normalnym o parametrach m=1,75m i σ=0,1 jest hipotezą parametryczną, ponieważ określa wartość parametrów rozkładu oraz prostą, bo jednoznacznie definiuje rozkład. Stwierdzenie "wzrost badanej populacji jest określony rozkładem normalnym" jest hipotezą nieparametryczną - nie dotyczy wartości parametrów rozkładu i złożoną - określa więcej niż jeden możliwy rozkład.
Standardowy przebieg procedury weryfikacyjnej Reguły postępowania przy weryfikacji hipotez są określane mianem testów statystycznych 1. Sformułowanie hipotezy zerowej i alternatywnej Hipoteza zerowa (H 0 ) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako: Hipoteza alternatywna (H 1 ) - hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu: 2. Wybór statystyki testowej Wyznaczamy pewną funkcję wyników z próby losowej, i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję x ϴ nazywa się statystyką testową lub funkcją testową.
Standardowy przebieg procedury weryfikacyjnej 3. Określenie poziomu istotności α Na tym etapie procedury weryfikacyjnej przyjmujemy maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Prawdopodobieństwo to jest oznaczane symbolem α i nazywane poziomem istotności. Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy aby ryzyko popełnienia błędu było jak najmniejsze. Najczęściej zakładamy poziom istotności α=0.05, czasem przyjmuje się np. α=0.01 ; α=0.1 4. Podjęcie decyzji Wyznaczoną na podstawie próby wartość statystyki porównujemy z wartością krytyczną testu. Jeżeli wartość ta znajdzie się w obszarze krytycznym, to hipotezę zerową należy odrzucić jako nieprawdziwą. Stąd wniosek, że prawdziwa jest hipoteza alternatywna. Jeżeli natomiast wartość ta znajdzie się poza obszarem krytycznym, oznacza to, że brak jest podstaw do odrzucenia hipotezy zerowej. Stąd wniosek, że hipoteza zerowa może, ale nie musi, być prawdziwa, a postępowanie nie dało żadnych dodatkowych informacji uprawniających do podjęcia decyzji o przyjęciu lub odrzuceniu hipotezy zerowej.
BŁĘDY I i II RODZAJU DECYZJA Odrzucić H o H o jest prawdziwa Błąd I rodzaju p(błędu I rodz.) =α H o jest fałszywa Poprawna decyzja Nie odrzucić H o Poprawna decyzja Błąd II rodzaju p(błędu II rodz.) =β
OBSZAR KRYTYCZNY Obszar krytyczny- obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze, to weryfikowaną przez nas hipotezę H 0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną. DWUSTRONNY OBSZAR KRYTYCZNY test dwuśladowy (two-tail test)
OBSZAR KRYTYCZNY LEWOSTRONNY OBSZAR KRYTYCZNY Test jednośladowy (one- tail test) PRAWOSTRONNY OBSZAR KRYTYCZNY Test jednośladowy (one- tail test)
DECYZJE Obszar krytyczny od pozostałej części rozkładu statystyki oddzielony jest przez tzw. wartości krytyczne testu czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H 1.
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI ( znane σ ) Przypadek 1. Populacja generalna ma rozkład normalny N(µ, σ); odchylenie standardowe σ jest znane. Na podstawie n-elementowej próby sprawdzić, hipotezę: H o : µ= µ o (µ o -hipotetyczna wartość) wobec hipotezy alternatywnej: H 1 : µ µ o. Rozwiązanie: Statystyka testowa: ma rozkład N(0,1), dwustronny obszar krytyczny Dwustronny test Dla H 1 : µ > µ o lub H 1 : µ < µ o zastosować prawostronny lub lewostronny test, odpowiednio.
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (znane σ) Przykład 1: Automat formuje płytki ceramiczne o nominalnej wadze 250 g. Wiadomo, że rozkład wagi poszczególnych płytek ma rozkład N(m, 5). Kontrola techniczna pobrała losowo 16 płytek, ich średnia masa wyniosła 244 g. Czy można twierdzić, że automat rozregulował się i produkuje płytki o mniejszej wadze niż przewiduje norma. Na poziomie istotności α=0,05 zweryfikować odpowiednią hipotezę statystyczną. Rozwiązanie: Hipoteza zerowa H o : m= 250 g; H 1 : m < 250 g z =(244-250) *16 0,5 /5 = - 4,8 z EXCEL ROZKŁAD.NORMALNY.S.ODWR -z α = -1,64. Ponieważ : z < -z α H o należy odrzucić na korzyść H 1
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba duża) Przypadek 2. Populacja generalna ma rozkład normalny N(µ, σ) lub dowolny inny; odchylenie standardowe σ jest nieznane. Na podstawie dużej próby n 30 sprawdzić, hipotezę: H o : µ= µ o (µ o -hipotetyczna wartość) wobec hipotezy alternatywnej: H 1 : µ µ o. Rozwiązanie: Statystyka testowa: ma rozkład N(0,1), dwustronny obszar krytyczny (dalej postępować jak w Przypadku 1.
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI Przykład 2. : Badano czas zakończenia reakcji chemicznej. Wykonano n=60 powtórzeń, uzyskano xsr =46 s, s=13 s. Sprawdzić hipotezę, że średni czas zakończenia reakcji wynosi 50s. Przyjąć poziom istotności =0,01. Rozwiązanie: H o : µ =50 s ; H 1 : µ 50s (µ o =50 s). n=60, Statystyka testowa: =0,01 stąd /2=0,005, z ROZKŁAD.NORMALNY.S.ODWR mamy z =-2,57583. Wartość -2,36 leży poza obrębem obszaru krytycznego, więc nie ma podstaw do odrzucenia H o. Sprawdzając hipotezę, że średni czas reakcji jest większy niż 50 s mamy: H o : µ =50 s ; H 1 : µ > 50s (µ o =50 s). =0,01 (test jednostronny) ROZKŁAD.NORMALNY.S.ODWR mamy z =-2,32635. Wartość -2,36 leży w obrębie obszaru krytycznego, a więc H o odrzucamy.
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba duża) Przykład 3: W 82 wylosowanych zakładach, produkujących pewien artykuł, średnia cena jego produkcji wyniosła x sr =540 zł oraz s=150 zł. Na poziomie istotności α=0,05 zweryfikować hipotezę, że średnie koszty produkcji tego artykułu wynoszą 600 zł. Rozwiązanie: H o : x= 600 zł; H 1 : x 600 zł z= (540-600) * 81 1/2 / 150 = 3,6; z α/2 =1,96 Ponieważ: z >z α/2 więc H o należy odrzucić
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba mała) Przypadek 3. Populacja generalna ma rozkład normalny N(µ, σ),odchylenie standardowe σ jest nieznane. Na podstawie małej próby (n <30) sprawdzić, hipotezę: H o : µ= µ o (µ o -hipotetyczna wartość) wobec hipotezy alternatywnej: H 1 : µ µ o. Rozwiązanie: Statystyka testowa: ma rozkład t-studenta z k=n-1 stopniami swobody, dwustronny obszar krytyczny.
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba mała) Przykład 4: Wykonano 8 pomiarów przyspieszenia ziemskiego w pewnym miejscu i otrzymano wartości w cm 2 s -1 : 976,9 ; 978,2; 978,5; 977,6; 979,2; 980,4; 980,2; 978,8. Na poziomie istotności α=0,05 zweryfikować hipotezę, że wartość przyspieszenia wynosi tam 980 cm 2 s -1 Rozwiązanie: H o : g= 980 cm 2 s -1 ; H 1 : g 980 cm 2 s -1 g_i 976,9 978,2 978,5 977,6 979,2 980,4 980,2 978,8 g_sr= 978,725 s_g= 1,203269 t_alfa/2;7= 2,364624 t = (978,7-980,0) *7 1/2 /1,20 = 2,83 H o należy odrzucić
WARYFIKACJA HIPOTEZ dla μ: H o : µ= µ o (µ o -hipotetyczna wartość) H 1 : µ µ o lub: µ > µ o lub: µ <µ o Dane: próba losowa: P (n), poziom istotności: α PRÓBA LOSOWA P (n) Próba duża Mała (n <30) Gdy: σ znane (jest to słuszne też dla małej próby) Gdy: σ nieznane TYLKO dla dużej próby σ nieznane dla małej próby Z α N(0,1) : ROZKLAD.N.S.ODWR prawdopodobieństwo : a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α t α : ROZKLAD.T.ODWR Stopnie swobody: k=n-1, prawdopodobieństwo: a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α
Alternatywne podejście: p-wartości (p Value of a test) Powyższa standardowa procedura wymaga przyjęcia arbitralnego poziomu istotności α a wynikiem weryfikacji jest odpowiedź binarna albo statystyka testowa mieści się w przedziale ufności, albo nie. Alternatywnym i nowocześniejszym, choć mniej popularnym podejściem jest obliczenie zamiast tego surowej p-wartości (prawdopodobieństwa popełnienia błędu I rodzaju) i podawanie jej jako wyników weryfikacji. Dzięki temu nie ma potrzeby przyjmowania a priori żadnych wartości α, pozwala to również na porównywanie istotności różnych konkurencyjnych hipotez statystycznych. Definicja: p-wartość (p-value) testowania hipotezy jest to najmniejsza wartość (poziomu istotności), która prowadzi do odrzucenia hipotezy zerowej, H o. Ćwiczenie 3 W oparciu o wartości w Ćwiczeniu 2 wyznaczmy p- wartość. Mamy obliczoną wartość z=-2,36, z ROZKŁAD.NORMALNY.S dla tej wartości z uzyskujemy: 0,009137 jest to p/2 i p wartość odpowiednio dla testów dwu- i jednostronnych.
Alternatywne podejście: p-wartości PRZYKŁAD z 1-α/2 p=α 100 0 0,5 1 101 0,2 0,57926 0,841481 102 0,4 0,655422 0,689157 103 0,6 0,725747 0,548506 104 0,8 0,788145 0,423711 105 1 0,841345 0,317311 110 2 0,97725 0,0455 115 3 0,99865 0,0027 120 4 0,999968 6,33E-05 130 6 1 1,97E-09 160 12 1 0 180 16 1 0 Mała p-wartość wskazuje na poparcie hipotezy alternatywnej H 1 Duża p-wartość dostarcza mało argumentów na poparcie hipotezy alternatywnej