Uwagi: 27012014 poprawiono kilka literówek, zwi zanych z przedziaªami ufno±ci dla wariancji i odchylenia standardowego In»ynierskie zastosowania statystyki wiczenia Przedziaªy wiarygodno±ci, testowanie hipotez teoria i zadania Estymacja przedziaªowa Metody estymacji punktowej pozwalaj uzyska oceny punktowe nieznanych parametrów, ale bez okre±lenia dokªadno±ci otrzymanej oceny Estymacja przedziaªowa jest odpowiedzi na potrzeb uwzgl dnienia oceny tej dokªadno±ci, polega na podaniu przedziaªu ufno±ci dla nieznanego parametru danego rozkªadu We wszystkich poni»szych przypadkach przedziaªy ufno±ci s postaci [T L, T U ] (a) Przedziaª ufno±ci dla ±redniej (I model) Populacja ma rozkªad normalny N (µ, σ 2 ) Warto± µ jest nieznana, za± odchylenie standardowe σ w tej populacji jest znane Dolne i górne ograniczenie przedziaªu ufno±ci dla estymowanego parametru µ na poziomie ufno±ci 1 α wynosi T L = X z(1 α 2 ) σ n oraz T U = X +z(1 α 2 ) σ z(q) oznacza kwantyl rz du q rozkªadu N (0, 1) czyli z(q) ma t wªasno±,»e Φ(z(q)) = q (Zadanie 1) ufno±ci 1 α = 09 warto± oczekiwan przyjmuj c,»e rozkªad jest normalny oraz σ = 05 (II model) Populacja ma rozkªad normalny N (µ, σ 2 ) Nieznana jest warto± µ, jak i odchylenie standardowe σ Dolne i górne ograniczenie przedziaªu ufno±ci dla estymowanego parametru µ na poziomie ufno±ci 1 α wynosi T L = X t n 1 (1 α 2 ) S n oraz T U = X +t n 1 (1 α 2 ) S n t n 1 (x) oznacza warto± z tablic t-studenta o n 1 stopniach swobody, za± S = 1 n 1 ni=1 (X i X) 2 (Zadanie 2) ufno±ci 1 α = 09 warto± oczekiwan przyjmuj c,»e rozkªad jest normalny oraz odchylenie standardowe jest nieznane (III model) Populacja ma rozkªad normalny N (µ, σ 2 ) lub dowolny inny rozkªad o ±redniej µ i sko«czonej nieznanej wariancji σ 2 b d¹ rozkªad cechy dowolny, istnieje sko«czona wariancja Wybrano du» prób ( 30) Wówczas zmienna losowa Q(X, µ) = n( X µ) S ma w przybli»eniu rozkªad N (0, 1), zatem dolne i górne ograniczenie przedziaªu ufno±ci dla parametru µ na poziomie ufno±ci 1 α wynosi T L = X z(1 α 2 ) S n oraz T U = X + z(1 α 2 ) S n (Zadanie 3) Zmierzono warto± ±redni dªugo±ci ±wiecenia dla n = 100 losowo wybranych»arówek i otrzymano µ = 2402h przy odchyleniu standardowym σ = 618h Oszacowa na poziomie ufno±ci 1 α = 095 warto± oczekiwan czasu ±wiecenia (b) Przedziaª ufno±ci dla wariancji i odchylenia standardowego (I model) Populacja ma rozkªad normalny N (µ, σ 2 ), gdzie σ jest nieznane, a µ znane Dolne i górne n ograniczenie przedziaªu ufno±ci dla σ 2 i=1 na poziomie ufno±ci 1 α wynosi T L = (X i µ) 2 χ, 2 n(1 α/2) T U = n i=1 (X i µ) 2 χ 2 n (α/2), gdzie χ 2 n(q) jest kwantylem rz du q rozkªadu χ 2 z n stopniami swobody (Zadanie 4) ufno±ci 1 α = 09 odchylenie standardowe przyjmuj c,»e rozkªad jest normalny oraz µ = 015 n
(II model) Populacja ma rozkªad normalny N (µ, σ 2 ) Nieznana jest warto± µ, jak i odchylenie standardowe σ Dolne i górne ograniczenie przedziaªu ufno±ci dla estymowanego parametru σ 2 na poziomie ufno±ci 1 α wynosi T L = (n 1)S2 χ 2 (1 α/2), T U = (n 1)S2 n 1 χ 2 (α/2) n 1 (Zadanie 5) ufno±ci 1 α = 09 wariancj przyjmuj c,»e rozkªad jest normalny oraz odchylenie standardowe jest nieznane (III model) Populacja ma rozkªad normalny N (µ, σ 2 ) lub dowolny inny rozkªad o ±redniej µ i sko«czonej nieznanej wariancji σ 2 b d¹ rozkªad cechy dowolny, istnieje sko«czona wariancja Wybrano du» prób ( 30) Wówczas zmienna losowa Q(X, σ) = σ 2n 3 ma w przybli»eniu rozkªad N (0, 1), zatem dolne i górne ograniczenie przedziaªu ufno±ci dla parametru σ na poziomie ufno±ci 1 α wynosi T L = 2n 3+z(1 α/2), T U = 2n 3 z(1 α/2) (Zadanie 6) Zmierzono warto± ±redni dªugo±ci ±wiecenia dla n = 100 losowo wybranych»arówek i otrzymano µ = 2402h przy odchyleniu standardowym z próby S = 618h Oszacowa na poziomie ufno±ci 1 α = 095 przedziaª ufno±ci odchylenia standardowego czasu ±wiecenia dla tych»arówek Testowanie hipotez Przypuszczenie parametrów rozkªadu zmiennej losowej nazywa si hipotez parametryczn Pozostaªe hipotezy statystyczne nazywaj si nieparametryczne np przypuszczenie,»e dwie zmienne losowe s niezale»ne, b d¹ przypuszczenie,»e zmienna losowa ma rozkªad wykªadniczy W testowaniu hipotez trzeba wskaza dwie wykluczaj ce si wzajemnie hipotezy Hipoteza zerowa H 0 jest hipotez sprawdzan i procedury werykacji hipotez s sformuªowane z wyró»nieniem hipotezy zerowej Drug z hipotez nazywamy hipotez alternatywn H 1 Testem statystycznym hipotezy zerowej H 0 przeciwko hipotezie alternatywnej H 1 nazywamy statystyk, której warto± policzona na podstawie próby, pozwala zdecydowa o odrzuceniu H 0 na rzecz hipotezy H 1 Hipotez odrzucamy, gdy jej przyj cie oznaczaªoby,»e zaszªo zdarzenie bardzo maªo prawdopodobne - którego prawdopodobie«stwo byªoby mniejsze od α Hipotez nigdy nie przyjmujemy! Mo»emy je tylko z odpowiednim poziomem ufno±ci odrzuci lub nie mie podstaw do odrzucenia (a) Test dla ±redniej (I przypadek) Rozkªad cechy normalny, σ znane H 0 : µ = µ 0 przeciwko jednej z hipotez: H 1 : µ < µ 0, H 1 : µ > µ 0, H 1 : µ µ 0 Ustalony poziom istotno±ci α, najcz ±ciej α = 005 Statystyka testowa U = X µ 0 σ n ma rozkªad N (0, 1) przy prawdziwo±ci hipotezy H0 Wyznacz warto± u e statystyki testowej U na podstawie pobranej próby losowej Wyznacz obszar krytyczny Q Je±li u e Q, to mamy podstawy do odrzucenia H 0 na rzecz H 1 Dla H 1 : µ < µ 0, obszar krytyczny lewostronny Q = (, u α ), gdzie u α wyznaczone jest z zale»no±ci Φ(u α ) = 1 α Dla H 1 : µ > µ 0, obszar krytyczny prawostronny Q = (u α, ), gdzie u α wyznaczone jest z zale»no±ci Φ(u α ) = 1 α Dla H 1 : µ µ 0, obszar krytyczny dwustronny Q = (, u α ) (u α, ), gdzie u α wyznaczone jest z zale»no±ci Φ(u α ) = 1 α 2 (Zadanie 7) rednice ±rub pochodz cych z masowej produkcji maj rozkªad normalny, w którym znane jest σ = 01mm Na poziomie istotno±ci 005 zwerykowa hipotez H 0 : m = 8mm przeciwko hipotezie H 1 : m > 8mm w oparciu o nast puj ce wyniki pomiarów 7 wybranych ±rub: 831, 840, 825, 835, 836, 785, 828 (II przypadek) Rozkªad cechy normalny N (µ, σ), σ i µ nieznane Hipoteza H 0 i hipotezy alternatywne H 1 dotycz ce nieznanego parametru µ s takie same jak w poprzednim przypadku Statystyka werykuj ca hipotez H 0 : µ = µ 0 dana jest wzorem t = X µ 0 S n 1, która przy zaªo»eniu prawdziwo±ci hipotezy
H 0 ma rozkªad t-studenta o n 1 stopniach swobody W obszarach krytycznych z Przypadku I u α jest zast pione przez t α, które wyznaczane jest ze wzorów: P ( t > t α ) = α dla dwustronnego obszaru krytycznego, P (t > t α ) = 2α dla jednostronnych obszarów krytycznych Je±li dost pne tablice statystyczne podaj warto± krytyczn t α wedªug wzoru P ( t > t α ) = α dla danych α i n to w wyznaczaniu jednostronnych obszarów krytycznych trzeba skorzysta z zale»no±ci 2P (t > t α ) = P ( t > t α ) Je±li n > 30, statystyka t ma rozkªad w przybli»eniu normalny jak w kolejnym przypadku III (Zadanie 8) rednice ±rub pochodz cych z masowej produkcji maj rozkªad normalny, w którym nieznane jest σ Na poziomie istotno±ci 005 zwerykowa hipotez H 0 : m = 8mm przeciwko hipotezie H 1 : m > 8mm w oparciu o nast puj ce wyniki pomiarów 7 wybranych ±rub: 831, 840, 825, 835, 836, 785, 828 (III przypadek) Rozkªad cechy dowolny, istnieje sko«czona wariancja, du»a próba ( 30) Statystyka testowa U = X µ 0 S n 1 ma rozkªad asymptotycznie normalny N (0, 1) i dalsze procedury s identyczne jak w przypadku I (Zadanie 9) Z n = 36 prób wyznaczono x = 132 i s 2 = 0041 Na poziomie istotno±ci 01 zwerykowa hipotez,»e µ = 125 przeciwko hipotezie H 1 : µ > 125 (b) Test istotno±ci dla dwóch ±rednich Mamy podane dwie populacje generalne o rozkªadach normalnych N (µ 1, σ 1 ) i N (µ 2, σ 2 ), w których σ 1 i σ 2 s znane Test istotno±ci (czy ±rednia w obu populacjach jest taka sama, a wi c H 0 : µ 1 = µ 2 ) opiera si na zmiennej losowej u = x 1 x 2 σ1 2 n 1 + σ2 2 n 2 Zmienna u ma rozkªad N (0, 1), o ile hipoteza o równo±ciach ±rednich H 0 jest prawdziwa Posta hipotezy alternatywnej H 1 decyduje o obszarze krytycznym, który mo»e by jednostronny b d¹ dwustronny (Zadanie 10) W roku 2012 wybrano 100 losowo wybranych mieszka«ców Otwocka zjadªo przeci tnie 10kg czekolady rocznie przy odchyleniu standardowym 2kg, za± w roku 2013 spo±ród wybranych 225 losowych mieszka«ców Otwocka ±rednie spo»ycie czekolady wynosiªo 11kg przy odchyleniu standardowym 3kg Na poziomie istotno±ci α = 01 zwerykowa hipotez H 0 : µ 1 = µ 2,»e obie populacje maj takie samo ±rednie roczne spo»ycie czekolady (c) Test dla wariancji/odchylenia standardowego Maªa próba Przy testowaniu hipotezy dla wariancji H 0 : σ = σ 0 b dziemy bra pod uwag nast puj ce hipotezy alternatywne H 1 : σ > σ 0, H 1 : σ < σ 0 oraz H 1 : σ σ 0 Do testowania takiej hipotezy u»ywana jest statystyka χ 2 = ns2 Je±li cecha w populacji generalnej ma rozkªad normalny, to statystyka σ0 2 χ 2 obliczona z próby n-elementowej przy prawdziwo±ci H 0 ma rozkªad chi-kwadrat o n 1 stopniach swobody Warto± krytyczn χ 2 kryt odczytujemy z tablic rozkª du chi-kwadrat dla v = n 1 stopni swobody oraz: dla poziomu istotno±ci α gdy hipoteza alternatywna ma posta H 1 dla poziomu istotno±ci 1 α, gdy hipoteza alternatywna ma posta H 1 gdy hipoteza alternatywna ma posta H 1, odczytujemy dwie warto±ci krytyczne: χ 2 kryt1 dla poziomu istotno±ci 1 α 2 oraz χ 2 kryt2 dla poziomu istotno±ci α 2 Obszar krytyczny: W przypadku H 1 obszar prawostronny czyli Q = {χ 2 : χ 2 > χ 2 kryt },
W przypadku H 1 obszar lewostronny czyli Q = {χ 2 : χ 2 < χ 2 kryt }, W przypadku H 1 obszar obustronny czyli Q = {χ 2 : χ 2 kryt1 < χ2 < χ 2 kryt2 } Je»eli wyznaczona warto± statystyki χ 2 nie nale»y do Q, to nie ma podstaw do odrzucenia hipotezy zerowej Je»eli warto± χ 2 nale»y do Q, to hipotez H 0 odrzucamy na korzy± hipotezy alternatywnej (Zadanie 11) Cecha X ma rozkªad normalny o nieznanej warto±ci oczekiwanej i nieznanym odchyleniu standardowym σ Pi cioelementowa próba prosta: 12, 13, 11, 11, 13 Na poziomie istotno±ci α = 005 zwerykowa hipotez H 0 : σ = 008 przeciw hipotezie alternatywnej H 1 : σ > 008 Du»a próba Dla liczebno±ci próby n > 30 wyznaczon w poprzednim punkcie statystyk χ 2 mo»emy przeksztaªci w statystyk Z o rozkªadzie normalnym N (0, 1) obliczaj c Z = 2χ 2 2v 1 W powy»szym wzorze v = n 1 to liczba stopni swobody statystyki χ 2 Warto±ci krytyczne znajdujemy z tablic dystrybuanty rozkªadu normalnego S trzy warianty w zale»no±ci od hipotezy alternatywnej: H 1 : σ > σ 0, H 1 : σ < σ 0 oraz H 1 : σ σ 0 Z kryt = z(1 α) w przypadku H 1, Z kryt = z(1 α) w przypadku H 1, W przypadku H 1 mamy dwie warto±ci krytyczne: Z kryt1 = z(1 α 2 ), Z kryt2 = Z kryt1 W ka»dym z powy»szych z(q) oznacza kwantyl rozkªadu normalnego rz du q, a wi c liczb o nast puj cej wªasno±ci Φ(z(q)) = q Dalszy przebieg testu i wnioski tak jak poprzednio (Zadanie 12) Z n = 36 prób wyznaczono x = 132 i s 2 = 0041 Na poziomie istotno±ci 01 zwerykowa hipotez,»e σ = 025 przeciwko hipotezie H 1 : σ < 025 (d) Testy dla dwóch wariancji Dwie próby o liczno±ciach n 1, n 2 Znana wariancja z próby: odpowiednio S 2 1 oraz S 2 2 Werykacja nieparametrycznej hipotezy: próby pochodz z populacji o jednakowych wariancjach Hipoteza zerowa brzmi zatem H 0 : σ 2 1 = σ2 2 Znowu mog pojawi si trzy ró»ne hipotezy alternatywne: H 1 : σ 2 1 > σ2 2, H 1 : σ2 1 < σ2 2, H 1 : σ2 1 σ2 2 Maªa próba Mo»na skorzysta z testu Fishera W tym celu przyjmujemy H 0 : σ 2 1 > σ2 2 i wyznaczamy statystyk z próby postaci: F = n 1(n 2 1)S 2 1 n 2 (n 1 1)S 2 2 Statystyka ta ma rozkªad F Snadacora o liczbie stopni swobody v 1 = n 1 1 i v 2 = n 2 1 Z tablic rozkªadu dla testu prawostronnego odczytujemy warto± krytyczn : F kryt1 = F (α, v 1, v 2 ) Je»eli mamy stosowa test lewostronny, to lepiej zamieni miejscami próby 1 i 2, za± w przypadku testu obustronnego wyznaczamy F kryt1 = F ( α 2, v 1, v 2 ) oraz F kryt2 = 1 F kryt1 (Zadanie 13) W 4 czekoladach orzechowych rmy Mniam-mniam byªo 35, 41, 29, 45 procent zawarto±ci orzechów, za± w 5 czekoladach orzechowych rmy Pyyycha byªo odpowiednio 21, 32, 44, 23, 40 procent zawarto±ci orzechów Na poziomie istotno±ci α = 01 zwerykowa hipotez H 0 : σ 1 = σ 2,»e w obu populacjach utrzymany jest ten sam poziom odchylenia standardowego wzgl dem hipotezy alternatywnej H 1 : σ 1 σ 2 Du»a próba n 1 > 30, n 2 > 30 Wtedy wykorzystujemy statystyk Z o rozkªadzie normalnym N (0, 1): Z = S2 1 S2 2 S 2 1 2n 1 + S2 2 2n 2
i porównujemy jej warto± z warto±ciami granicznymi wyznaczonymi z tablicy dystrybuanty rozkªadu normalnego standardowego w ten sam sposób, jak dla testu jednej wariancji i du»ej próby (Zadanie 14) W roku 2012 wybrano 100 losowo wybranych mieszka«ców Otwocka zjadªo przeci tnie 10kg czekolady rocznie przy odchyleniu standardowym z próby S 1 = 2kg, za± w roku 2013 spo±ród wybranych 225 losowych mieszka«ców Otwocka ±rednie spo»ycie czekolady wynosiªo 11kg przy odchyleniu standardowym z próby wynosz cym S 2 = 3kg Na poziomie istotno±ci α = 01 zwerykowa hipotez H 0 : σ 1 = σ 2,»e w obu populacjach utrzymany jest ten sam poziom odchylenia standardowego Literatura [1] Ryszard Magiera, "Modele i metody statystyki matematycznej Cz ± II: Wnioskowanie statystyczne", GiS 2007