Przedziaªy ufo±ci a testowaie hipotez statystyczych Kospekt do zaj : Statystycze metody aalizy daych Agieszka Nowak-Brzezi«ska 26 listopada 2009 1 Wprowadzeie Celem zaj ma by omówieie podstawowych zagadie«i auka rozró»iaia estymacji puktowej i przedziaªowej od testowaia hipotez. Z uwagi a ograiczeia czasowe materiaª b dzie omawiaª tylko ajwa»iejsze tre±ci, reszt studet zajdzie w rozdziale trzecim podr czika: [J. Koroacki i J. Mieliczuk, Statystyka dla studetów kieruków techiczych i przyrodiczych, WNT 2006]. Aby ju» a samym poczatku usystematyzowa sobie wiedz w tym zakresie przypomijmy,»e: ˆ z estymacj b dziemy mie do czyieia zawsze wtedy, gdy a podstawie próby losowej próbujemy uogólia wyiki a ieza posta (i parametry) rozkªadu zmieej losowej caªej populacji oraz szacowa bª dy wyikaj ce z tego uogólieia. B dziemy wyró»ia (w ramach estymacji parametryczej) estymacj puktow oraz przedziaªow. W estymacji puktowej oce warto±ci szukaego parametru jest kokreta warto± uzyskaa z próby, atomiast w estymacji przedziaªowej operuje si poj ciem przedziaªu ufo±ci, czyli przedziaªu, do którego z pewym prawdopodobie«stwem ale»y szukaa warto±. ˆ z testowaiem hipotez za± b dziemy mie do czyieia wtedy, gdy ajpierw stawiamy przypuszczeia a temat rozkªadu, a ast pie sprawdzamy ich poprawo±. Pami tajmy,»e estymator to statystyka wyliczoa a podstawie próby a sªu-» ca do oszacowaia parametru caªej populacji. Mo»e im by ±redia arytmetycza, odchyleie stadardowe, mediaa, wspóªczyiki zmieo±ci. O estymacji (estymatorach) b dziemy mówi, zaim wykoamy prób, dlatego o tym,»e parametry szacowae b d a pewo obliczo warto±ci (dla estymacji puktowej) albo b d ale»e do pewego przewidziaego przedziaªu (dla estymacji przedziaªowej), mo»emy mówi jedyie z pewym prawdopodobie«stwem. Gdy jedak prób ju» wykoamy, to ie mówimy o prawdopodobie«stwie czy szacowaiu pewej warto±ci parametru (zmieej losowej) ale o kokretych realizacjach tych paramterów. 1
2 Estymacja puktowa i przedziaªowa Estymator puktowy to iaczej liczba (wyzaczoa a podstawie próby), która z pewym przybli»eiem okre±la warto± odpowiediego parametru w ca- ªej populacji. Puktowym estymatorem ±rediej z populacji m jest poprostu ±redia z próby ( x). Podobie, estymatorem odchyleia stadardowego s jest odchyleie stadardowe z próby ozaczay cz sto jako σ. Estymator przedziaªowy polega a okre±leiu tzw. przedziaªu ufo±ci czyli zakresu, w którym prawdopodobie (z prawdopodobie«stwem 1 α) zajduje si iezay parametr populacji µ. Prawdopodobie«stwo to zwae jest poziomem ufo±ci. Przedziaª ufo±ci kostruujemy a podstawie próby losowej i ufamy,»e b dzie o zawieraª prawdziw warto± szacowaego parametru µ. 2.1 Przedziaª ufo±ci 2.1.1 Przedziaª ufo±ci dla zaej wariacji S Przedziaª ufo±ci dla µ a poziomie ufo±ci 1 α daego rozkªadu ormalego, gdy zaa jest wariacja tego rozkªadu S ma posta : [ x z 1 α 2 σ, x + z 1 α 2 gdzie: ˆ x - ±redia z próby licz cej elemetów, ˆ σ - odchyleie stadardowe z próby, ˆ 1 α - poziom ufo±ci, σ ], ˆ z 1 α to kwatyl rz du 1 α 2 2 stadardowego rozkªadu ormalego. Jest to taka warto± zmieej losowej,»e warto±ci wi ksze lub rówe tej warto- ±ci (a prawo od tej warto±ci) s przyjmowae z prawdopodobie«stwem co ajmiej 1 α 2. Warto± ta odczytawaa jest z tablic rozkªadu ormalego stadaryzowaego N(0, 1). Przykªad takiej tablicy zajdziemy pod adresem: http://wojtek.zieliski.statystyka.ifo/iosci/ T01_ormaly.pdf Skoro uzajemy,»e P ( X µ z 1 α 2 σ ) = 1 α gdzie X to ±redia dla zaobserwowaej próby losowej, a µ to oszacowaa (estymowaa) warto± tego parametru, to zakªadamy,»e bª d (ró»ica warto±ci szacowaej do tej faktyczie potem uzyskaej z próby - bez wzgl du a warto± ) ie b dzie przekraczaª a poziomie ufo±ci 1 α warto±ci z 1 α 2 σ. 2.1.2 Przedziaª ufo±ci dla iezaej wariacji S Gdy ie zamy warto±ci odchyleia stadardowego, wówczas wyzaczamy zmie losow t = x µ S. Rozkªad tej zmieej ie zale»y od iezaego parametru µ i jest to tzw. rozkªad t Studeta z 1 stopiami swobody (t 1 ) o zaej 2
g sto±ci. Gdy mamy zmie losow t i jej rozkªad t 1, to przedziaª ufo±ci dla µ budujemy te» a poziomie ufo±ci 1 α [ x t 1 α 2, 1 s, x + t 1 α 2, 1 s ] gdzie t 1 α 2, 1 to kwatyl rz du 1 α rozkªadu 2 t 1. Warto±ci kwatyli odczytamy z tablic statystyczych dla rozkladu t Studeta. Powiy si oe azywa kwatyle t α, rozkªadu t Studeta z stopiami swobody. Przykªad takiej tablicy zajdziemy pod adresem: http://wojtek.zieliski. statystyka.ifo/iosci/t03_studet.pdf. 2.1.3 Zaczeie wielko±ci próby losowej Gdy próba losowa jest odpowiedio licza, wówczas zmiee T i Z staj si ierozró»iale, tz. kwatyle rozkªadu t d» do kwatyli tego samego rz du ale rozkªadu ormalego N(0.1). Czyli, dla dostateczie du»ej próby ( 30) przedziaª ufo±ci awet je±li ie zamy warto±ci odchyleia stadardowego σ b dzie przyjmowaª posta : [ x z 1 α 2 s, x + z 1 α s 2 ] dla warto±ci ±rediej µ a poziomie ufo±ci 1 α. Poziom ufo±ci rozumiemy tak,»e dla okoªo 100(1 α)% prób losowych obliczoy przedziaª ufo±ci zawiera szacoway parametr. Im wi kszy mamy zbiór obserwacji tym miejszy (w sesie dªugo±ci) b dzie ustaloy przedziaª ufo±ci. Je»eli α = 0.05, to 1 α = 0.95 ozacza to,»e ±redio a ka»de 100 przedziaªów obliczoych dla 100 prób losowych, w 95 przypadkach prawdziwa warto± parametru α zajduje si wew trz przedziaªu, atomiast w 5 przypadkach zajduje si poza przedziaªem. 2.2 Przykªad Powiedzmy,»e mamy dae warto±ci: 4, 15, 9, 16, 6, 5, 16, 4, 11, 8 Maj c podae warto±ci poszczególych elemetów próby mo»emy z ªatwo±ci wyzaczy warto± ±redi x = 9.4, za± odchyleie stadardowe 4.88. Przedziaª ufo±ci b dzie mówiª a ile ufamy (z jakim prawdopodobie«swem) temu,»e faktyczie te parametry (±redia, odchyleie stadardowe) b d przyjmowa okre±loe warto±ci. Wi c budujemy taki przedziaª ufo±ci: X N(9.4, 4.88 ) Je±li chcemy mówi o prawdopodobie«stwie ie miejszym i» 0.95, to aszym przypadku powiemy,»e z prawdopodobie«stwem rówym 95% powiemy,»e µ (6.38, 12.42). Najcz ±ciej stosuje si poziomy ufo±ci: 90%, 95%, 99%. Np. poziom ufo±ci o warto±ci 95% ozacza,»e ufamy daej iformacji w 95%, czyli bierzemy pod uwag,»e mog wyst pi bª dy, ale ie mo»e by ich wi cej i» 5%. Je±li teraz te 5% ma by rozªo»oe rówo dla warto±ci z graicy zbioru, czyli maj przekracza zaªo»oe warto±ci miimale i maksymale, to ozacza,»e szukamy w tabelach rozkªadu ormalego warto±ci odpowiadaj cej 0.0250 (czyli 2.5%, które uzyskali±my dziel c 5% a póª) a to warto± 1.96 (z = 1.96). 3
3 Przedziaªy ufo±ci w ±rodowisku R 3.1 Rozkªad ormaly Dae: ±redia = 5, odchyleie stadardowe = 2, rozmiar próby = 20, poziom ufo±ci 95% Szukae: przedziaª ufo±ci =? > a <- 5 > s <- 2 > <- 20 > error <- qorm(0.975)*s/sqrt() > left <- a-error > right <- a+error > left [1] 4.123477 > right [1] 5.876523 > Prawdziwa warto± ±rediej przy poziomie ufo±ci rówym 95% b dzie si mie±ciª w przedziale (4.12, 5.88). 3.2 Rozkªad t Studeta Dae: ±redia=5, stadardowe odchyleie=2, rozmiar próby = 20, poziom ufo±ci=95% Szukae: przedziaª ufo±ci=? > a <- 5 > s <- 2 > <- 20 > error <- qt(0.975,df=-1)*s/sqrt() > left <- a-error > right <- a+error > left [1] 4.063971 > right [1] 5.936029 Przedziaª ufo±ci dla prawdziwej warto±ci ±rediej przy zadaym poziomie ufo±ci rówym 95% ma posta : (4.06, 5.94). 4 Testowaie hipotez Z testowaiem hipotez mamy do czyieia zawsze wtedy, gdy ie chcemy estymowa daego parametru p. warto±ci ±rediej rozkªadu, ale iteresuje as p czy warto± ta jest miejsza, czy mo»e wi ksza, albo po prostu rówa pewej okre±loej warto±ci. Nie pytamy wi c ile wyosi warto± ±redia µ ale czy 4
µ < µ 0 (albo µ > µ 0, lub te» µ µ 0 ), gdzie µ 0 jest pew ustalo z góry liczb. Hipotezy statystycze zestawia b dziemy parami: hipotezie zerowej (podstawowej) przeciwstawimy hipotez przeciw tzw. alteratyw : ˆ hipoteza zerowa (H 0 ) mówi ca,»e fakt A jest prawdziwy, ˆ hipoteza alteratywa (H a ) mówi ca,»e fakt A jest faªszywy (w okre±loy sposób). Testowaie hipotez polega a wyborze mi dzy hipotez zerow podlegaj c werykacji H 0 a hipotez alteratyw H a, któr jeste±my skªoi przyj gdy odrzucimy hipotez zerow. Wyboru tego dokoujemy a podstawie wyików próby wylosowaej z populacji. Hipoteza zerowa to ta, w której prawdziwo± zazwyczaj ie wierzymy i tak aprawd b dziemy chcieli j odrzuci a korzy± tej drugiej zwaej alteratyw. Wa»e jest to,»e odrzuci mo»emy tylko hipotez zerow i to z okre±loym prawdopodobie«stwem popeªieia bª du, je±li zajdziemy ku temu powody (wówczas przyjmiemy za prawdziw hipotez alteratyw ). Natomiast trzeba wyra¹ie zazaczy,»e igdy testowaie hipotez ie b dzie prowadzi do udowodieia prawdziwo±ci daej hipotezy. Tylko jeda z hipotez mo»e by uzaa za prawdziw, wtedy drug uzamy za faªszyw. Skoro wszelkie wioski (hipotezy) wyci gamy a podstawie ie caªej populacji a jedyie wybraej próby musimy si liczy z tym,»e tylko z okre±loym prawdopodobie«stwej orzekamy o prawdziwo±ci stawiaej hipotezy. Warto± tego prawdopodobie«stwa precyzuj dwa bª dy statystycze: 1. bª d I-go rodzaju, mówi cy o prawdopodobie«stwie odrzuceia hipotezy zerowej gdy jest oa tak aprawd prawdziwa. Prawdopodobie«stwo to okre±limy jako α i b dziemy azywa poziomem istoto±ci testu. Je±li wi c dopuszczamy prawdopodobie«stwo bª du I-go rodzaju z warto±ci α = 0.01 ozacza to,»e, ±redio bior c, raz a sto wykoaych testów odrzucimy hipotez zerow gdy tak aprawd b dzie oa prawdziwa. 2. bª d drugiego rodzaju który ma miejsce wtedy, gdy ie odrzucimy hipotezy zerowej, mimo,»e jest oa faªszywa. Prawdopodobie«stwa popeªieia bª dów pierwszego i drugiego rodzaju oraz liczebo±ci próby s wielko±ciami zale»ymi. Je»eli liczebo± próby si ie zmieia, to zmiejszaj c warto± bª du I-go rodzaju, zwi kszamy prawdopodobie«stwo bª du II-go rodzaju. W teorii testowaia hipotez wa»y jest wybór poziomu istoto±ci, czyli dopuszczalego prawdopodobie«stwa bª dego odrzuceia hipotezy zerowej. Najcz ±ciej przyjmoway poziom istoto±ci to 0.05 ozaczaj cy,»e ±redio bª die odrzucimy hipotez zerow ie cz ±ciej i» raz a 20 razy. 4.1 Algorytm testowaia hipotez statystyczych Wioskowaie statystycze obejmuje ast puj ce czyo±ci: 1. Sformuªowaie hipotezy zerowej H 0 i hipotezy alteratywej H a. 2. Ustaleie poziomu istoto±ci α. 5
3. Wybór statystyki (tzw. statystyki testowej ) do werykacji hipotezy H 0 i ustaleie obszaru krytyczego (warto±ci krytyczych). 4. Obliczeie warto±ci statystyki w próbie. 5. Sformuªowaie wiosków (werykacja hipotezy H 0 ) przez porówaie warto±ci obliczoej statystyki z warto±ciami krytyczymi; b dzie to jede z dwóch wiosków: ˆ odrzuca si hipotez zerow i za prawdziw uzaje si hipotez alteratyw, lub ˆ ie ma podstaw do odrzuceia H 0 (co ozacza zgod a jej przyj cie). Test statystyczy opiera si a zaªo»eiu,»e gdy prawdziwa jest hipoteza zerowa, maªo prawdopodobe jest uzyskaie w próbie warto±ci statystyki z obszaru krytyczego, co ie ozacza,»e ie jest w ogóle iemo»liwe. Przyjmijmy,»e poziom istoto±ci α = 0.05 i wyobra¹my sobie,»e z populacji pobrao bardzo du»o prób tej samej wielko±ci. Nawet je»eli hipoteza H 0 jest prawdziwa to w 5% wszystkich prób uzyskamy warto± statystyki z obszaru krytyczego. W±ród tych 5% prób mo»e zale¹ si ta jeda reala próba, któr dyspoujemy i gdyby a jej podstawie testowa hipotez H 0, ale»aªoby j mimo prawdziwo±ci odrzuci. Popeªioy zostaªby bª d pierwszego rodzaju, polegaj cy a odrzuceiu hipotezy prawdziwej. Prawdopodobie«stwo popeªieia takiego bª du wyzacza poziom istoto±ci testu. Przyjmuj c jego i»sze warto±ci, zmiejszamy ryzyko popeªieia bª du pierwszego rodzaju. Rozwa»my test hipotezy takiej,»e ±redia w próbie rówa jest pewej okre±loej warto±ci: H 0 : µ = µ 0 za± H a : µ > µ 0 a poziomie istoto±ci α = 0.001. Je»eli zaobserwowaa warto± statystyki testowej z (w tym wypadku b dzie to warto± ±redia w próbie) jest typowa to ie b dzie podstaw do odrzuceia hipotezy zerowej. Natomiast im bardziej ta warto± b dzie ietypowa przy zachodzeiu H 0, tym wi ksze s szase a odrzuceie hipotezy zerowej. Ozaczaj c kwatyl rz du 1 α rozkªadu symbolem z 1 α mamy prawdopodobie«stwo hipotezy zerowej H 0 rówe: P H0 (z z 1 α ) = α. Powiemy,»e je±li hipoteza zerowa ma zaj± to warto±ci statystyki testowej z mog zale¹ si w zbiorze C = {z : z z 1 α }, czyli w zbiorze wszystkich takich elemetów które s ie miejsze i» z 1 α z prawdopodobie«stwem α. eby byªa jaso±, je±li α = 0.001 to z 1 α = z 0.999. Wi c z tablic rozkªadu b dziemy odczytywa warto± z 0.999, która wyosi 3.09. Teraz w takim razie, je±li otrzymaa warto± statystyki z b dzie ie miejsza i» 3.09 wówczas uzamy j za ietypow, i odrzucimy hipotez zerow a korzy± alteratywej. Je- ±li za± otrzymamy warto± miejsz i» 3.09 wówczas stwierdzimy, ze ie ma podstaw do odrzuceia hipotezy zerowej. Zbiór warto±ci statystyki testowej, który pozwala odrzuci H 0 azwiemy krytyczym C, i b dzie o zawieraª te warto±ci, które fatyczie s ie miejsze i» okre±loa warto± z 1 α. Natomiast zbiór takich warto±ci, które ie pozwol odrzuci H 0 azwiemy zbiorem przyj C. W takim razie, elemety le» ce a graicy tych dwóch zbiorów azwiemy warto±ciami krytyczymi. Tak aprawd hipotezy mo»emy podzieli a trzy zestawy mo»liwo±ci w przypadku badaia warto±ci ±rediej dla daej próby: 6
zbór hipoteza zerowa hipoteza alteratywa liczba stro przedziaªów 1 µ = µ 0 µ µ 0 2 2 µ > µ 0 µ < µ 0 1 3 µ < µ 0 µ > µ 0 1 Czyli je±li hipoteza zerowa mówi,»e pewa warto± statystyki testowej jest rówa pewej okre±loej warto±ci, za± alteratywa po prostu gªosi,»e ta warto± jest ia, wówczas mówimy o tzw. te±cie dwustroym - jako»e w kotek±cie hipotezy alteratywej twierdzimy jedyie,»e warto± krytycza jest ró»a od zadaej warto±ci statystyki testowej, a wi c jest albo miejsza albo wi ksza. Zatem o te±cie jedostroym b dziemy mówi, gdy warto± krytycza jest odpowiedio albo miejsza albo wi ksza od zadaej statystyki testowej. Bardzo istote jest potem okre±leie poziomu istoto±ci α. Musimy zatem okre±li jak u»y zaobserwowaej próby do przyj cia b d¹ odrzuceia hipotezy zerowej. W tym celu okre±lamy wªa±ie tzw. poziom istoto±ci. Najcz ±ciej te poziom okre±la warto±ci 0.01, 0.05, lub 0.10, ale geeralie warto± ta ale»y do przedziaªu 0.. 1. Test polega teraz a sprawdzeiu, czy asza hipoteza odo±ie warto±ci ±rediej ró»i si zacz c od pewej zaobserwowaej a wybraej próbie daych, warto±ci ±rediej. Wykoaie testu obejmuje oszacowaie bª du stadardowego, liczby stopi swobody, statystyki testowej oraz tzw. p - warto±ci. ˆ bª d stadardowy SE, który dla próby licz cej elemetów, b dziemy wyzacza jako: SE = s, ˆ stopie swobody DF, rówe rozmiarowi próby mius 1: DF = 1, ˆ statystyka testowa okre±loa symbolem t i obliczoa jako t = ( x µ), gdzie SE x to oczywi±cie warto± ±redia z proby, za± µ jest hipotez dotycz c ±rediej populacji (H 0 ) a SE jest bª dem stadardowym, ˆ p-warto± (p-value), której wyzaczaie jest bardzo subtelym zadaiem. Mo»emy po porstu powiedzie,»e im miejsza jest ta warto± tym bardziej jeste±my sªoi odrzuci hipotez zerow. 5 Przykªady 5.1 Test dwustroy Producet kosiarek zaiwestowaª w opracowaie owego eergooszcz dego silika do kosiarek. Twierdzi o,»e silik b dzie pracowaª ieprzerwaie przez 5 godzi (300 miut) a jede galo bezyy. Zbadao 50 silików, i okazaªo si,»e pracowaªy oe ze ±redim czasem rówym 295 miut, z odchyleiem stadardowym rówym 20 miut. Chcemy zatem sprawdzi, czy hipoteza o tym,»e te owy silik pracuje ze ±redim czasem 300 miut jest prawdziwa. A zatem hipoteza alteratywa b dzie mówi po prostu o tym,»e te czas jest ii i» 300 miut.przeprowadzimy test tej hipotezy, przy poziomie istoto±ci rówym 0.05. 1. Stawiamy hipotez : ˆ hipoteza zerowa H 0 : µ = 300 ˆ hipoteza alteratywa H a : µ 300 7
2. test przeprowadzimy dla poziomu istoto±ci α = 0.05 3. obliczymy warto± SE, i dla okre±loego df wyzaczymy warto± statystyki testowej t): ˆ SE = s = 20 50 = 20 7.07 = 2.83 ˆ DF = 1 = 50 1 = 49 ˆ t = ( x µ) SE = (295 300) 2.83 = 1.77 ˆ skoro mamy test obustroy, tz.,»e p - warto± jest prawdopodobie«stwem,»e dla 49 stopi swobody warto± statystyki t przez as wyzaczoa jest miejsza od 1.77 b d¹ wi ksza od +1.77. ˆ A wi c zajdujemy w tabelach rozkªadu ormalego 1 warto± P (t < 1.77) = 0.04 oraz P (t > 1.77) = 0.04. Wtedy, p-warto± = 0.04 + 0.04 = 0.08. 4. skoro p-warto± rówa 0.08 jest wi ksza i» poziom istoto±ci 0.05 to ie mo»emy odrzuci hipotezy zerowej. 5.2 Test jedostroy Pewa szkoªa podstawowa ma 300 ucziów. Dyrektor Szkoªy jest zdaia,»e ±redie IQ tych ucziów wyosi coajmiej 110. W celu zwerykowaia tej hipotezy, poddao testowi 20 wybraych ucziów. w±ród ich ±redia wyiosªa 108, przy odchyleiu stadardowym rówym 10. Chcemy wi c zaakceptowa b d¹ odrzuci t hipotez,»e ±redio ucze«tej szkoªy ma IQ przyajmiej 110. Test przeprowadzimy a poziomie istoto±ci rówym 0.01, ktory przypomijmy ozacza, ze zakªadamy,»e a 100 przeprowadzoych testów (o takiej samej wielko±ci próby) tylko w 1 przypadku dopuszczamy odrzuceie hipotezy zerowej w przypadku gdy tak aprawd bylaby oa prawdziwa. 1. stawiamy hipotez : ˆ hipoteza zerowa H 0 : µ 110 ˆ hipoteza alteratywa H a : µ < 110 2. poziom istoto±ci test ma wyosi 0.01. 3. obliczymy warto± SE, i dla okre±loego df wyzaczymy warto± statystyki testowej t): ˆ SE = s = 10 20 = 10 4.472 = 2.236 ˆ DF = 1 = 20 1 = 19 ˆ t = ( x µ) SE = (108 110) 2.236 = 0.894 ˆ skoro mamy test jedostroy, tz.,»e p-warto± ma by prawdopodobie«stwem»e obliczoa statystyka testowa t przy 19 stopiach swobody jest miejsza i» 0.894 ˆ A wi c zajdujemy w tabelach rozkªadu ormalego 2 p-warto± jako P (t < 0.894) = 0.19. 1 http://stattrek.com/tables/t.aspx 2 http://stattrek.com/tables/t.aspx 8
4. Je±li p warto± jest rówa 0.19 a wi c jest wi ksza i» zaday poziom istoto±ci 0.01 ie mo»emy odrzuci hipotezy zerowej. 6 Testowaie hipotez w ±rodowisku R Dae: Odchyleie stadardowe=20, rozmiar próby = 50, poziom ufo±ci=95% Szukae: prawdziwa warto± ±redia =? Przyjmujemy,»e warto± ta mo»e si waha w stosuku do szacowaej warto±ci a o warto± 1.5 > a<-300 > s<-20 > <-50 > error <- qorm(0.975)*s/sqrt() > left <- a-error > right <- a+error > left [1] 294.4564 > right [1] 305.5436 Widzimy,»e a poziomie istoto±ci 0.95 przedziaª ufo±ci dla ±rediej warto±ci próby ma posta (294.4564, 305.5436). Teraz chcemy wyzaczy warto± statystyki z dla prawdziwej warto±ci ±rediej rówej 300 + 1.5 = 301.5: > assumed <- a + 1.5 > Zleft <- (left-assumed)/(s/sqrt()) > Zright <-(right-assumed)/(s/sqrt()) > p <- porm(zright)-porm(zleft) > p [1] 0.917207 Prawdopodobie«stwo popeªieia bª du II rodzaju (czyli przyj cia hipotezy zerowej,»e ±redia jest rówa 301.5 gdy jest oa faªszywa) wyosi w przybli»eie 8%. Moc testu wyzaczymy jako 1 p: > 1-p [1] 0.08279293 Moc testu wyosi ok 91.8%, co ozacza,»e je±li prawdziwa warto± ±redia ró»i si od warto±ci 300 o 1.5 to prawdopodobie«stwo,»e odrzucimy hipotez zerow jest du»e i wyosi ok 91.8%. Mo»emy tak aprawd u»y jedej tylko komedy R, której wykoaie wyzaczy wszystkie potrzebe iformacje: > power.t.test(=,delta=1.5,sd=s,sig.level=0.05, + type="oe.sample",alterative="two.sided",strict = TRUE) Oe-sample t test power calculatio = 50 delta = 1.5 sd = 20 9
sig.level = 0.05 power = 0.0815095 alterative = two.sided 7 Maªy eksperymet - bardzo pouczaj cy Zaªó»my,»e mamy do rozwi zaia ast puj cy problem: Cea metra kwadratowego (w tys.zª) dla 14 losowo wybraych mieszka«w mie±cie A: 3.75, 3.89, 5.09, 3.77, 3.53, 2.82, 3.16, 2.79, 4.34, 3.61, 4.31, 3.31, 2.50, 3.27 W prasie podao iformacj,»e ±redia cea metra kwadratowego wyosi 3.8 tys. zª. Czy powy»sze dae potwierdzaj to stwierdzeie? W ±rodowisku R test dla hipotezy zerowej mówi cej,»e ±redia wyosi 3.8 tys. zª, b dzie wygl daª ast puj co: > z<-c(3.75,3.89,5.09,3.77,3.53,2.82,3.16,2.79,4.34,3.61,4.31,3.31,2.50,3.27) > t.test(z,mu=3.8) Oe Sample t-test data: z t = -1.1777, df = 13, p-value = 0.26 alterative hypothesis: true mea is ot equal to 3.8 95 percet cofidece iterval: 3.180491 3.982366 sample estimates: mea of x 3.581429 Zwró my uwag,»e a poziomie istoto±ci 0.95 ale»y odrzuci hipotez zerow a korzy± hipotezy alteratywej, która mówi,»e po prostu ±redia cea metra kwadratowego mieszka«w mie±cie A ie wyosi 3.8 tys. zª. To co jest tu istote, i co b dziemy dalej aalizowa to p-warto± która tutaj jest rowa 0.26 i statystyka testowa t, która wyosi 1.1777. A teraz sprawd¹my co si staie, gdyby±my asz hipotez przybli»yli do faktyczej warto±ci ±rediej: > t.test(z,mu=3.5) Oe Sample t-test data: z t = 0.4388, df = 13, p-value = 0.668 alterative hypothesis: true mea is ot equal to 3.5 95 percet cofidece iterval: 3.180491 3.982366 sample estimates: mea of x 3.581429 Widzimy,»e p-warto± wzrasta (a statystyka testowa t maleje) gdy asza hipoteza jest bli»sza prawdzie i zwró my uwag rówie» i a to,»e ie zmieiaj c poziomu istoto±ci ie zmieia si przedziaª ufo±ci dla warto±ci ±rediej. A teraz podajmy hipotez rów prawdziwej warto±ci ±rediej: 10
> t.test(z,mu= 3.581429) Oe Sample t-test data: z t = 0, df = 13, p-value = 1 alterative hypothesis: true mea is ot equal to 3.581429 95 percet cofidece iterval: 3.180491 3.982366 sample estimates: mea of x 3.581429 Jak widzimy, gdy podali±my dokªadie tak hipotez dotycz c warto±ci ±rediej w daym zbiorze jak prawdziwa warto± ±redia, wówczas statystyka testowa t rówa si 0 za± p-warto± rówa si 1. Iymi sªowy: Im miejsza b dzie p-warto±, tym mociejsze staje si przekoaie o faªszywo±ci hipotezy zerowej i prawdziwo±ci hipotezy alteratywej. 8 Zadaia 1. W pewej miejscowo±ci mieszka«cy twierdz,»e ±redie oszcz do±ci przypadaj ce a jedego mieszka«ca s i»sze od 14415 zª. Czy to twierdzeie jest sªusze, skoro dla losowy wybraych 314 osób ±redie oszcz do±ci wyosiªy 14316 zª, z odchyleiem stadardowym 268, 8 zª (przyjmij poziom istoto±ci 0.05). 2. W pewej cukieri postaowioo sprawdzi, czy rzeczywi±cie ±redia rocza ilo± (w kg) kupowaych ciastek przez jedego klieta wyosi 15 kg. W celu sprawdzeia, tego twierdzeia, zbadao 10 klietów i okazaªo si,»e ±redia ilo± kupowaych ciastek wyosi 14, 2 kg, a odchyleie stadardowe 1, 2 kg. Werykacj tej hipotezy przeprowad¹ przy poziomie istoto±ci 0.02. 9 Podpowiedzi do zada«1. Zadaie 1. test jedostroy, odrzucimy hipotez zerow. 2. Zadaie 2. test dwustroy, ie b dzie podstaw by odrzuci hipotez zerow. 10 Bibliograa Opracowaie przygotowao w oparciu o prace: 1. J. Koroacki i J. Mieliczuk, Statystyka dla studetów kieruków techiczych i przyrodiczych, WNT, 2006 2. C. Wataªa, Biostatystyka - wykorzystaie metod statystyczych w pracy badawczej w aukach biomedyczych, Alfa Medica Press, 2002 11
3. http://www.cyclismo.org/tutorial/r/power.html 4. http://www.sgh.waw.pl/prywate/mpodog/dydaktyka/statystyka/hipotezy. pdf 12