Przedziaªy ufno±ci a testowanie hipotez statystycznych Konspekt do zaj : Statystyczne metody analizy danych

Podobne dokumenty
Wykład 11 ( ). Przedziały ufności dla średniej

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

In»ynierskie zastosowania statystyki wiczenia

1 Testy statystyczne. 2 Rodzaje testów

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

ANALIZA DANYCH DYSKRETNYCH

Statystyka matematyczna dla leśników

Pojcie estymacji. Metody probabilistyczne i statystyka Wykład 9: Estymacja punktowa. Własnoci estymatorów. Rozkłady statystyk z próby.

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Biostatystyka, # 5 /Weterynaria I/

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Estymacja parametrów populacji

Estymacja przedziałowa

Estymacja przedziałowa - przedziały ufności

Politechnika Wrocªawska Instytut Matematyki i Informatyki. Statystyka w liceum. Paweª Sztonyk

Wykªad 05 (granice c.d., przykªady) Rozpoczniemy od podania kilku przykªadów obliczania granic ci gów. n an = + dla a > 1. (5.1) lim.

Lista 6. Estymacja punktowa

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

szereg jest szeregiem o wyrazach nieujemnych. Ponadto dla α (0; π ) zachodzi nierówno± sinα < α,

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Elementy modelowania matematycznego

Estymacja przedziałowa:

Parametryczne Testy Istotności

Elementarna statystyka Test Istotno±ci (Tests of Signicance)

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Metody probablistyczne i statystyka stosowana

Statystyka. Katarzyna Chudy Laskowska

Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Statystyka matematyczna - ZSTA LMO

Estymacja przedziałowa - przedziały ufności

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

STATYSTYKA I ANALIZA DANYCH

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

16 Przedziały ufności

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Podstawy matematyki nansowej

Elementarna statystyka Test Istotno±ci

1 Wnioskowanie statystyczne podstawowe poj cia

θx θ 1, dla 0 < x < 1, 0, poza tym,

Marek Be±ka, Statystyka matematyczna, wykªad Wykªadnicze rodziny rozkªadów prawdopodobie«stwa

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Prawdopodobieństwo i statystyka r.

2 Liczby rzeczywiste - cz. 2

µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0

EKONOMETRIA. Temat wykładu: Co to jest model ekonometryczny? Dobór zmiennych objaśniających w modelu ekonometrycznym CZYM ZAJMUJE SIĘ EKONOMETRIA?

(X i X) 2. n 1. X m S

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Estymacja punktowa i przedziałowa

Rozwini cia asymptotyczne dla mocy testów przybli»onych

Czas trwania obligacji (duration)

O liczbach naturalnych, których suma równa się iloczynowi

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Prawdopodobieństwo i statystyka r.

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Prace domowe z matematyki Semestr zimowy 2010/2011. Zoa Zieli«ska-Kolasi«ska

A.1. Asymptotyka bez notacji asymptotycznej. Przykªad A.1. Zbada zachowanie asymptotyczne liczb Fibonacciego. Pokaza,»e. F n = round ( 1 5 Φ n )

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Wykªad 2. Szeregi liczbowe.

Tw. 1. Je»eli ci g {a n } ma granic a i ci g {b n } ma granic b, to ci g {a n b n } ma granic a b. Tw. 2. b n. Tw. 3. Tw. 4.

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Przedziały ufności. dr Alina Semrau-Giłka

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Lab. 02: Algorytm Schrage

> 1), wi c na mocy kryterium porównawczego szereg sin(n n)

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

wi c warunek konieczny zbie»no±ci szeregu jest speªniony. 12 = 9 12 = 3 4 k(k+1) k=1 ( k+1 k(k+1) n+1 = 1 1 n+1 = 1 0 = 1 36 = =

Zbiory. Zadanie 5. Wykaza to»samo±ci (a) A (B \ C) = [(A B) \ C] (A C), (b) A \ [B \ (C \ D)] = (A \ B) [(A C) \ D],

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

RAP pa¹dziernika S n = S 0 + i=1. p r q l = p r q l r. N n(a,b)

Statystyka Matematyczna Anna Janicka

2.1. Studium przypadku 1

MODELE LINIOWE i MIESZANE

CAŠKOWANIE METODAMI MONTE CARLO Janusz Adamowski

test dla średniej rozkładu normalnego moc testu test dla wariancji rozkładu normalnego test dla rozkładu dwumianowego, Poissona

ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15

1 Metody iteracyjne rozwi zywania równania f(x)=0

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Transkrypt:

Przedziaªy ufo±ci a testowaie hipotez statystyczych Kospekt do zaj : Statystycze metody aalizy daych Agieszka Nowak-Brzezi«ska 26 listopada 2009 1 Wprowadzeie Celem zaj ma by omówieie podstawowych zagadie«i auka rozró»iaia estymacji puktowej i przedziaªowej od testowaia hipotez. Z uwagi a ograiczeia czasowe materiaª b dzie omawiaª tylko ajwa»iejsze tre±ci, reszt studet zajdzie w rozdziale trzecim podr czika: [J. Koroacki i J. Mieliczuk, Statystyka dla studetów kieruków techiczych i przyrodiczych, WNT 2006]. Aby ju» a samym poczatku usystematyzowa sobie wiedz w tym zakresie przypomijmy,»e: ˆ z estymacj b dziemy mie do czyieia zawsze wtedy, gdy a podstawie próby losowej próbujemy uogólia wyiki a ieza posta (i parametry) rozkªadu zmieej losowej caªej populacji oraz szacowa bª dy wyikaj ce z tego uogólieia. B dziemy wyró»ia (w ramach estymacji parametryczej) estymacj puktow oraz przedziaªow. W estymacji puktowej oce warto±ci szukaego parametru jest kokreta warto± uzyskaa z próby, atomiast w estymacji przedziaªowej operuje si poj ciem przedziaªu ufo±ci, czyli przedziaªu, do którego z pewym prawdopodobie«stwem ale»y szukaa warto±. ˆ z testowaiem hipotez za± b dziemy mie do czyieia wtedy, gdy ajpierw stawiamy przypuszczeia a temat rozkªadu, a ast pie sprawdzamy ich poprawo±. Pami tajmy,»e estymator to statystyka wyliczoa a podstawie próby a sªu-» ca do oszacowaia parametru caªej populacji. Mo»e im by ±redia arytmetycza, odchyleie stadardowe, mediaa, wspóªczyiki zmieo±ci. O estymacji (estymatorach) b dziemy mówi, zaim wykoamy prób, dlatego o tym,»e parametry szacowae b d a pewo obliczo warto±ci (dla estymacji puktowej) albo b d ale»e do pewego przewidziaego przedziaªu (dla estymacji przedziaªowej), mo»emy mówi jedyie z pewym prawdopodobie«stwem. Gdy jedak prób ju» wykoamy, to ie mówimy o prawdopodobie«stwie czy szacowaiu pewej warto±ci parametru (zmieej losowej) ale o kokretych realizacjach tych paramterów. 1

2 Estymacja puktowa i przedziaªowa Estymator puktowy to iaczej liczba (wyzaczoa a podstawie próby), która z pewym przybli»eiem okre±la warto± odpowiediego parametru w ca- ªej populacji. Puktowym estymatorem ±rediej z populacji m jest poprostu ±redia z próby ( x). Podobie, estymatorem odchyleia stadardowego s jest odchyleie stadardowe z próby ozaczay cz sto jako σ. Estymator przedziaªowy polega a okre±leiu tzw. przedziaªu ufo±ci czyli zakresu, w którym prawdopodobie (z prawdopodobie«stwem 1 α) zajduje si iezay parametr populacji µ. Prawdopodobie«stwo to zwae jest poziomem ufo±ci. Przedziaª ufo±ci kostruujemy a podstawie próby losowej i ufamy,»e b dzie o zawieraª prawdziw warto± szacowaego parametru µ. 2.1 Przedziaª ufo±ci 2.1.1 Przedziaª ufo±ci dla zaej wariacji S Przedziaª ufo±ci dla µ a poziomie ufo±ci 1 α daego rozkªadu ormalego, gdy zaa jest wariacja tego rozkªadu S ma posta : [ x z 1 α 2 σ, x + z 1 α 2 gdzie: ˆ x - ±redia z próby licz cej elemetów, ˆ σ - odchyleie stadardowe z próby, ˆ 1 α - poziom ufo±ci, σ ], ˆ z 1 α to kwatyl rz du 1 α 2 2 stadardowego rozkªadu ormalego. Jest to taka warto± zmieej losowej,»e warto±ci wi ksze lub rówe tej warto- ±ci (a prawo od tej warto±ci) s przyjmowae z prawdopodobie«stwem co ajmiej 1 α 2. Warto± ta odczytawaa jest z tablic rozkªadu ormalego stadaryzowaego N(0, 1). Przykªad takiej tablicy zajdziemy pod adresem: http://wojtek.zieliski.statystyka.ifo/iosci/ T01_ormaly.pdf Skoro uzajemy,»e P ( X µ z 1 α 2 σ ) = 1 α gdzie X to ±redia dla zaobserwowaej próby losowej, a µ to oszacowaa (estymowaa) warto± tego parametru, to zakªadamy,»e bª d (ró»ica warto±ci szacowaej do tej faktyczie potem uzyskaej z próby - bez wzgl du a warto± ) ie b dzie przekraczaª a poziomie ufo±ci 1 α warto±ci z 1 α 2 σ. 2.1.2 Przedziaª ufo±ci dla iezaej wariacji S Gdy ie zamy warto±ci odchyleia stadardowego, wówczas wyzaczamy zmie losow t = x µ S. Rozkªad tej zmieej ie zale»y od iezaego parametru µ i jest to tzw. rozkªad t Studeta z 1 stopiami swobody (t 1 ) o zaej 2

g sto±ci. Gdy mamy zmie losow t i jej rozkªad t 1, to przedziaª ufo±ci dla µ budujemy te» a poziomie ufo±ci 1 α [ x t 1 α 2, 1 s, x + t 1 α 2, 1 s ] gdzie t 1 α 2, 1 to kwatyl rz du 1 α rozkªadu 2 t 1. Warto±ci kwatyli odczytamy z tablic statystyczych dla rozkladu t Studeta. Powiy si oe azywa kwatyle t α, rozkªadu t Studeta z stopiami swobody. Przykªad takiej tablicy zajdziemy pod adresem: http://wojtek.zieliski. statystyka.ifo/iosci/t03_studet.pdf. 2.1.3 Zaczeie wielko±ci próby losowej Gdy próba losowa jest odpowiedio licza, wówczas zmiee T i Z staj si ierozró»iale, tz. kwatyle rozkªadu t d» do kwatyli tego samego rz du ale rozkªadu ormalego N(0.1). Czyli, dla dostateczie du»ej próby ( 30) przedziaª ufo±ci awet je±li ie zamy warto±ci odchyleia stadardowego σ b dzie przyjmowaª posta : [ x z 1 α 2 s, x + z 1 α s 2 ] dla warto±ci ±rediej µ a poziomie ufo±ci 1 α. Poziom ufo±ci rozumiemy tak,»e dla okoªo 100(1 α)% prób losowych obliczoy przedziaª ufo±ci zawiera szacoway parametr. Im wi kszy mamy zbiór obserwacji tym miejszy (w sesie dªugo±ci) b dzie ustaloy przedziaª ufo±ci. Je»eli α = 0.05, to 1 α = 0.95 ozacza to,»e ±redio a ka»de 100 przedziaªów obliczoych dla 100 prób losowych, w 95 przypadkach prawdziwa warto± parametru α zajduje si wew trz przedziaªu, atomiast w 5 przypadkach zajduje si poza przedziaªem. 2.2 Przykªad Powiedzmy,»e mamy dae warto±ci: 4, 15, 9, 16, 6, 5, 16, 4, 11, 8 Maj c podae warto±ci poszczególych elemetów próby mo»emy z ªatwo±ci wyzaczy warto± ±redi x = 9.4, za± odchyleie stadardowe 4.88. Przedziaª ufo±ci b dzie mówiª a ile ufamy (z jakim prawdopodobie«swem) temu,»e faktyczie te parametry (±redia, odchyleie stadardowe) b d przyjmowa okre±loe warto±ci. Wi c budujemy taki przedziaª ufo±ci: X N(9.4, 4.88 ) Je±li chcemy mówi o prawdopodobie«stwie ie miejszym i» 0.95, to aszym przypadku powiemy,»e z prawdopodobie«stwem rówym 95% powiemy,»e µ (6.38, 12.42). Najcz ±ciej stosuje si poziomy ufo±ci: 90%, 95%, 99%. Np. poziom ufo±ci o warto±ci 95% ozacza,»e ufamy daej iformacji w 95%, czyli bierzemy pod uwag,»e mog wyst pi bª dy, ale ie mo»e by ich wi cej i» 5%. Je±li teraz te 5% ma by rozªo»oe rówo dla warto±ci z graicy zbioru, czyli maj przekracza zaªo»oe warto±ci miimale i maksymale, to ozacza,»e szukamy w tabelach rozkªadu ormalego warto±ci odpowiadaj cej 0.0250 (czyli 2.5%, które uzyskali±my dziel c 5% a póª) a to warto± 1.96 (z = 1.96). 3

3 Przedziaªy ufo±ci w ±rodowisku R 3.1 Rozkªad ormaly Dae: ±redia = 5, odchyleie stadardowe = 2, rozmiar próby = 20, poziom ufo±ci 95% Szukae: przedziaª ufo±ci =? > a <- 5 > s <- 2 > <- 20 > error <- qorm(0.975)*s/sqrt() > left <- a-error > right <- a+error > left [1] 4.123477 > right [1] 5.876523 > Prawdziwa warto± ±rediej przy poziomie ufo±ci rówym 95% b dzie si mie±ciª w przedziale (4.12, 5.88). 3.2 Rozkªad t Studeta Dae: ±redia=5, stadardowe odchyleie=2, rozmiar próby = 20, poziom ufo±ci=95% Szukae: przedziaª ufo±ci=? > a <- 5 > s <- 2 > <- 20 > error <- qt(0.975,df=-1)*s/sqrt() > left <- a-error > right <- a+error > left [1] 4.063971 > right [1] 5.936029 Przedziaª ufo±ci dla prawdziwej warto±ci ±rediej przy zadaym poziomie ufo±ci rówym 95% ma posta : (4.06, 5.94). 4 Testowaie hipotez Z testowaiem hipotez mamy do czyieia zawsze wtedy, gdy ie chcemy estymowa daego parametru p. warto±ci ±rediej rozkªadu, ale iteresuje as p czy warto± ta jest miejsza, czy mo»e wi ksza, albo po prostu rówa pewej okre±loej warto±ci. Nie pytamy wi c ile wyosi warto± ±redia µ ale czy 4

µ < µ 0 (albo µ > µ 0, lub te» µ µ 0 ), gdzie µ 0 jest pew ustalo z góry liczb. Hipotezy statystycze zestawia b dziemy parami: hipotezie zerowej (podstawowej) przeciwstawimy hipotez przeciw tzw. alteratyw : ˆ hipoteza zerowa (H 0 ) mówi ca,»e fakt A jest prawdziwy, ˆ hipoteza alteratywa (H a ) mówi ca,»e fakt A jest faªszywy (w okre±loy sposób). Testowaie hipotez polega a wyborze mi dzy hipotez zerow podlegaj c werykacji H 0 a hipotez alteratyw H a, któr jeste±my skªoi przyj gdy odrzucimy hipotez zerow. Wyboru tego dokoujemy a podstawie wyików próby wylosowaej z populacji. Hipoteza zerowa to ta, w której prawdziwo± zazwyczaj ie wierzymy i tak aprawd b dziemy chcieli j odrzuci a korzy± tej drugiej zwaej alteratyw. Wa»e jest to,»e odrzuci mo»emy tylko hipotez zerow i to z okre±loym prawdopodobie«stwem popeªieia bª du, je±li zajdziemy ku temu powody (wówczas przyjmiemy za prawdziw hipotez alteratyw ). Natomiast trzeba wyra¹ie zazaczy,»e igdy testowaie hipotez ie b dzie prowadzi do udowodieia prawdziwo±ci daej hipotezy. Tylko jeda z hipotez mo»e by uzaa za prawdziw, wtedy drug uzamy za faªszyw. Skoro wszelkie wioski (hipotezy) wyci gamy a podstawie ie caªej populacji a jedyie wybraej próby musimy si liczy z tym,»e tylko z okre±loym prawdopodobie«stwej orzekamy o prawdziwo±ci stawiaej hipotezy. Warto± tego prawdopodobie«stwa precyzuj dwa bª dy statystycze: 1. bª d I-go rodzaju, mówi cy o prawdopodobie«stwie odrzuceia hipotezy zerowej gdy jest oa tak aprawd prawdziwa. Prawdopodobie«stwo to okre±limy jako α i b dziemy azywa poziomem istoto±ci testu. Je±li wi c dopuszczamy prawdopodobie«stwo bª du I-go rodzaju z warto±ci α = 0.01 ozacza to,»e, ±redio bior c, raz a sto wykoaych testów odrzucimy hipotez zerow gdy tak aprawd b dzie oa prawdziwa. 2. bª d drugiego rodzaju który ma miejsce wtedy, gdy ie odrzucimy hipotezy zerowej, mimo,»e jest oa faªszywa. Prawdopodobie«stwa popeªieia bª dów pierwszego i drugiego rodzaju oraz liczebo±ci próby s wielko±ciami zale»ymi. Je»eli liczebo± próby si ie zmieia, to zmiejszaj c warto± bª du I-go rodzaju, zwi kszamy prawdopodobie«stwo bª du II-go rodzaju. W teorii testowaia hipotez wa»y jest wybór poziomu istoto±ci, czyli dopuszczalego prawdopodobie«stwa bª dego odrzuceia hipotezy zerowej. Najcz ±ciej przyjmoway poziom istoto±ci to 0.05 ozaczaj cy,»e ±redio bª die odrzucimy hipotez zerow ie cz ±ciej i» raz a 20 razy. 4.1 Algorytm testowaia hipotez statystyczych Wioskowaie statystycze obejmuje ast puj ce czyo±ci: 1. Sformuªowaie hipotezy zerowej H 0 i hipotezy alteratywej H a. 2. Ustaleie poziomu istoto±ci α. 5

3. Wybór statystyki (tzw. statystyki testowej ) do werykacji hipotezy H 0 i ustaleie obszaru krytyczego (warto±ci krytyczych). 4. Obliczeie warto±ci statystyki w próbie. 5. Sformuªowaie wiosków (werykacja hipotezy H 0 ) przez porówaie warto±ci obliczoej statystyki z warto±ciami krytyczymi; b dzie to jede z dwóch wiosków: ˆ odrzuca si hipotez zerow i za prawdziw uzaje si hipotez alteratyw, lub ˆ ie ma podstaw do odrzuceia H 0 (co ozacza zgod a jej przyj cie). Test statystyczy opiera si a zaªo»eiu,»e gdy prawdziwa jest hipoteza zerowa, maªo prawdopodobe jest uzyskaie w próbie warto±ci statystyki z obszaru krytyczego, co ie ozacza,»e ie jest w ogóle iemo»liwe. Przyjmijmy,»e poziom istoto±ci α = 0.05 i wyobra¹my sobie,»e z populacji pobrao bardzo du»o prób tej samej wielko±ci. Nawet je»eli hipoteza H 0 jest prawdziwa to w 5% wszystkich prób uzyskamy warto± statystyki z obszaru krytyczego. W±ród tych 5% prób mo»e zale¹ si ta jeda reala próba, któr dyspoujemy i gdyby a jej podstawie testowa hipotez H 0, ale»aªoby j mimo prawdziwo±ci odrzuci. Popeªioy zostaªby bª d pierwszego rodzaju, polegaj cy a odrzuceiu hipotezy prawdziwej. Prawdopodobie«stwo popeªieia takiego bª du wyzacza poziom istoto±ci testu. Przyjmuj c jego i»sze warto±ci, zmiejszamy ryzyko popeªieia bª du pierwszego rodzaju. Rozwa»my test hipotezy takiej,»e ±redia w próbie rówa jest pewej okre±loej warto±ci: H 0 : µ = µ 0 za± H a : µ > µ 0 a poziomie istoto±ci α = 0.001. Je»eli zaobserwowaa warto± statystyki testowej z (w tym wypadku b dzie to warto± ±redia w próbie) jest typowa to ie b dzie podstaw do odrzuceia hipotezy zerowej. Natomiast im bardziej ta warto± b dzie ietypowa przy zachodzeiu H 0, tym wi ksze s szase a odrzuceie hipotezy zerowej. Ozaczaj c kwatyl rz du 1 α rozkªadu symbolem z 1 α mamy prawdopodobie«stwo hipotezy zerowej H 0 rówe: P H0 (z z 1 α ) = α. Powiemy,»e je±li hipoteza zerowa ma zaj± to warto±ci statystyki testowej z mog zale¹ si w zbiorze C = {z : z z 1 α }, czyli w zbiorze wszystkich takich elemetów które s ie miejsze i» z 1 α z prawdopodobie«stwem α. eby byªa jaso±, je±li α = 0.001 to z 1 α = z 0.999. Wi c z tablic rozkªadu b dziemy odczytywa warto± z 0.999, która wyosi 3.09. Teraz w takim razie, je±li otrzymaa warto± statystyki z b dzie ie miejsza i» 3.09 wówczas uzamy j za ietypow, i odrzucimy hipotez zerow a korzy± alteratywej. Je- ±li za± otrzymamy warto± miejsz i» 3.09 wówczas stwierdzimy, ze ie ma podstaw do odrzuceia hipotezy zerowej. Zbiór warto±ci statystyki testowej, który pozwala odrzuci H 0 azwiemy krytyczym C, i b dzie o zawieraª te warto±ci, które fatyczie s ie miejsze i» okre±loa warto± z 1 α. Natomiast zbiór takich warto±ci, które ie pozwol odrzuci H 0 azwiemy zbiorem przyj C. W takim razie, elemety le» ce a graicy tych dwóch zbiorów azwiemy warto±ciami krytyczymi. Tak aprawd hipotezy mo»emy podzieli a trzy zestawy mo»liwo±ci w przypadku badaia warto±ci ±rediej dla daej próby: 6

zbór hipoteza zerowa hipoteza alteratywa liczba stro przedziaªów 1 µ = µ 0 µ µ 0 2 2 µ > µ 0 µ < µ 0 1 3 µ < µ 0 µ > µ 0 1 Czyli je±li hipoteza zerowa mówi,»e pewa warto± statystyki testowej jest rówa pewej okre±loej warto±ci, za± alteratywa po prostu gªosi,»e ta warto± jest ia, wówczas mówimy o tzw. te±cie dwustroym - jako»e w kotek±cie hipotezy alteratywej twierdzimy jedyie,»e warto± krytycza jest ró»a od zadaej warto±ci statystyki testowej, a wi c jest albo miejsza albo wi ksza. Zatem o te±cie jedostroym b dziemy mówi, gdy warto± krytycza jest odpowiedio albo miejsza albo wi ksza od zadaej statystyki testowej. Bardzo istote jest potem okre±leie poziomu istoto±ci α. Musimy zatem okre±li jak u»y zaobserwowaej próby do przyj cia b d¹ odrzuceia hipotezy zerowej. W tym celu okre±lamy wªa±ie tzw. poziom istoto±ci. Najcz ±ciej te poziom okre±la warto±ci 0.01, 0.05, lub 0.10, ale geeralie warto± ta ale»y do przedziaªu 0.. 1. Test polega teraz a sprawdzeiu, czy asza hipoteza odo±ie warto±ci ±rediej ró»i si zacz c od pewej zaobserwowaej a wybraej próbie daych, warto±ci ±rediej. Wykoaie testu obejmuje oszacowaie bª du stadardowego, liczby stopi swobody, statystyki testowej oraz tzw. p - warto±ci. ˆ bª d stadardowy SE, który dla próby licz cej elemetów, b dziemy wyzacza jako: SE = s, ˆ stopie swobody DF, rówe rozmiarowi próby mius 1: DF = 1, ˆ statystyka testowa okre±loa symbolem t i obliczoa jako t = ( x µ), gdzie SE x to oczywi±cie warto± ±redia z proby, za± µ jest hipotez dotycz c ±rediej populacji (H 0 ) a SE jest bª dem stadardowym, ˆ p-warto± (p-value), której wyzaczaie jest bardzo subtelym zadaiem. Mo»emy po porstu powiedzie,»e im miejsza jest ta warto± tym bardziej jeste±my sªoi odrzuci hipotez zerow. 5 Przykªady 5.1 Test dwustroy Producet kosiarek zaiwestowaª w opracowaie owego eergooszcz dego silika do kosiarek. Twierdzi o,»e silik b dzie pracowaª ieprzerwaie przez 5 godzi (300 miut) a jede galo bezyy. Zbadao 50 silików, i okazaªo si,»e pracowaªy oe ze ±redim czasem rówym 295 miut, z odchyleiem stadardowym rówym 20 miut. Chcemy zatem sprawdzi, czy hipoteza o tym,»e te owy silik pracuje ze ±redim czasem 300 miut jest prawdziwa. A zatem hipoteza alteratywa b dzie mówi po prostu o tym,»e te czas jest ii i» 300 miut.przeprowadzimy test tej hipotezy, przy poziomie istoto±ci rówym 0.05. 1. Stawiamy hipotez : ˆ hipoteza zerowa H 0 : µ = 300 ˆ hipoteza alteratywa H a : µ 300 7

2. test przeprowadzimy dla poziomu istoto±ci α = 0.05 3. obliczymy warto± SE, i dla okre±loego df wyzaczymy warto± statystyki testowej t): ˆ SE = s = 20 50 = 20 7.07 = 2.83 ˆ DF = 1 = 50 1 = 49 ˆ t = ( x µ) SE = (295 300) 2.83 = 1.77 ˆ skoro mamy test obustroy, tz.,»e p - warto± jest prawdopodobie«stwem,»e dla 49 stopi swobody warto± statystyki t przez as wyzaczoa jest miejsza od 1.77 b d¹ wi ksza od +1.77. ˆ A wi c zajdujemy w tabelach rozkªadu ormalego 1 warto± P (t < 1.77) = 0.04 oraz P (t > 1.77) = 0.04. Wtedy, p-warto± = 0.04 + 0.04 = 0.08. 4. skoro p-warto± rówa 0.08 jest wi ksza i» poziom istoto±ci 0.05 to ie mo»emy odrzuci hipotezy zerowej. 5.2 Test jedostroy Pewa szkoªa podstawowa ma 300 ucziów. Dyrektor Szkoªy jest zdaia,»e ±redie IQ tych ucziów wyosi coajmiej 110. W celu zwerykowaia tej hipotezy, poddao testowi 20 wybraych ucziów. w±ród ich ±redia wyiosªa 108, przy odchyleiu stadardowym rówym 10. Chcemy wi c zaakceptowa b d¹ odrzuci t hipotez,»e ±redio ucze«tej szkoªy ma IQ przyajmiej 110. Test przeprowadzimy a poziomie istoto±ci rówym 0.01, ktory przypomijmy ozacza, ze zakªadamy,»e a 100 przeprowadzoych testów (o takiej samej wielko±ci próby) tylko w 1 przypadku dopuszczamy odrzuceie hipotezy zerowej w przypadku gdy tak aprawd bylaby oa prawdziwa. 1. stawiamy hipotez : ˆ hipoteza zerowa H 0 : µ 110 ˆ hipoteza alteratywa H a : µ < 110 2. poziom istoto±ci test ma wyosi 0.01. 3. obliczymy warto± SE, i dla okre±loego df wyzaczymy warto± statystyki testowej t): ˆ SE = s = 10 20 = 10 4.472 = 2.236 ˆ DF = 1 = 20 1 = 19 ˆ t = ( x µ) SE = (108 110) 2.236 = 0.894 ˆ skoro mamy test jedostroy, tz.,»e p-warto± ma by prawdopodobie«stwem»e obliczoa statystyka testowa t przy 19 stopiach swobody jest miejsza i» 0.894 ˆ A wi c zajdujemy w tabelach rozkªadu ormalego 2 p-warto± jako P (t < 0.894) = 0.19. 1 http://stattrek.com/tables/t.aspx 2 http://stattrek.com/tables/t.aspx 8

4. Je±li p warto± jest rówa 0.19 a wi c jest wi ksza i» zaday poziom istoto±ci 0.01 ie mo»emy odrzuci hipotezy zerowej. 6 Testowaie hipotez w ±rodowisku R Dae: Odchyleie stadardowe=20, rozmiar próby = 50, poziom ufo±ci=95% Szukae: prawdziwa warto± ±redia =? Przyjmujemy,»e warto± ta mo»e si waha w stosuku do szacowaej warto±ci a o warto± 1.5 > a<-300 > s<-20 > <-50 > error <- qorm(0.975)*s/sqrt() > left <- a-error > right <- a+error > left [1] 294.4564 > right [1] 305.5436 Widzimy,»e a poziomie istoto±ci 0.95 przedziaª ufo±ci dla ±rediej warto±ci próby ma posta (294.4564, 305.5436). Teraz chcemy wyzaczy warto± statystyki z dla prawdziwej warto±ci ±rediej rówej 300 + 1.5 = 301.5: > assumed <- a + 1.5 > Zleft <- (left-assumed)/(s/sqrt()) > Zright <-(right-assumed)/(s/sqrt()) > p <- porm(zright)-porm(zleft) > p [1] 0.917207 Prawdopodobie«stwo popeªieia bª du II rodzaju (czyli przyj cia hipotezy zerowej,»e ±redia jest rówa 301.5 gdy jest oa faªszywa) wyosi w przybli»eie 8%. Moc testu wyzaczymy jako 1 p: > 1-p [1] 0.08279293 Moc testu wyosi ok 91.8%, co ozacza,»e je±li prawdziwa warto± ±redia ró»i si od warto±ci 300 o 1.5 to prawdopodobie«stwo,»e odrzucimy hipotez zerow jest du»e i wyosi ok 91.8%. Mo»emy tak aprawd u»y jedej tylko komedy R, której wykoaie wyzaczy wszystkie potrzebe iformacje: > power.t.test(=,delta=1.5,sd=s,sig.level=0.05, + type="oe.sample",alterative="two.sided",strict = TRUE) Oe-sample t test power calculatio = 50 delta = 1.5 sd = 20 9

sig.level = 0.05 power = 0.0815095 alterative = two.sided 7 Maªy eksperymet - bardzo pouczaj cy Zaªó»my,»e mamy do rozwi zaia ast puj cy problem: Cea metra kwadratowego (w tys.zª) dla 14 losowo wybraych mieszka«w mie±cie A: 3.75, 3.89, 5.09, 3.77, 3.53, 2.82, 3.16, 2.79, 4.34, 3.61, 4.31, 3.31, 2.50, 3.27 W prasie podao iformacj,»e ±redia cea metra kwadratowego wyosi 3.8 tys. zª. Czy powy»sze dae potwierdzaj to stwierdzeie? W ±rodowisku R test dla hipotezy zerowej mówi cej,»e ±redia wyosi 3.8 tys. zª, b dzie wygl daª ast puj co: > z<-c(3.75,3.89,5.09,3.77,3.53,2.82,3.16,2.79,4.34,3.61,4.31,3.31,2.50,3.27) > t.test(z,mu=3.8) Oe Sample t-test data: z t = -1.1777, df = 13, p-value = 0.26 alterative hypothesis: true mea is ot equal to 3.8 95 percet cofidece iterval: 3.180491 3.982366 sample estimates: mea of x 3.581429 Zwró my uwag,»e a poziomie istoto±ci 0.95 ale»y odrzuci hipotez zerow a korzy± hipotezy alteratywej, która mówi,»e po prostu ±redia cea metra kwadratowego mieszka«w mie±cie A ie wyosi 3.8 tys. zª. To co jest tu istote, i co b dziemy dalej aalizowa to p-warto± która tutaj jest rowa 0.26 i statystyka testowa t, która wyosi 1.1777. A teraz sprawd¹my co si staie, gdyby±my asz hipotez przybli»yli do faktyczej warto±ci ±rediej: > t.test(z,mu=3.5) Oe Sample t-test data: z t = 0.4388, df = 13, p-value = 0.668 alterative hypothesis: true mea is ot equal to 3.5 95 percet cofidece iterval: 3.180491 3.982366 sample estimates: mea of x 3.581429 Widzimy,»e p-warto± wzrasta (a statystyka testowa t maleje) gdy asza hipoteza jest bli»sza prawdzie i zwró my uwag rówie» i a to,»e ie zmieiaj c poziomu istoto±ci ie zmieia si przedziaª ufo±ci dla warto±ci ±rediej. A teraz podajmy hipotez rów prawdziwej warto±ci ±rediej: 10

> t.test(z,mu= 3.581429) Oe Sample t-test data: z t = 0, df = 13, p-value = 1 alterative hypothesis: true mea is ot equal to 3.581429 95 percet cofidece iterval: 3.180491 3.982366 sample estimates: mea of x 3.581429 Jak widzimy, gdy podali±my dokªadie tak hipotez dotycz c warto±ci ±rediej w daym zbiorze jak prawdziwa warto± ±redia, wówczas statystyka testowa t rówa si 0 za± p-warto± rówa si 1. Iymi sªowy: Im miejsza b dzie p-warto±, tym mociejsze staje si przekoaie o faªszywo±ci hipotezy zerowej i prawdziwo±ci hipotezy alteratywej. 8 Zadaia 1. W pewej miejscowo±ci mieszka«cy twierdz,»e ±redie oszcz do±ci przypadaj ce a jedego mieszka«ca s i»sze od 14415 zª. Czy to twierdzeie jest sªusze, skoro dla losowy wybraych 314 osób ±redie oszcz do±ci wyosiªy 14316 zª, z odchyleiem stadardowym 268, 8 zª (przyjmij poziom istoto±ci 0.05). 2. W pewej cukieri postaowioo sprawdzi, czy rzeczywi±cie ±redia rocza ilo± (w kg) kupowaych ciastek przez jedego klieta wyosi 15 kg. W celu sprawdzeia, tego twierdzeia, zbadao 10 klietów i okazaªo si,»e ±redia ilo± kupowaych ciastek wyosi 14, 2 kg, a odchyleie stadardowe 1, 2 kg. Werykacj tej hipotezy przeprowad¹ przy poziomie istoto±ci 0.02. 9 Podpowiedzi do zada«1. Zadaie 1. test jedostroy, odrzucimy hipotez zerow. 2. Zadaie 2. test dwustroy, ie b dzie podstaw by odrzuci hipotez zerow. 10 Bibliograa Opracowaie przygotowao w oparciu o prace: 1. J. Koroacki i J. Mieliczuk, Statystyka dla studetów kieruków techiczych i przyrodiczych, WNT, 2006 2. C. Wataªa, Biostatystyka - wykorzystaie metod statystyczych w pracy badawczej w aukach biomedyczych, Alfa Medica Press, 2002 11

3. http://www.cyclismo.org/tutorial/r/power.html 4. http://www.sgh.waw.pl/prywate/mpodog/dydaktyka/statystyka/hipotezy. pdf 12