Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Podobne dokumenty
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna dla leśników

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka matematyczna

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Wykład 3 Hipotezy statystyczne

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Hipotezy statystyczne

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Hipotezy statystyczne

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

166 Wstęp do statystyki matematycznej

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka matematyczna i ekonometria

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych cd.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Test lewostronny dla hipotezy zerowej:

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Testowanie hipotez statystycznych.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyka Matematyczna Anna Janicka

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wykład 9 Testy rangowe w problemie dwóch prób

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

WNIOSKOWANIE STATYSTYCZNE

Rozkłady statystyk z próby. Statystyka

Prawdopodobieństwo i statystyka

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Rozkłady statystyk z próby

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Prawdopodobieństwo i rozkład normalny cd.

Weryfikacja hipotez statystycznych

Dokładne i graniczne rozkłady statystyk z próby

Weryfikacja hipotez statystycznych

STATYSTYKA

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Wykład 10 Testy jednorodności rozkładów

Weryfikacja hipotez statystycznych

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Weryfikacja hipotez statystycznych testy t Studenta

STATYSTYKA wykład 5-6

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Transkrypt:

Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28

Testowanie hipotez statystycznych 2 / 28

Testowanie hipotez statystycznych Hipoteza statystyczna Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do rozkładu populacji generalnej (np. wartości parametrów). Prawdziwość tego przypuszczenia oceniana jest na podstawie wyników próby losowej. Po sformułowaniu odpowiedniej hipotezy dotyczącej populacji generalnej niezbędne jest określenie zasad weryfikacji tej hipotezy. Test statystyczny Testem statystycznym nazywamy regułę postępowania, która każdej możliwej próbie przyporządkowuje decyzję przyjęcia lub odrzucenia hipotezy. 3 / 28

Testowanie hipotez statystycznych Ogólne zasady konstruowania testów statystycznych 1. Sformułowanie hipotezy zerowej H 0 i alternatywnej H 1 2. Określenie obszaru krytycznego (w), czyli obszaru odrzucenia hipotezy zerowej 4 / 28

Testowanie hipotez statystycznych W testowaniu hipotez statystycznych weryfikacji dokonuje się na podstawie wyników próby losowej. Istnieje zatem możliwość popełnienia błędu przy takim postępowaniu. Błąd I rodzaju α(w)- odrzucenie hipotezy zerowej, która jest prawdziwa Błąd II rodzaju β(w) - nieodrzucenie hipotezy zerowej, która jest fałszywa W praktyce testy konstruuje się tak, aby zminimalizować błąd II rodzaju β(w), przy ustalonym z góry poziomie prawdopodobieństwa popełnienia błędu I rodzaju α(w). Tak skonstruowane testy nazywa się testami najmocniejszymi. Moc testu M(w) Moc testu to prawdopodobieństwo odrzucenia hipotezy zerowej, która jest fałszywa β(w) = 1 M(w) 5 / 28

Testy istotności 6 / 28

Testy istotności Testy istotności stanowią obszerną grupę najczęściej stosowanych testów statystycznych. 7 / 28

Testy istotności Przykład Przypuszczamy, że średni wzrost poborowych wynosi 175 cm. Jest to zatem hipoteza zerowa dotycząca wartości średniej w populacji generalnej poborowych. Dla sprawdzenia tego przypuszczenia na podstawie próby losowej należy obliczyć średni wzrost w próbie x n. Jeśli otrzymana z próby wartość średniej arytmetycznej będzie się znacznie różnić od 175 cm, odrzucimy hipotezę zerową. Co to znaczy znacznie różnić od 175 cm? Hipoteza alternatywna? 8 / 28

Testy istotności Zasady konstruowania testów istotności Sformułowanie hipotezy zerowej H 0 oraz alternatynej H 1 Wyznaczenie pewnej statystyki Z n, której rozkład określa się przy założeniu, że prawdziwa jest hipoteza zerowa H 0. Mając określony rozkład statystyki Z n można dla niej wyzanczyć taki obszar jej wartości w, aby dla z góry ustalonego małego prawdopodobieństwa α był spełniony warunek: P (Z n w) = α Jeśli otrzymana na podstawie konkretnej próby wartość z n statystyki Z n przyjmie wartość z obszaru w sprawdzaną hipotezę zerową odrzucamy, ponieważ z założenia prawdziwości H 0 wynika, że prawdopodobieństwo realizacji zdarzenia (Z n w) jest małe (i równe α). Gdy wartość z n statystyki Z n znajdzie się poza obszarem w, stwierdzamy, że nie ma podstaw do odrzucenia hipotezy zerowej. 9 / 28

Testy istotności Obszar w nazywany jest obszarem krytycznym testu. Z góry ustalone prawdopodobieństwo α jest nazywane poziomem istotoności (błąd I rodzaju). W praktyce wartościami najczęściej przyjmowanymi dla poziomu istotności są 0, 1; 0, 05; 0, 01. Im wyższy jest poziom istotności, tym większa jest szansa, że statystyka Z n znajdzie się w obszarze krytycznym w i - w konsekwencji - większa jest szansa odrzucenia H 0. Reguły wyboru statystyki Z n? 10 / 28

Testy istotności Przykład cd. W celu weryfikacji hipotezy o średnim wzroście poborowych, czyli o wartości oczekiwanej E(X) w populacji generalnej wyzancza się średnią arytmetyczną z próby. Następnie ocenia się, czy różnica między wartością hipotetyczną a wartością X n uzyskaną z próby jest statystycznie istotna - tzn. za duża, aby uznać ją za przypadkową. Jeśli tak, to hipotezę zerową należy odrzucić. 11 / 28

Parametryczne testy istotności 12 / 28

Testy istotności dla wartości średniej populacji generalnej Przypadek A Populacja ma rozkład normalny o nieznanej wartości śreniej m oraz znanym odchyleniu standardowym σ. Hipoteza zerowa: średnia m ma wartość m 0 H 0 : m = m 0 Hipoteza alternatywna: średnia m ma wartość inną niż m 0 H 1 : m m 0 Hipotezę H 0 należy zweryfikować na podstawie wyników n-elementowej próby (X 1, X 2,...X n). Wyznaczamy średnią arytmetyczną z próby X. Wiemy (skąd?), że średnia z próby pobranej z populacji o rozkładzie normalnym N(m, σ 2 ) ma rozkład N(m, σ2 n ). Jeśli prawdziwa jest hipoteza zerowa to X ma rozkład N(m 0, σ2 n ) Zatem, jeśli prawdziwa jest hipoteza zerowa, to statystyka o postaci U = X m 0 σ n ma rozkład N(0, 1). (standaryzacja) 13 / 28

Testy istotności dla wartości średniej populacji generalnej Jeśli hipoteza zerowa jest prawdziwa, to wartość średniej arytmetycznej z próby nie powinna się zbytnio różnić od wartości hipotetycznej m 0, co oznacza, że moduł statystyki U nie powinien przyjmować zbyt dużych wartości. Dokładniej, nie powinien przekraczać pewnej wartości u α zwanej wartością krytyczną. Wartość krytyczna, dla ustalonego poziomu istotności α jest określana w rozkładzie normalnym N(0, 1) w taki sposób, aby zachodziła relacja: P ( U > u 1 α 2 ) = α. Dwustronny obszar krytyczny: U > u 1 α 2. Jeśli obliczona na podstawie próby wartość statystyki U jest taka, że U > u 1 α 2, to odrzucamy hipotezę zerową na korzyść alternatywy. Uznajemy, że różnica między wartością średniej arytmetycznej x a m 0 jest statystycznie istotna. 14 / 28

Testy istotności dla wartości średniej populacji generalnej Hipoteza: parametr w populacji przyjmuje wartość większą od pewnej ustalonej H 0 H 1 Prawostronny obszar krytyczny m = m 0 m > m 0 U > u 1 α Hipoteza: parametr w populacji przyjmuje wartość mniejsza od pewnej ustalonej H 0 H 1 Lewostronny obszar krytyczny m = m 0 m < m 0 U < u 1 α 15 / 28

Testy istotności dla wartości średniej populacji generalnej Przypadek B Populacja ma rozkład normalny o nieznanej wartości śreniej m oraz nieznanym odchyleniu standardowym σ. Hipoteza zerowa: średnia m ma wartość m 0 H 0 : m = m 0 Hipoteza alternatywna: średnia m ma wartość inną niż m 0 H 1 : m m 0 Hipotezę H 0 należy zweryfikować na podstawie wyników n-elementowej próby (X 1, X 2,...X n). Wyznaczamy średnią arytmetyczną z próby X. Wiemy (skąd?), że zmienna o postaci t = X m s n, gdzie s jest odchyleniem standardowym z próby, ma rozkład t-studenta o n 1 stopniach swobody. Jeśli prawdziwa jest hipoteza zerowa to t = X m 0 s n ma rozkład t-studenta o n 1 stopniach swobody. 16 / 28

Testy istotności dla wartości średniej populacji generalnej Jeśli hipoteza zerowa jest prawdziwa, to wartość średniej arytmetycznej z próby nie powinna się zbytnio różnić od wartości hipotetycznej m 0, co oznacza, że moduł statystyki t nie powinien przyjmować zbyt dużych wartości. Dokładniej, nie powinien przekraczać pewnej wartości t α określonej w rozkładzie t-studenta z n 1 stopniami swobody, zwanej wartością krytyczną. Wartość krytyczna, dla ustalonego poziomu istotności α jest określana w rozkładzie t-studenta z n 1 stopniami swobody w taki sposób, aby zachodziła relacja: P ( t > t α,n 1 ) = α, gdzie α jest z góry określonym poziomem istotności. Dwustronny obszar krytyczny: t > t α,n 1. Jeśli obliczona na podstawie próby wartość statystyki t jest taka, że t > t α,n 1, to odrzucamy hipotezę zerową na korzyść alternatywy. Uznajemy, że różnica między wartością średniej arytmetycznej x a m 0 jest statystycznie istotna. 17 / 28

Testy istotności dla wartości średniej populacji generalnej Hipoteza: parametr w populacji przyjmuje wartość większą od pewnej ustalonej H 0 H 1 Prawostronny obszar krytyczny m = m 0 m > m 0 t > t 2α,n 1 Hipoteza: parametr w populacji przyjmuje wartość mniejsza od pewnej ustalonej H 0 H 1 Lewostronny obszar krytyczny m = m 0 m < m 0 t < t 2α,n 1 18 / 28

Testy istotności dla wartości średniej populacji generalnej Przypadek C Populacja ma dowolny rozkład z nieznanymi parametrami. Średnia arytmetyczna z próby wylosowanej z dowolnej poplacji ma asymtotyczny rozkład normalny, a odchylenie standardowe s z próby jest stochastycznie zbieżne do odchylenia standardowego w populacji. Stad, jeśli prawdziwa jest hipoteza zerowa, to X ma asymptotyczny rozkład N(m 0, s2 n ), a statystyka U = X m 0 s n ma asymptotyczny rozkład N(0, 1). (duża próba) 19 / 28

Testy istotności dla wartości średniej populacji generalnej Przykład Czas montowania elemtu T w pralce jest zmienną losową o rozkładzie normalnym. Norma techniczna przewiduje na tę czynność 6 min, natomiast wśród jej wykonawców istnieje pogląd, że ten normatywny czas jest zbyt krótki. Należy sprawdzić to przypuszczenie przy założeniu, że odchylenie standardowe czasu montowania wynosi σ =1 min 30 s. Obliczono, że w grupie 25 robotników średni czas montowania wynosi X=6 min 20 s. Przyjmijmy α = 0, 05. Formalnie weryfikujemy hipotezę: H 0 : m = 6 H 1 : m > 6 Ponieważ wiadomo, że populacja ma rozkład normalny i znamy wartość parametru σ, w celu weryfikacji hipotezy skorzystamy ze statystyki U. U = 6,33 6 1,5 25 = 1, 1 Ze względu na postać H 1 obszar krytyczny tego testu jest prawostronny, tzn. określony relacją P (U > u 1 α ) = α. u 1 0,05 = 1, 65 (wartość odczytana z tablic dystrybuanty rozkładu normalnego) 20 / 28

Testy istotności dla dwóch średnich Przypadek A Badane są dwie populacje generalne, z których każda ma rozkład normalny: N(m 1, σ 2 1 ), N(m 2, σ 2 2 ). Wartości średnie m 1, m 2 nie są znane. Wartrości odchyleń standardowych σ 1, σ 2 są znane. H 0 H 1 Statystyka testowa Dwustronny obszar krytyczny m 1 = m 2 m 1 m 2 U = X 1 X 2 σ 1 2 + σ2 2 n 1 n 2 m 1 = m 2 m 1 > m 2 U = X 1 X 2 σ 1 2 + σ2 2 n 1 n 2 m 1 = m 2 m 1 < m 2 U = X 1 X 2 σ 1 2 + σ2 2 n 1 n 2 U > u 1 α 2 U > u 1 α U < u 1 α 21 / 28

Testy istotności dla dwóch średnich Przypadek B Badane są dwie populacje generalne, z których każda ma rozkład normalny: N(m 1, σ 2 1 ), N(m 2, σ 2 2 ). Wartości średnie m 1, m 2 nie są znane. Wartrości odchyleń standardowych σ 1, σ 2 nie są znane. H 0 H 1 Statystyka testowa Dwustronny obszar krytyczny m 1 = m 2 m 1 m 2 t = X 1 X 2 t > t α,n1 +n 2 2 s 2 p ( n 1 + 1 ) 1 n 2 m 1 = m 2 m 1 > m 2 t = X 1 X 2 s 2 p ( n 1 + 1 ) 1 n 2 m 1 = m 2 m 1 < m 2 t = X 1 X 2 s 2 p ( n 1 + 1 ) 1 n 2 t > t 2α,n1 +n 2 2 t < t 2α,n1 +n 2 2 22 / 28

Testy istotności dla dwóch średnich Przypadek C Badane są dwie populacje generalne. Rozkład obu populacji jest nieznany. H 0 H 1 Statystyka testowa Dwustronny obszar krytyczny m 1 = m 2 m 1 m 2 U = X 1 X 2 ( s2 1 n 1 + s2 2 n 2 ) m 1 = m 2 m 1 > m 2 U = X 1 X 2 ( s2 1 n 1 + s2 2 n 2 ) m 1 = m 2 m 1 < m 2 U = X 1 X 2 ( s2 1 n 1 + s2 2 n 2 ) U > u 1 α 2 U > u 1 α U < u 1 α 23 / 28

Testy istotności dla wartości średniej populacji generalnej Przykład Przypuszcza się, że młodsze osoby łatwiej decydują się na zakup nowych, nieznanych produktów. Badanie przeprowadzono wśród 20 nabywców nowego produktu i 22 nabywców znanego wyrobu dostarczyło następujących informacji o wieku klientów (w latach): nabywcy nowego produktu: średnia 27,7; odchylenie standardowe 5,5 nabywcy znanego produktu: średnia 32,1; odchylenie standardowe 6,3. Formalnie należy zweryfikować następującą hipotezę zerową: H 0 : m 1 = m 2 wobec hipotezy alternatywnej: H 1 : m 1 < m 2 gdzie m 1 oznacza średni wiek w populacji nabywców nowego produktu, a m 2 średni wiek w populacji nabywców znanego produktu. 24 / 28

Testy istotności dla wartości średniej populacji generalnej Przykład cd Zakładając, że rozkład wieku w obu zbiorowościach jest normalny i charakteryzuje się takim samym zróżnicowaniem, do weryfikacji powyższej hipotezy zastosujemy statystykę t. s 2 p = (20 1)30,25+(22 1)39,69 = 35, 206 20+22 2 27,7 32,1 t = = 2, 4 35,206(1/20+1/22) Przyjmijmy poziom istotności α = 0, 05. Ze względu na postać hipotezy alternatywnej obszar krytyczny jest określony następująco: P (t < t α,n1 +n 2 1) = α Wartość krytyczną t α,n1 +n 2 1 dla poziomu istotności 0, 05 odczytujemy z tablic rozkładu t-studenta. W tym przypadku dla n 1 + n 2 2 = 40 stopni swobody i prawdopodobieństwa 2α = 0, 1 wynosi ona 1, 684 = t 0,1;40. Zatem t = 2, 4 < 1, 684, tzn. wartość statystyki t z próby znajduje się w obszarze krytycznym. Oznacza to, że hipotezę zerową należy odrzucić na korzyść alternatywnej. 25 / 28

Testy istotności dla frakcji Przypadek A Populacja generalna ma rozkład zero-jedynkowy z parametrem p. Parametr p jest prawdopodobieństwem, że badana cecha w populacji przyjmuje wyróżnioną wartość. Można go interpretować jako frakcję elementów populacji mających tę wartość. H 0 H 1 Statystyka testowa Dwustronny obszar krytyczny p = p 0 p p 0 U = ˆp p 0 p 0 (1 p 0 ) U > u 1 α 2 n p = p 0 p > p 0 U = 0 ˆp p U > u 1 α p 0 (1 p 0 ) n p = p 0 p < p 0 U = ˆp p 0 U < u 1 α p 0 (1 p 0 ) n ˆp = X n gdzie X jest zmienną losową ozanczającą liczbę wyróżnionych elementów w próbie. Jeśli prawdziwa jest hipoteza zerowa, to frakcja z próby ˆp ma asymptotyczny rozkład normalny. 26 / 28

Testy istotności dla frakcji Przypadek B Przyjmijmy, że badamy dwie populacje generalne o rozkładzie zero-jedynkowym. Niech parametr p 1 oznacza frakcję elementów wyróżnionych w pierwszej, a p 2 frakcję elementów wyróżnionych w drugiej populacji. H 0 H 1 Statystyka testowa Dwustronny obszar krytyczny p 1 = p 2 p 1 p 2 ˆp U = 1 ˆp 2 ˆp(1 ˆp)(1/n1 +1/n 2 ) U > u 1 α 2 p 1 = p 2 p 1 > p 2 ˆp U = 1 ˆp 2 ˆp(1 ˆp)(1/n1 +1/n 2 ) U > u 1 α p 1 = p 2 p 1 < p 2 U = ˆp 1 ˆp 2 ˆp(1 ˆp)(1/n1 +1/n 2 ) U < u 1 α ˆp = X 1 +X 2 n 1 +n 2 gdzie X 1 oraz X 2 oznaczają liczbę wyróżnionych elementów w próbie pierwszej i drugiej. Jeśli prawdziwa jest hipoteza zerowa, to (ˆp 1 ˆp 2 ) ma asymptotyczny rozkład normalny. 27 / 28

Dziękuję! Aneta Dzik-Walczak adzik@wne.uw.edu.pl Małgorzata Kalbarczyk-Stęclik mkalbarczyk@wne.uw.edu.pl 28 / 28