Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Podobne dokumenty
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Testy dotyczące wartości oczekiwanej (1 próbka).

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Hipotezy statystyczne

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Hipotezy statystyczne

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Statystyka matematyczna dla leśników

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez statystycznych

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka matematyczna

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Prawdopodobieństwo i rozkład normalny cd.

Weryfikacja hipotez: Hipoteza statystyczna to dowolne przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji. o prawdziwości którego

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka Matematyczna Anna Janicka

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

166 Wstęp do statystyki matematycznej

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Na podstawie dokonanych obserwacji:

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Testowanie hipotez cz. I

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Statystyka matematyczna i ekonometria

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Wykład 12 Testowanie hipotez dla współczynnika korelacji

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Weryfikacja hipotez statystycznych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

STATYSTYKA

Kolokwium ze statystyki matematycznej

Statystyka matematyczna i ekonometria

Wydział Matematyki. Testy zgodności. Wykład 03

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Test lewostronny dla hipotezy zerowej:

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Statystyka Matematyczna Anna Janicka

Weryfikacja hipotez statystycznych testy t Studenta

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych. Wprowadzenie

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Prawdopodobieństwo i statystyka

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Weryfikacja hipotez statystycznych - testy dla wartości średniej cz. 2

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Testowanie hipotez statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wykład 8: Testy istotności

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Weryfikacja hipotez statystycznych

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Transkrypt:

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi nazywamy hipotezy dotyczące wartości nieznanego parametru θ rozkładu. Na podstawie próbki X 1,..., X n z rozkładu P θ, θ Θ, mamy zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Nieparametrycznymi nazywamy hipotezy, które nie dotyczą parametrów rozkładu (np. hipotezy o typie rozkładu). Sposób postępowania, który prowadzi do podjęcia decyzji, nazywamy testem statystycznym. Przykład. Na kartonie z mlekiem jest napisane zawartość tłuszczu wynosi 3,2%. W celu sprawdzenia, czy tak jest naprawdę, zmierzona została zawartość tłuszczu w 10 losowo wybranych kartonach z mlekiem, dostarczonych przez pewnego producenta. Uzyskano następujące wyniki: 3,26%; 3,12%; 3,24%; 3,16%; 3,08%, 3,14%; 3,23%; 3,11%; 3,09%; 3,24%. Jak wiemy, przy oszacowaniu średniej wartości pewnej cechy dobrym estymatorem jest średnia z próby. Oka- 1

zało się, że dla powyższych danych x = 3,167%. Czy na podstawie tego można przyjąć, że zawartość tłuszczu w mleku przeciętnie wynosi 3,2% (hipoteza H 0 )? Gdyby okazało się, że x = 2,8%, to zapewne nie mielibyśmy wątpliwości, że hipotezę H 0 należy odrzucić. Natomiast w przypadku x = 3,2% na pewno nie należałoby się jej odrzucać. Ale ponieważ zaobserwowaliśmy wartość x = 3,167%, to decyzja o odrzuceniu bądź nie odrzuceniu hipotezy H 0 już nie jest tak oczywista. Rozsądnym wydaje się następujące postępowanie. Przypuśćmy, że hipoteza H 0 jest prawdziwa, tzn. przeciętna zawartość tłuszczu w mleku wynosi 3,2%. Jeśli prawdopodobieństwo zaobserwowania przy tym przypuszczeniu wartości x = 3,167% jest bardzo małe, powiedzmy nie większe niż α = 0,05, to uznamy, że nasze przypuszczenie nie jest zgodne z prawdą, bo zdarzyło się coś, co powinno zdarzać się niezmiernie rzadko (zdarzyło się coś, co jest prawie niemożliwe). Dalej α nazywamy poziomem istotności testu. Decyzja o odrzuceniu rozważanej hipotezy H 0 związana jest z podjęciem decyzji o przyjęciu pewnej hipotezy alternatywnej H 1. W tym przykładzie może nią być hipoteza mówiąca, że przeciętna zawartość tłuszczu w mleku różni się od 3,2%. Ale może też być inna 2

hipoteza alternatywna. Np. organizacja obrony praw konsumentów może być zainteresowana rozważaniem hipotezy alternatywnej postaci przeciętna zawartość tłuszczu w mleku jest mniejsza niż 3,2%, natomiast sam producent mleka, że przeciętna zawartość tłuszczu w mleku jest większa od 3,2%. Postać hipotezy alternatywnej powinna wpływać na naszą decyzję. Otrzymując x = 3,167%, może skłonni bylibyśmy odrzucić hipotezę H 0 i przyjąć hipotezę obrońców praw konsumentów. Trochę mniej pewnie podjęlibyśmy decyzję o przyjęciu hipotezy, że przeciętna zawartość tłuszczu w mleku różni się od 3,2%, a już na pewno nie przyjęlibyśmy hipotezy producenta. Ogólny schemat postępowania. 1. Formułujemy dwie wzajemnie wykluczające się hipotezy: H 0 (zerowa) i H 1 (alternatywna). 2. Określamy poziom istotności testu α (0, 1) (standardowo α = 0,05). 3. Przy założeniu prawdziwości hipotezy H 0, dobieramy pewną statystykę (zwaną statystyką testową), której rozkład nie zależy od nieznanych parametrów. Zgodnie z rozkładem tej statystyki oraz przyjętą wartością α określamy zbiór krytyczny K. Jest to podzbiór R taki, że prawdopodobieństwo wpadnięcia do K war- 3

tości zmiennej losowej o określonym wyżej rozkładzie wynosi właśnie α (czyli jest bardzo małe). 4. Jeśli obliczona na podstawie próbki wartość statystyki testowej wpada do K, to hipotezę H 0 odrzucamy. Jeżeli zaś obliczona wartość statystyki testowej nie wpada do K, to nie mamy podstaw do odrzucenia H 0. Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości oczekiwanej. 1. H 0 : µ = µ 0 H 1 : µ µ 0 lub µ < µ 0 lub µ > µ 0. 2. Określamy α (0, 1). 3. Rozważamy trzy przypadki: 3a. rozkład, z którego pochodzi próbka, jest normalny, wariancja σ 2 jest znana; 3b. rozkład, z którego pochodzi próbka, jest normalny, wariancja σ 2 nie jest znana; 3c. rozkład, z którego pochodzi próbka, jest dowolny, ale n jest duże. 3a. Jeśli H 0 jest prawdziwa, to {X i } - niezależne zmienne losowe o rozkładzie N (µ 0, σ 2 ) = X N (µ 0, σ2 n ) = n X µ 0 σ N (0, 1). Zatem n X µ 0 σ jest statystyką testową. 4

Postać zbioru krytycznego K zależy od postaci hipotezy alternatywnej H 1. Pod tym względem rozróżniamy: dwustronny obszar krytyczny K = (, z 1 α/2 ) (z 1 α/2, ) (gdy H 1 : µ µ 0 ); lewostronny obszar krytyczny K = (, z 1 α ) (gdy H 1 : µ < µ 0 ); prawostronny obszar krytyczny K = (z 1 α, ) (gdy H 1 : µ > µ 0 ). 4. Wartość statystyki testowej K = odrzucamy H 0 ; wartość statystyki testowej / K = nie mamy podstaw do odrzucenia H 0. 3b. Statystyka testowa ma postać n X µ 0 S i ma rozkład Studenta t n 1. Obszary krytyczne: K = (, t 1 α/2,n 1 ) (t 1 α/2,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 3c. Statystyka testowa ma postać n X µ 0 S w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). i ma 5

Test dot. nieznanej wariancji rozkładu N (µ, σ 2 ). H 0 : σ 2 = σ 2 0, H 1 : σ 2 σ 2 0 lub σ 2 < σ 2 0 lub σ 2 > σ 2 0. Statystyka testowa ma postać (n 1)S2 i ma rozkład χ 2 (n 1). σ0 2 Obszary krytyczne: K = (0, χ 2 α/2,n 1 ) (χ2 1 α/2,n 1, ) lub K = (0, χ 2 α,n 1) lub K = (χ 2 1 α,n 1, ). Niech np. w Przykładzie z producentem mleka testujemy na poziomie istotności, powiedzmy, α = 0,05 hipotezę H 0 : µ = 3,2 (producent jest uczciwy) przeciw H 1 : µ < 3,2 (producent oszukuje). Przy założeniu, że cecha ma rozkład normalny i np. σ 2 = 0,004, mamy do czynienia z sytuacją opisaną w 3a. Otrzymujemy z tablic z 0,95 = 1,6449. Więc K = (, 1,6449). Wartość statystyki testowej wynosi 10 3,167 3,2 0,004 1,650, czyli wpada ona do K. Zatem należy odrzucić hipotezę H 0 i przyznać, że producent mleka oszukuje. Jeśli nie ma wiedzy o σ 2, to mamy do czynienia z sytuacją opisaną w 3b. Otrzymujemy z tablic t 0,95,9 = 1,8331, zatem K = (, 1,8331). Wartość staty- 6

styki testowej wynosi 10 3,167 3,2 0,0048 1,506, czyli nie wpada ona do K. Nie mamy więc podstaw do odrzucenia hipotezy H 0, czyli nie mamy podstaw do orzeczenia, że producent mleka oszukuje. Test dotyczący nieznanego prawdopodobieństwa sukcesu p w rozkładzie zero-jedynkowym. H 0 : p = p 0, H 1 : p p 0 lub p < p 0 lub p > p 0. Statystyka testowa ma postać n X p 0 i ma p0 (1 p 0 ) w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). Testy dot. równości wartości oczekiwanych 2 prób. H 0 : µ 1 = µ 2, H 1 : µ 1 µ 2 lub µ 1 < µ 2 lub µ 1 > µ 2. (a) Mamy niezależne próbki: X (1) 1,..., X(1) X (2) 1,..., X(2) n 2 N (µ 2, σ2); 2 σ 1, σ 2 są znane. Statystyka testowa ma postać X 1 X 2 σ 2 1 n 1 + σ2 2 n 2 7 n 1 N (µ 1, σ 2 1);

i ma rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). (b) Mamy niezależne próbki: X (1) 1,..., X(1) n 1 N (µ 1, σ1); 2 X (2) 1,..., X(2) n 2 N (µ 2, σ2); 2 σ 1, σ 2 są nieznane, σ 1 = σ 2. Statystyka testowa ma postać X 1 X 2 (n1 1)S1 2+(n 2 1)S2 2 n 1 +n 2 2 n1+n 2 n 1 n 2 i ma rozkład Studenta t n1 +n 2 2. Obszary krytyczne: K = (, t 1 α/2,n1 +n 2 2) (t 1 α/2,n1 +n 2 2, ) lub K = (, t 1 α,n1 +n 2 2) lub K = (t 1 α,n1 +n 2 2, ). (c) Mamy niezależne próbki: X (1) 1,..., X(1) n 1 oraz X (2) 1,..., X n (2) 2 o nieznanych wariancjach, ale n 1, n 2 są duże. Statystyka testowa ma postać X 1 X 2 S 2 1 n 1 + S2 2 n 2 i ma w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). (d) Mamy zależne próbki: X (1) 1,..., X(1) n oraz X (2) 1,..., 8

X n (2) ; obie pochodzą z rozkładu normalnego. Oznaczmy: D i = X (1) i X (2) i. Statystyka testowa ma postać n D S i ma rozkład Studenta t n 1 (porównaj z 3b). Obszary krytyczne: D K = (, t 1 α/2,n 1 ) (t 1 α/2,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). Przykład 1. Wysunięto hipotezę, że stopień wyprania tkaniny wełnianej płatkami mydlanymi jest wyższy od stopnia wyprania sulfapolem. W celu sprawdzenia tej hipotezy wykonano pomiary stopnia wyprania 10 wycinków tkaniny pranej płatkami, otrzymując wyniki (w %): 74,8; 75,1; 73,0; 72,8; 76,2; 74,6; 76,0; 73,4; 72,9; 71,6 oraz 7 wyników prania sulfapolem, otrzymując: 56,9; 57,8; 54,6; 59,0; 57,1; 58,2; 57,6. Zakładając, że stopień wyprania tkaniny każdym środkiem ma rozkład normalny i wariancje są jednakowe, na poziomie istotności α = 0,05 przetestuj wysuniętą hipotezę. Testujemy hipotezy: H 0 : µ p = µ s, H 1 : µ p > µ s. Mamy sytuację z punktu (b), zbiór krytyczny jest prawostronny. Obliczamy: x p = 74,0, x s = 57,3, s 2 p = 2,31, s 2 s = 1,92. Z tablic otrzymujemy: t 0,95,15 = 1,753, więc zbiór krytyczny jest postaci K = (1,753; + ). 9

Wartość statystyki testowej wynosi: 74,0 57,3 9 2,31+6 1,92 15 17 70 23,07. Ponieważ wpada ona do K, odrzucamy hipotezę H 0. Przykład 2. Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed i po podaniu takiego samego leku każdemu z badanych pacjentów. Otrzymano następujące wyniki: pacjent 1 2 3 4 5 6 7 przed 210 180 260 270 190 250 180 po 180 160 220 260 200 230 180 Na poziomie istotności α = 0,05 przetestuj hipotezę, że stosowany lek nie powoduje spadku ciśnienia u pacjentów wobec hipotezy, że średnia wartość ciśnienia przed podaniem leku jest wyższa niż po podaniu, zakładając, że w obu przypadkach ciśnienie tętnicze ma rozkład normalny. Testujemy hipotezy: H 0 : µ 1 = µ 2, H 1 : µ 1 > µ 2. Mamy sytuację z punktu (d), zbiór krytyczny jest prawostronny.wyliczamy, że wartości d i wynoszą: 30, 20, 40, 10, -10, 20, 0, zatem d = 15,7, s d = 12,23. Z tablic otrzymujemy: t 0,95,6 = 1,943, więc zbiór krytyczny jest 10

postaci K = (1,943; + ). Wartość statystyki testowej wynosi: 7 15,7 12,23 3,40. Ponieważ wpada ona do K, odrzucamy hipotezę H 0. Pojęcie p-wartości. Jeśli zaobserwowana wartość statystyki testowej S to s 0, to p-wartość określamy jako: P ( S > s 0 ), jeśli obszar krytyczny jest dwustronny; P (S < s 0 ), jeśli obszar krytyczny jest lewostronny; P (S > s 0 ), jeśli obszar krytyczny jest prawostronny. Możemy podejmować decyzję na podstawie porównania p-wartości z poziomem istotności testu α : jeśli p < α, to odrzucamy H 0 ; jeśli p α, to nie mamy podstaw do odrzucenia H 0. 11