), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Podobne dokumenty
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Hipotezy statystyczne

Hipotezy statystyczne

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna dla leśników

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

166 Wstęp do statystyki matematycznej

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Weryfikacja hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych cd.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Testowanie hipotez statystycznych.

Dokładne i graniczne rozkłady statystyk z próby

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Rozkłady statystyk z próby

Testowanie hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Wykład 12 Testowanie hipotez dla współczynnika korelacji

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka matematyczna i ekonometria

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Testowanie hipotez statystycznych.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Statystyka matematyczna

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Rozkłady statystyk z próby. Statystyka

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Prawdopodobieństwo i statystyka

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

STATYSTYKA

Statystyka Matematyczna Anna Janicka

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Statystyka matematyczna. Wykład VI. Zesty zgodności

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wnioskowanie statystyczne. Statystyka w 5

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Porównanie dwóch rozkładów normalnych

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Statystyka matematyczna i ekonometria

ESTYMACJA. Przedział ufności dla średniej

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

STATYSTYKA MATEMATYCZNA, LISTA 3

Transkrypt:

Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy nosi nazwę hipotezy parametrycznej. Do weryfikacji takich hipotez używamy testów parametrycznych. Hipoteza określająca postać nieznanego rozkładu badanej cechy (w tym także jej parametry) nosi nazwę hipotezy nieparametrycznej. Do weryfikacji takich hipotez używamy testów nieparametrycznych.

Testowanie hipotez oznacza konieczność rozstrzygania czy daną hipotezę możemy uważać za prawdziwą czy też za fałszywą. Stąd, stawiamy na początku hipotezę (zwaną hipotezą H 0 ) i formułujemy hipotezę alternatywną (zwaną hipotezą H ), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 nie jest prawdziwa. Jeżeli wysuwamy tylko jedną hipotezę i celem testu statystycznego jest sprawdzenie czy ta hipoteza nie jest fałszywa i nie sprawdzamy innych hipotez, to taki test nazywamy testem istotności.

przykład Niech cecha X elementów pewnej populacji generalnej ma rozkład normalny (m,) o nieznanej wartości przeciętnej. Sądzimy, że nieznana wartość przeciętna wynosi 0, tzn. stawiamy hipotezę H 0 : m0 przeciwko hipotezie alternatywnej H : m 0. Jedynym sposobem, aby sprawdzić naszą hipotezę jest skonfrontowanie jej z próbką z populacji generalnej. Załóżmy, że wylosowano 0 elementową próbkę prostą i otrzymano: x, 0. Jest to zaobserwowana wartość statystyki X.

Przykład (c.d.) Dla populacji normalnych X ma rozkład 0,. Pozwala to na sprawdzenie, 0 jaka jest szansa na uzyskanie wyniku,0 jeżeli hipoteza H 0 jest prawdziwa: [ Φ(3,05) ] 0, 00 P( X,0) P( X 0,0 0) Musimy rozstrzygnąć czy hipoteza, że m0 jest prawdziwa czy też nie?.

Przykład II Przypuśćmy, że z tej samej populacji wylosowano 6 to elementową próbkę i otrzymano x 0,. Czy taki wynik pozwala na odrzucenie hipotezy H 0 : m0? Jeżeli H 0 jest prawdziwa to X ma rozkład normalny 0, : 4 [ Φ(0,4) ] 0, 69 P ( X 0,) P( X 4 0,4) Taki wynik nie pozwala na odrzucenie postawionej hipotezy: mówimy wtedy, że nie ma podstaw do odrzucenia hipotezy H 0.

Schemat postępowania przy testowaniu hipotez parametrycznych. Stawiamy hipotezę H 0 :(QQ 0 ).. Ustalamy poziom istotności α. (testowanie istotności): 3. Losujemy n elementową próbkę prostą. 4. Wyznaczamy wartość u statystyki U (testu istotności). 5. Szukamy takiej wartości u 0 statystyki U, aby dla wybranego α zachodziła następująca nierówność: P ( U u ) α 0 6. Jeżeli u u 0, to hipotezę H 0 odrzucamy, dla małych prób operujemy statystykami U dokładnymi, dla dużych prób rozkładami granicznymi tych statystyk. u < u 0, nie ma podstaw do odrzucenia hipotezy H 0.

Przykład Badano skuteczność działania dwóch środków A i B na próbce 0-ciu pacjentów cierpiących na bezsenność. Dodatkowe godziny snu uzyskane przez pacjenta w rezultacie zażycia środka A oznaczono przez X, a środka B przez Y.

Pacjent x y zx-y,9 0,7, 0,8 -,6,4 3, -0,,3 4 0, -,,3 5-0, -0, 0, 6 4,4 3,5 0,9 7 5,5 3,7,8 8,6 0,8 0,8 9 4,6 0,0 4,6 0 3,4,0,4

Rozwiązanie I Przyjmijmy, że porównujemy oba środki poprzez obserwację zmiennej losowej ZX-Y. Załóżmy, że Z ma rozkład ( m, σ ) o nieznanej wartości m i σ. Wysuwamy hipotezę H ( m 0) nie precyzując wartości σ, czyli stawiamy 0 hipotezę, że oba środki są jednakowo skuteczne. Do testowania tej hipotezy użyjemy statystyki t-studenta o 9-ciu stopniach swobody: t Z n S gdzie: z,58, s, 67. Ustalamy poziom istotności jako α0,0.

t,580,67 9 4,06 t X m n S f(t) -α0,99 0,005 0,005 t α -3,5 0 t α 3,5 Wartość t α znajdujemy w tablicach t-studenta o 9-ciu stopniach swobody. Ponieważ t> t to odrzucamy hipotezę H α 0, czyli środki na bezsenność nie są jednakowo skuteczne.

Rozwiązanie II Odrzućmy założenie dotyczące normalności zmiennej losowej Z. Przypuśćmy jedynie, że X i Y mają jednakowe rozkłady ciągłe. Wówczas P ( X < Y ) /, gdyż X<Y jest symetryczne względem zera. Stawiamy hipotezę: H ( m 0), co jest równoważne hipotezie 0 H 0 ( P( X < Y ) ). Wprowadźmy nową zmienną Z k o następujących wartościach: Z k 0 gdy X gdy X k k Y k Y k > 0 0 Niech Z. Jeżeli hipoteza H 0 jest prawdziwa to zmienna losowa Z ma 0 Z k k rozkład: k 0 k 0 0 P( Z k) k k 0

Obliczona wartość z próby z0. Obliczamy prawdopodobieństwo takiego wyniku: P 5 ( Z 5 5) P( Z 0) + P( Z 0) 0, 00 9 Wniosek: odrzucamy hipotezę H 0. Nasuwa się przypuszczenie, że lek A jest skuteczniejszy od leku B.

Rozwiązanie III Załóżmy, że lek A zaaplikowano jednemu zespołowi 0-cio osobowemu, a lek B drugiemu zespołowi dziesięciu pacjentów. Załóżmy, że cecha X ma rozkład ( m, σ ) a cecha Y ( m, σ ). Wysuwamy hipotezę H m ). Do jej zweryfikowania użyjemy statystyki U: 0 ( m X Y n n U ( n + n ), n S + n S n + n która ma rozkład t-studenta o n + n stopniach swobody.

W naszym przykładzie mamy: n n 0, 0 s i x x,33, 0 ( x ) 36, 0 s i y y 0,75, 0 ( y ) 8, 9 Stąd, U,86. Z tablic rozkładu t-studenta dla 8-stu stopni swobody znajdujemy, że: P ( t,86) 0, 08 Wniosek: nie ma podstaw do odrzucenia hipotezy nawet na poziomie α0,05. Uwaga: do stosowania testu U potrzebne jest założenie σ. X σ Y

Sprawdźmy hipotezę dotyczącą równości wariancji (warunek korzystania z testu U), czyli stawiamy hipotezę H 0 ( σ ). n n 0, s 3,6, s, 8. X σ Y

-0,05 0,05 F 0,05 Obliczamy wartość F-Snedecora: 3,6 F,5.,8 Z tablic rozkładu F-Snedecora dla n 9, n 9 stopni swobody oraz α0,05 znajdujemy F 3, 8, a więc nie ma podstaw do odrzucenia hipotezy 0,05 o równości wariancji w obu grupach pacjentów.

Przykład: W fabryce produkuje się pewien towar A, którego cecha X ma rozkład ( m, σ ) o nieznanej wartości σ. Założenia technologiczne wymagają, aby odchylenie standardowe badanej cechy wynosiło 4. Aby zweryfikować jakość produkcji pobrano próbkę prostą n5 elementową i otrzymano wartość odchylenia standardowego z próby s4,5. Czy produkcja przebiega według założeń technologicznych?

Stawiamy zatem hipotezę H ( σ 4). 0 Z Obliczamy wartość statystyki, która ma stablicowany rozkład χ o n- σ stopniach swobody: Z σ 5 (4,5) 4 Przyjmijmy α0,0. Szukamy takiej wartości z 0, aby: 9 Z P > z 0 0,0. σ Z tablic znajdujemy dla 4-stu stopni swobody z 0 9,. Zatem, przy założeniu, że hipoteza H 0 zachodzi prawdopodobieństwo Z P >9 jest większe od α. σ Wniosek: nie ma podstaw do odrzucenia hipotezy o tym, że proces technologiczny przebiega równomiernie.

Przykład: W partii towaru znajdują się sztuki dobre i sztuki wadliwe. Współczynnik wadliwości p nie jest znany. Zbadano próbkę prostą o liczebności 30 sztuk i znaleziono 4 sztuki wadliwe. Czy prawdziwa jest deklaracja wytwórcy, że wadliwość tej produkcji wynosi 0%? Wysuwamy hipotezę H ( p 0,). 0

Oznaczamy: sztuka k - ta jest dobra X, X k 30 X k. 0 sztuka k - ta jest wadliwa k Jeśli hipoteza jest prawdziwa, to: P( X r) 30 0, r r 30 0,9 r Otrzymaliśmy x 4. Pytamy: P ( X 4) P( X < 4) 3 r 0 30 0, r r 0,9 30 r,34 0,9 7 0,357 Wniosek: nie ma podstaw do odrzucenia hipotezy o tym, że nieznana wadliwość wynosi 0%.

Przykład: Badano współzależność między średnicą włókna bawełny a jego wytrzymałością. Dokonano 59 niezależnych badań, których wyniki zarejestrowano w tzw. tablicy -dzielczej przyjmując: X numer bawełny (odwrotność średnicy włókna w calach), Y wytrzymałość włókna (w gramach).

X 400 4300 4500 4700 4900 500 5300 5500 Razem Y 6,75 6,5 5 5,75 3 4 3 3 5,5 3 5 7 7 4,75 5 5 3 7 4,5 5 3,75 Razem 7 6 9 9 4 59

Z a k ła d a m y, ż e ( X,Y ) m a d w u w y m ia r o w y r o z k ła d n o r m a ln y. S ta w ia m y h ip o te z ę, ż e b r a k je s t z w ią z k u p o m ię d z y ś r e d n ic ą w łó k n a a je g o w y trz y m a ło ś c ią, tj. s ta w ia m y h ip o te z ę H ( ρ 0 ). 0 D o o c e n y k o r e la c ji z p r ó b y u ż y w a m y s ta ty s ty k i R : R n k n k ( X ( X k k X X ) ( Y ) n k k ( Y k Y ) Y ), i o trz y m u je m y r - 0,6 5. M o ż n a p o k a z a ć, ż e d la ρ 0 s ta ty s ty k a : t R R n m a r o z k ła d t- S tu d e n ta o n - s to p n ia c h s w o b o d y. O trz y m u je m y t - 5,8 6. P o n ie w a ż n > 3 0 ( p ró b k a d u ż a ) to s k o r z y s ta m y z p r z y b liż o n y c h ta b lic t- S tu d e n ta ( z ta b lic r o z k ła d u n o r m a ln e g o ) : P ( t 5,8 6 ) ( Φ (5,8 6 ) ) je s t r z ę d u 0-5. W n io s e k : h ip o te z ę o b r a k u z w ią z k u p o m ię d z y ś r e d n ic ą w łó k n a b a w e łn y a je g o w y trz y m a ło ś c ią n a le ż y o d r z u c ić.