Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Podobne dokumenty
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Hipotezy statystyczne

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Hipotezy statystyczne

Testowanie hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka matematyczna dla leśników

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wykład 3 Hipotezy statystyczne

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

166 Wstęp do statystyki matematycznej

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych cd.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez statystycznych.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Testowanie hipotez statystycznych

Statystyka matematyczna i ekonometria

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

1 Estymacja przedziałowa

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Weryfikacja hipotez statystycznych

Estymacja parametrów rozkładu cechy

Testowanie hipotez statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Weryfikacja hipotez statystycznych

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Testowanie hipotez cz. I

Testowanie hipotez statystycznych.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Weryfikacja hipotez: Hipoteza statystyczna to dowolne przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji. o prawdziwości którego

Prawdopodobieństwo i statystyka

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Testowanie hipotez statystycznych. Wprowadzenie

STATYSTYKA

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Kolokwium ze statystyki matematycznej

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

STATYSTYKA MATEMATYCZNA

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyczna analiza danych

Transkrypt:

Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie pobranej próbki. Przypuszczenia te najczęściej dotyczą postaci rozkładu lub wartości jego parametrów. Hipotezy, które dotyczą wyłącznie wartości parametru (bądź parametrów) określonej klasy rozkładów nazywamy hipotezami parametrycznymi, a pozostałe hipotezami nieparametrycznymi. Jeżeli hipoteza parametryczna precyzuje dokładne wartości wszystkich nieznanych parametrów rozkładu badanej cechy nazywamy ją hipotezą prostą, a w przeciwnym przypadku hipotezą złożoną. Weryfikacja hipotez statystycznych W praktyce przy weryfikacji hipotez postępuje się w ten sposób, że oprócz weryfikowania danej hipotezy wyróżnia się jeszcze inną hipotezę (prostą albo złożoną), zwaną hipotezą alternatywną. Hipoteza, którą chcemy sprawdzić nazywamy hipotezą zerową i oznaczamy symbolem H 0, zaś hipotezę alternatywną oznaczamy przez H 1. Wyróżniona hipoteza H 0 może być prawdziwa lub fałszywa. Postępowanie, w wyniku którego następuje przyjęcie lub odrzucenie hipotezy nazywamy sprawdzaniem lub weryfikowaniem hipotezy statystycznej. Weryfikacja hipotezy statystycznej składa się z dwóch etapów: wyboru odpowiedniego testu i ustalenia tzw. zbioru krytycznego. Weryfikacja hipotez statystycznych Testem hipotezy H 0 przeciw hipotezie alternatywnej H 1 nazywamy każdą statystykę Y, której wartość obliczona na podstawie próby będzie podstawą do zdecydowania, czy hipotezę H 0 odrzucić, czy też przyjąć. Pierwszy etap weryfikacji hipotezy statystycznej polega na wyborze odpowiedniej statystyki i wyznaczeniu jej rozkładu przy założeniu, że weryfikowana hipoteza H 0 jest prawdziwa. Test służący do weryfikacji hipotezy oparty jest na statystyce, której rozkład jest nam znany. Jeżeli próba jest duża, to wykorzystujemy rozkład graniczny, jeżeli próba jest mała, to rozkład dokładny. Weryfikacja hipotez statystycznych Drugi etap weryfikacji hipotez polega na ustaleniu tzw. zbioru krytycznego. Zbiorem krytycznym testu (zbiorem odrzuceń hipotezy) nazywamy taki zbiór W wartości wybranego testu, których wystąpienie powodować będzie odrzucenie weryfikowanej hipotezy H 0. Jest to więc zbiór tych wartości statystyki Y, których występowanie uważamy za zaprzeczenie hipotezie zerowej H 0. Zbiór W będący dopełnieniem zbioru W nazywamy zbiorem przyjęć hipotezy. Błędy przy testowaniu hipotez statystycznych Przy weryfikacji hipotez statystycznych można podjąć poprawną decyzję lub można popełnić jeden z dwóch błędów: błąd I rodzaju polegający na odrzuceniu testowanej hipotezy H 0, gdy jest ona prawdziwa; błąd II rodzaju polegający na przyjęciu hipotezy H 0, gdy jest ona fałszywa (tzn. prawdziwa jest hipoteza alternatywna H 1 ). Błędy przy testowaniu hipotez statystycznych Decyzja H 0 jest prawdziwa H 0 jest faszywa przyj hipotez H 0 decyzja poprawna decyzja bdna (bd II rodzaju) odrzuci hipotez H 0 decyzja bdna decyzja poprawna (bd I rodzaju) 1

Poziom istotności testu Prawdopodobieństwo odrzucenia hipotezy H 0 przy założeniu, że jest ona prawdziwa nazywamy poziomem istotności testu i oznaczamy symbolem α. Fakt ten zapisujemy następująco P (y W H 0 ) = α. Poziom istotności testu jest więc prawdopodobieństwem popełnienia błędu I rodzaju. Wybór tego prawdopodobieństwa jest dowolny, ale zwykle przyjmuje się jedną z wartości α = 0, 01 albo α = 0, 05. Moc testu Prawdopodobieństwo odrzucenia hipotezy H 0 w przypadku, gdy prawdziwa jest hipoteza alternatywna H 1 nazywamy mocą testu. Prawdopodobieństwo popełnienia błędu II rodzaju oznaczamy symbolem β. Fakt ten zapisujemy następująco Moc testu jest więc równa P (y W H 1 ) = 1 β. P (y W H 1 ) = 1 P (y W H 1 ) = β. Test najmocniejszy Test statystyczny powinien oczywiście być taki, aby prawdopodobieństwo popełnienia błędów I i II rodzaju było jak najmniejsze. Idealnym rozwiązaniem byłoby α = 0 oraz β = 0. Nie jest to jednak możliwe. Zmniejszenie wartości α pociąga za sobą zwiększenie β. Wybierając więc poziom istotności α należy minimalizować β, czyli maksymalizować moc testu. Test, który przy ustalonym prawdopodobieństwie błędu I rodzaju minimalizuje prawdopodobieństwo błędu II rodzaju nazywamy testem najmocniejszym dla hipotezy H 0 względem prostej hipotezy alternatywnej H 1. Jeżeli test jest najmocniejszy względem każdej złożonej hipotezy alternatywnej H 1, to nazywamy go testem jednostajnie najmocniejszym względem H 1. Etapy przy weryfikacji hipotez statystycznych Aby skonstruować test statystyczny pozwalający weryfikować hipotezę H 0, należy określić następujące elementy: wybrać statystykę testową stosownie do treści postawionej hipotezy H 0 ; ustalić dopuszczalne prawdopodobieństwo α błędu pierwszego rodzaju, tzn. ustalić poziom istotności testu; określić hipotezę alternatywną; wyznaczyć zbiór krytyczny tak, aby przy danym poziomie istotności α zminimalizować prawdopodobieństwo błędu drugiego rodzaju. Testy istotności Testem istotności nazywamy test, którego celem jest jedynie zweryfikowanie jednej wysuniętej hipotezy pod kątem jej fałszywości z pominięciem innych hipotez. Testy istotności uwzględniają jedynie prawdopodobieństwo popełnienia błędu I rodzaju. Należy pamiętać, że nieodrzucenie weryfikowanej hipotezy H 0 nie oznacza jej przyjęcia. Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o znanym odchyleniu standardowym σ = σ 0. Liczebność próby jest dowolna. H 0 : µ = µ 0 ; H 1 : µ µ 0, gdzie µ 0 jest hipotetyczną wartością średniej. Do weryfikacji hipotezy H 0 wykorzystujemy ( średnią arytmetyczną z próby X. σ Statystyka X ma rozkład normalny N µ, ). n 2

Zmienna U = X µ 0 n σ ma przy założeniu prawdziwości hipotezy H 0 (µ = µ 0 ) rozkład normalny N(0, 1). H 0 : µ = µ 0 ; H 1 : µ < µ 0. P (U u α ) = α albo Φ(u α ) = α. W = {u: u u α } = (, u α. Hipotezy H 0 i H 1 mają postać H 0 : µ = µ 0 ; H 1 : µ > µ 0. Z tablic rozkładu N(0, 1) odczytujemy wartość krytyczną u α w ten sposób, by spełniony był warunek P (U u α ) = α albo Φ(u α ) = 1 α. Zbiór krytyczny W ma postać W = {u: u u α } = u α, + ). I Obserwowana w próbie zmienna X ma rozkład dowolny, ale odchylenie standardowe σ jest nieznane. Liczebność próby jest duża (n 30). H 0 : µ = µ 0 ; H 1 : µ µ 0. Ze względu na fakt, że próba jest duża, można przyjąć, że σ Ŝ. Przy założeniu prawdziwości hipotezy H 0 zmienna ma rozkład normalny N(0, 1). U = X µ 0 Ŝ X µ 0 n = n 1 S 3

I Testy jednostronne budujemy podobnie jak w modelu I. II Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o nieznanym odchyleniu standardowym σ. Liczebność próby jest mała (n < 30). H 0 : µ = µ 0 ; H 1 : µ µ 0. Ze względu na małą liczebność nie można wykorzystać statystyki z modelu II. Zmienna losowa T = X µ 0 X µ 0 n = n 1 Ŝ S ma przy założeniu prawdziwości hipotezy H 0 rozkład t-studenta o n 1 stopniach swobody. II Dla określonego poziomu istotności α wyznaczamy wartość krytyczną t α z tablic rozkładu t-studenta o n 1 stopniach swobody w ten sposób, by spełniony był warunek P ( T t α ) = α. W = {t: t t α } = (, t α t α, + ). Jeżeli wartość statystyki T wyznaczona dla danej próby jest równa t 0 oraz t 0 W, to hipotezę H 0 odrzucamy. Jeżeli natomiast t 0 / W, to nie mamy dostatecznych podstaw do odrzucenia hipotezy H 0. II H 0 : µ = µ 0 ; H 1 : µ < µ 0. Z tablic rozkładu t-studenta o n 1 stopniach swobody odczytujemy wartość krytyczną t α w ten sposób, by spełniony był warunek P ( T t α ) = 2α. W = {t: t t α } = (, t α. II H 0 : µ = µ 0 ; H 1 : µ > µ 0. 4

Z tablic rozkładu t-studenta o n 1 stopniach swobody odczytujemy wartość krytyczną t α w ten sposób, by spełniony był warunek P ( T t α ) = 2α. W = {t: t t α } = t α, + ). Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ. Liczebność próby jest mała (n < 50). H 0 : σ 2 = σ 2 0; H 1 : σ 2 σ 2 0, gdzie σ 2 0 jest hipotetyczną wartością wariancji σ 2. Do weryfikacji hipotezy H 0 wykorzystujemy zmienną losową χ 2 = ns2 σ 2 0 lub χ 2 = (n 1)Ŝ2 σ0 2. Jeżeli słuszna jest hipoteza H 0, to powyższe zmienne losowe mają rozkład χ 2 o n 1 stopniach swobody. Przy ustalonym poziomie istotności α z tablic tego rozkładu odczytujemy wartości χ 2 1 oraz χ 2 2 tak, aby P (χ 2 χ 2 2) = α 2 = 1 P (χ2 χ 2 1). W = (0, χ 2 1 χ 2 2, + ). Jeżeli wartość statystyki χ 2 wyznaczona dla danej próby jest równa χ 2 0 oraz χ 2 0 W, to hipotezę H 0 odrzucamy. Jeżeli natomiast χ 2 0 / W, to nie mamy podstaw do odrzucenia hipotezy H 0. H 0 : σ 2 = σ 2 0; H 1 : σ 2 < σ 2 0. Przy ustalonym poziomie istotności α z tablic rozkładu χ 2 o n 1 stopniach swobody odczytujemy wartość χ 2 α tak, aby P (χ 2 χ 2 α) = 1 α. W = (0, χ 2 α. H 0 : σ 2 = σ 2 0; H 1 : σ 2 > σ 2 0. Przy ustalonym poziomie istotności α z tablic rozkładu χ 2 o n 1 stopniach swobody odczytujemy wartość χ 2 α tak, aby P (χ 2 χ 2 α) = α. W = χ 2 α, + ). I 5

Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ. Liczebność próby jest duża (n 50). H 0 : σ 2 = σ 2 0; H 1 : σ 2 σ 2 0, gdzie σ0 2 jest hipotetyczną wartością wariancji σ 2. Do weryfikacji hipotezy H 0 wykorzystujemy statystykę 2nS U = 2 2n 3, która ma w przybliżeniu rozkład normalny N(0, 1). σ 2 0 I I H 0 : σ 2 = σ 2 0; H 1 : σ 2 < σ 2 0. P (U u α ) = α albo Φ(u α ) = α. W = {u: u u α } = (, u α. I H 0 : σ 2 = σ 2 0; H 1 : σ 2 > σ 2 0. P (U u α ) = α albo Φ(u α ) = 1 α. W = {u: u u α } = u α, + ). Niech rozkład badanej cechy będzie dwupunktowy z parametrem p. Liczebność próby jest duża (n 100). H 0 : p = p 0 ; H 1 : p p 0. Hipoteza H 0 mówi, że frakcja wyróżnionych elementów w populacji jest równa p 0. Estymatorem frakcji p jest statystyka K, gdzie K jest liczbą elementów wyróżnionych w n-elementowej próbie. n 6

( ) p(1 p) Ma ona rozkład asymptotycznie normalny N p,. n Statystyka U = K n p 0 p 0(1 p 0) n = K np 0 np0 (1 p 0 ) ma przy założeniu prawdziwości hipotezy H 0 rozkład asymptotycznie normalny N(0, 1). H 0 : p = p 0 ; H 1 : p < p 0. P (U u α ) = α albo Φ(u α ) = α. W = {u: u u α } = (, u α. H 0 : p = p 0 ; H 1 : p > p 0. P (U u α ) = α albo Φ(u α ) = 1 α. W = {u: u u α } = u α, + ). 7