TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Podobne dokumenty
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Testy dotyczące wartości oczekiwanej (1 próbka).

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Hipotezy statystyczne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Hipotezy statystyczne

Statystyka matematyczna dla leśników

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka Matematyczna Anna Janicka

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

166 Wstęp do statystyki matematycznej

Na podstawie dokonanych obserwacji:

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna i ekonometria

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Weryfikacja hipotez statystycznych

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Statystyka matematyczna

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna i ekonometria

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Weryfikacja hipotez statystycznych

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wydział Matematyki. Testy zgodności. Wykład 03

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Weryfikacja hipotez statystycznych

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez cz. I

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Prawdopodobieństwo i statystyka

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Testowanie hipotez statystycznych

Prawdopodobieństwo i rozkład normalny cd.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Wykład 10 Testy jednorodności rozkładów

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych testy t Studenta

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Statystyka Matematyczna Anna Janicka

Test lewostronny dla hipotezy zerowej:

Testowanie hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Weryfikacja hipotez: Hipoteza statystyczna to dowolne przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji. o prawdziwości którego

Transkrypt:

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy się hipotezami parametrycznymi: są to hipotezy dotyczące nieznanego parametru rozkładu θ (rozważmy tylko przypadek, gdy θ jest nieznaną średnią wartością pewnej cechy X). Na podstawie próbki (x 1,..., x n ) mamy zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Testem statystycznym będziemy nazywać sposób postępowania, który prowadzi do podjęcia decyzji. Przykład 1. Organizacja ochrony konsumentów przypuszcza, że mleko, dostarczane na rynek przez pewnego producenta, ma niższą procentową zawartość tłuszczu niż nominalna 3,2%. Zbadane zostały 10 kartonów z mlekiem i uzyskane następujące wyniki: 3,26; 3,12; 3,24; 3,16; 3,08; 3,14; 3,23; 3,11; 3,09; 3,24. Czy to podejrzenie jest słuszne czy też nie? 1

Zasady ogólne. 1. Formułujemy dwie wzajemnie wykluczające się hipotezy: H 0 (zerowa) i H 1 (alternatywna). 2. Określamy poziom istotności testu α (0, 1) (standardowo α = 0,05). Jest to prawdopodobieństwo popełnienia błędu I rodzaju. Błąd I rodzaju - prawdziwa jest H 0, a my ją odrzucamy. Błąd II rodzaju - prawdziwa jest H 1, a my decydujemy na rzecz H 0. stan rzeczy/decyzja przyjąć H 0 przyjąć H 1 H 0 prawdziwa OK błąd I rodzaju H 1 prawdziwa błąd II rodzaju OK Pożądane jest, by prawdopodobieństwa popełnienia błędów obu rodzajów były jak najmniejsze. Okazuje się, że tego nie da się zrobić jednocześnie. Wobec tego, postępujemy tak, że przede wszystkim kontrolujemy prawdopodobieństwo popełnienia błędu I rodzaju (hipotezy oznaczamy w ten sposób, aby popełnienie błędu I rodzaju miało gorsze skutki). 3. Dobieramy statystykę (nazywamy ją statystyką testową), której rozkład przy założeniu prawdziwości hipotezy H 0 potrafimy określić (nie może on zależeć od nieznanych parametrów). Zgodnie z tym rozkładem 2

oraz przyjętą wartością α określamy tzw. zbiór krytyczny K. Jest to podzbiór R taki, że prawdopodobieństwo wpadnięcia do K wartości zmiennej losowej o określonym wyżej rozkładzie wynosi właśnie α (czyli jest bardzo małe). 4. Jeśli obliczona na podstawie próbki wartość statystyki testowej wpada do K, to hipotezę H 0 odrzucamy (bo jeśli H 0 jest prawdziwa, to zaszło bardzo rzadkie zdarzenie). Jeśli obliczona wartość statystyki testowej nie wpada do K, to nie mamy podstaw do odrzucenia hipotezy H 0. Uwaga. Decyzje brzmią różnie! Testy dotyczące wartości oczekiwanej θ. 1. H 0 : θ = θ 0 H 1 : θ θ 0 lub θ < θ 0 lub θ > θ 0. 2. Określamy α (0, 1). 3. Rozważamy trzy przypadki: 3a. cecha ma rozkład normalny, wariancja σ 2 jest znana; 3b. cecha ma rozkład normalny, wariancja σ 2 nie jest znana; 3c. cecha ma rozkład dowolny, ale n jest duże. 3

3a. Jeśli H 0 jest prawdziwa, to {x i } - niezależne zmienne losowe o rozkładzie N (θ 0, σ 2 ) = x ma rozkład N (θ 0, σ2 n ) = n x θ 0 σ ma rozkład N (0, 1). Zatem możemy wziąć n x θ 0 σ jako statystykę testową. Postać zbioru krytycznego K zależy od postaci hipotezy alternatywnej H 1. Pod tym względem rozróżniamy: dwustronny obszar krytyczny K = (, z 1 α/2 ) (z 1 α/2, ) (gdy H 1 : θ θ 0 ); lewostronny obszar krytyczny K = (, z 1 α ) (gdy H 1 : θ < θ 0 ); prawostronny obszar krytyczny K = (z 1 α, ) (gdy H 1 : θ > θ 0 ). 3b. Statystyka testowa ma postać n x θ 0 s ; przy prawdziwości hipotezy H 0 ma ona rozkład Studenta o (n 1) stopniach swobody. Obszary krytyczne: K = (, t 1 α/2,n 1 ) (t 1 α/2,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 3c. Statystyka testowa ma postać n x θ 0 s ; przy prawdziwości hipotezy H 0 ma ona (w przybliżeniu) rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). 4

4. Podejmujemy decyzję. Tak, w Przykładzie 1 testujemy na poziomie istotności, powiedzmy, α = 0,05 hipotezę H 0 : θ = 3,2 (producent jest uczciwy) przeciw H 1 : θ < 3,2 (producent oszukuje). Przy założeniu, że cecha ma rozkład normalny i np. σ 2 = 0,004, mamy do czynienia z sytuacją opisaną w 3a. Otrzymujemy z tablic z 0,95 = 1,6449, zatem K = (, 1,6449). Wartość statystyki testowej wynosi 10 3,167 3,2 0,004 = 1,65, czyli wpada ona do K. Zatem należy odrzucić hipotezę H 0 i przyznać, że producent mleka oszukuje. Jeśli nie ma wiedzy o σ 2, to mamy do czynienia z sytuacją opisaną w 3b. Otrzymujemy z tablic t 0,95,9 = 1,8331, zatem K = (, 1,8331). Wartość statystyki testowej wynosi 10 3,167 3,2 0,0048 1,506, czyli nie wpada ona do K. Nie mamy więc podstaw do odrzucenia hipotezy H 0, czyli nie mamy podstaw do orzeczenia, że producent mleka oszukuje. 5

p0 (1 p 0 ) Test dotyczący nieznanej frakcji. H 0 : p = p 0, H 1 : p p 0 lub p < p 0 lub p > p 0. Statystyka testowa ma postać n p p 0 ; przy prawdziwości hipotezy H 0 ma ona (w przybliżeniu) rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). Przykład 2. Badania przeprowadzone wśród uczniów klas pierwszych wykazały, że na 1400 losowo wybranych dzieci 840 ma próchnicę zębów. Na podstawie tych badań, na poziomie istotności α = 0,05 przetestować hipotezę, że 55% pierwszoklasistów ma próchnicę zębów przeciw hipotezie, że odsetek jest większy. Mamy H 0 : p = 0,55 przeciw H 1 : p > 0,55. Otrzymujemy z tablic z 0,95 = 1,6449, zatem K = (1,6449, + ). Wartość statystyki testowej wynosi 1400 0,60 0,55 0,55 0,45 3,76, czyli wpada ona do K. Więc hipotezę H 0 należy odrzucić i uznać, że odsetek pierwszoklasistów mających próchnicę zębów jest większy niż 55%. 6

Pojęcie o p-wartości. Jeśli zaobserwowana wartość statystyki testowej S to s 0, to p-wartość określamy jako: p=p ( S >s 0 ), jeśli obszar krytyczny jest dwustronny; p=p (S < s 0 ), jeśli obszar krytyczny jest lewostronny; p=p (S >s 0 ), jeśli obszar krytyczny jest prawostronny. Teraz podejmujemy decyzję na podstawie porównania p-wartości z poziomem istotności testu α : jeśli p < α, to odrzucamy H 0 ; jeśli p α, to nie mamy podstaw do odrzucenia H 0. 7