Weryfikacja hipotez statystycznych

Podobne dokumenty
2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

Prawdopodobieństwo i statystyka

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez cz. I

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych

STATYSTYKA

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych

Hipotezy statystyczne

Hipotezy statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wykład 3 Hipotezy statystyczne

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna i ekonometria

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka Matematyczna Anna Janicka

Testowanie hipotez statystycznych.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna i ekonometria

166 Wstęp do statystyki matematycznej

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

1.1 Wstęp Literatura... 1

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Testowanie hipotez statystycznych. Wprowadzenie

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Podsadny þ jest winien. róúzne. W prawodawstwie wielu krajów przyjmuje sie, þ úze pierwszy bład þ jest bardziej dotkliwy - sady þ skazujaþ

Testowanie hipotez statystycznych

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Estymacja parametrów rozkładu cechy

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykład 12 Testowanie hipotez dla współczynnika korelacji

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych cd.

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Statystyka matematyczna

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Weryfikacja hipotez statystycznych

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Wykład 7 Testowanie zgodności z rozkładem normalnym

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Statystyka matematyczna dla leśników

Metoda najmniejszych kwadratów

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Weryfikacja hipotez statystycznych testy t Studenta

Weryfikacja hipotez: Hipoteza statystyczna to dowolne przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji. o prawdziwości którego

Testowanie hipotez statystycznych.

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Testowanie hipotez statystycznych.

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Statystyka matematyczna. Wykład VI. Zesty zgodności

Transkrypt:

Weryfikacja hipotez statystycznych Przykład (wstępny). Producent twierdzi, że wadliwość produkcji wynosi 5%. My podejrzewamy, że rzeczywista wadliwość produkcji wynosi 15%. Pobieramy próbę stuelementową i zliczamy ilość X sztuk wadliwych. Model statystyczny {{0, 1,..., 100}, {B(100, θ), θ Θ = {0.05, 0.15}}}......................................... 0 5 10 15 20 25 W Z Statmat 10.1

Jeżeli X k, to uznać θ = 0.05 Jeżeli X > k, to uznać θ = 0.15 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 P 0.05 {X > k}. 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 5 10 15 20 25... P 0.15 {X k}...................... 0 5 10 15 20 25.................................................. W Z Statmat 10.2

Model statystyczny: (X, {P θ, θ Θ}) Hipoteza statystyczna: podzbiór Θ 0 zbioru Θ. Θ 0 nazywamy hipotezą zerową Θ 1 = Θ \ Θ 0 nazywamy hipotezą alternatywną Jeżeli zbiór Θ 0 jest jednoelementowy, to mówimy o hipotezie prostej, w przeciwnym przypadku mówimy o hipotezie złożonej. Zapis klasyczny H 0 : θ Θ 0 H 1 : θ Θ 1 W Z Statmat 10.3

Test statystyczny: procedura statystyczna, w wyniku której podejmujemy jedną z dwóch decyzji: odrzucić hipotezę zerową H 0 lub nie ma podstaw do odrzucenia hipotezy zerowej H 0. Formalnie: test hipotezy H 0 utożsamiamy z funkcją φ : X {0, 1} φ(x) = { 1 odrzucić H0 0 nie odrzucać H 0 Test zrandomizowany: funkcja φ : X [0, 1] = 1 odrzucić H 0 φ(x) (0, 1) na podstawie niezależnego od X mechanizmu losowego odrzucić H 0 z prawdopodobieństwem φ(x) = 0 nie odrzucać H 0 Obszar krytyczny: {x X : φ(x) = 1} W Z Statmat 10.4

Błąd I rodzaju: błąd polegający na odrzuceniu hipotezy zerowej H 0, gdy w rzeczywistości jest ona prawdziwa. Poziom istotności. Niech α (0, 1). Test φ jest na poziomie istotności α, jeżeli E θ φ(x) = P θ {φ(x) = 1} α, θ Θ 0 Rozmiar testu: sup E θ φ(x) = sup P θ {φ(x) = 1} θ Θ 0 θ Θ 0 Błąd II rodzaju: błąd polegający na nieodrzuceniu hipotezy zerowej H 0, gdy w rzeczywistości jest ona fałszywa. Moc testu: Θ 1 θ E θ φ(x) = P θ {φ(x) = 1} W Z Statmat 10.5

Twierdzenie 10.1 (lemat Neymana Pearsona) Niech P θ0 oraz P θ1 będą rozkładami prawdopodobieństwa o gęstościach f 0 i f 1. Niech α (0, 1) będzie ustaloną liczbą a. (Istnienie testu) Istnieją takie stałe t i γ, że 1, gdy f 1 (x) > tf 0 (x) φ(x) = γ, gdy f 1 (x) = tf 0 (x) 0, gdy f 1 (x) < tf 0 (x) jest testem hipotezy H 0 : θ = θ 0 przeciwko H 1 : θ = θ 1 na poziomie istotności α, tzn. ( ) E θ0 φ(x) = α b. (Dostateczność) Jeżeli test φ spełnia warunek ( ) i dla pewnego t warunek { 1, gdy f1 (x) > tf ( ) φ(x) = 0 (x) 0, gdy f 1 (x) < tf 0 (x) to φ jest testem najmocniejszym na poziomie istotności α c. (Konieczność) Jeżeli φ jest testem najmocniejszym na poziomie istotności α, to spełnia on warunek ( ) W Z Statmat 10.6

Przykład (Model dwumianowy). Niech θ 0 < θ 1 (0, 1). Model statystyczny {{0, 1,..., n}, {B(n, θ), θ Θ = {θ 0, θ 1 }}} H 0 : θ = θ 0 H 1 : θ = θ 1 ( ) n f 0 (x) = θ0 x (1 θ 0 ) n x x ( ) n f 1 (x) = θ1 x (1 θ 1 ) n x x Konstrukcja testu φ(x) φ(x) = 1 f 1(x) f 0 (x) > t Obszar krytyczny: {x > k} Stała k dobrana jest tak, że [ ] x [ ] n θ1 (1 θ 0 ) 1 θ0 > t θ 0 (1 θ 1 ) 1 θ 1 E θ0 φ(x) = P θ0 {X > k} α W Z Statmat 10.7

Niech n = 100, θ 0 = 0.05, θ 1 = 0.15, α = 0.05 k 7 8 9 10 11 P 0.05 {x>k} 0.12796 0.06309 0.02819 0.01147 0.00427 P 0.05 {x=k} 0.10603 0.06487 0.03490 0.01672 0.00720 Test niezrandomizowany φ(x) = { 1, jeżeli x > 9, 0, jeżeli x 9. Rozmiar testu: P 0.05 {x > 9} = 0.02819 Błąd II rodzaju: P 0.15 {x 9} = 0.05509 Test zrandomizowany φ(x) = { 1, jeżeli x > 9, 0.62495, jeżeli x = 9 0, jeżeli x < 9. Rozmiar testu P 0.05 {x > 9} + 0.62495 P 0.05 {x = 9} = 0.02819 + 0.62495 0.03490 = 0.05.................................................. W Z Statmat 10.8

Przykład. Niech a, b > 1. Model statystyczny {(0, 1), {U(0, 1), B(a, b)}} H 0 : U(0, 1) H 1 : B(a, b) f 0 (x) = 1 1 (0,1) (x) f 1 (x) x a 1 (1 x) b 1 1 (0,1) (x) Konstrukcja testu φ(x) φ(x) = 1 f 1(x) f 0 (x) > t xa 1 (1 x) b 1 > t Obszar krytyczny: {x 0 < x < x 1 } Liczby x 0, x 1 dobrane są tak, że E θ0 φ(x) = P U(0,1) {x 0 < X < x 1 } α W Z Statmat 10.9

x a 1 0 (1 x 0 ) b 1 = x a 1 1 (1 x 1 ) b 1 Ponieważ x 1 = x 0 + α, więc [ ] a 1 [ ] b 1 x0 + α 1 x0 α = 1 x 0 1 x 0 a b x 0 x 1 2 2 0.47500 0.52500 2 3 0.30865 0.35865 2 4 0.22556 0.27556 3 2 0.64135 0.69135 3 3 0.47500 0.52500 3 4 0.37517 0.42517 4 2 0.72444 0.77444 4 3 0.57483 0.62483 4 4 0.47500 0.52500.................................................. W Z Statmat 10.10

Model statystyczny: Hipotezy złożone (X, {P θ, θ Θ}) H 0 i/lub H 1 złożone Iloraz wiarogodności H 0 : θ Θ 0 H 1 : θ Θ 1 λ(x) = sup f θ (x) θ Θ 1 sup f θ (x) θ Θ 0 lub λ(x) = supf θ (x) θ Θ sup f θ (x) θ Θ 0 Test φ(x) = 1, gdy λ(x) > t γ, gdy λ(x) = t 0, gdy λ(x) < t Dobór stałej t sup E θ φ(x) α θ Θ 0 W Z Statmat 10.11

Przykład (Model dumianowy). Niech θ 0 (0, 1). Model statystyczny {{0, 1,..., n}, {B(n, θ), θ Θ = (0, 1)}} H 0 : θ θ 0 H 1 : θ > θ 0 ( ) n f θ (x) = θ x (1 θ) n x x Ponieważ ( ) n ( x sup f θ (x) = f x (x) = n θ (0,1) x n więc sup f θ (x)= θ Θ 0 oraz sup f θ (x)= θ Θ 1 ) x ( 1 x ) n x n { ( n ) ( x ) x ( ) x n 1 x n x n, jeżeli x n θ 0, ) θ x 0 (1 θ 0 ) n x, jeżeli x n > θ 0, ( n x { ( n ) x θ x 0 (1 θ 0 ) n x, jeżeli x n θ 0, ( n ) ( x x n ) x ( ) 1 x n x n, jeżeli x n > θ 0. W Z Statmat 10.12

Zatem λ(x) = = sup f θ (x) θ Θ 1 sup f θ (x) θ Θ 0 ( n ) x θ x 0 (1 θ 0 ) n x ( n ) ( x x n ( n ) ( x x n ) x ( ) 1 x n x, jeżeli x n θ 0, n ) x ( ) 1 x n x ( n n x) θ x 0 (1 θ 0 ), jeżeli x n x n > θ 0. λ(x) jest rosnąca ze względu na x Dobór stałej k λ(x) > t x > k sup P θ {X > k} ==?= P θ0 {X > k} α θ θ 0.................................................. W Z Statmat 10.13

Przykład (Model gaussowski). Niech µ 0 R. Model dla próby X = (X 1, X 2,..., X n ): ( R n, { N ( µ1 n, σ 2 I n ), θ = (µ, σ 2 ) R R + }) Θ = R R + Θ 0 = {µ 0 } R + Θ 1 = (R\{µ 0 }) R + H 0 : µ = µ 0 H 1 : µ µ 0 ( ) { n 1 f µ,σ (x) = σ exp 1 n ( ) } 2 xi µ 2π 2 σ Niech i=1 ˆσ 2 = 1 n n (X i X) 2 σ 2 = 1 n i=1 n (X i µ 0 ) 2 i=1 ( ) n 1 { sup f µ,σ (x)==?=f µ0, σ(x)==?= θ Θ 0 σ exp n } 2π 2 supf µ,σ (x) ==?= f x,ˆσ (x) ==?= θ Θ ( 1 ˆσ 2π ) n { exp n } 2 W Z Statmat 10.14

Iloraz wiarogodności λ(x) = supf µ,σ (x) θ Θ sup f µ,σ (x) = θ Θ 0 ( ) n σ ˆσ Ponieważ n n (X i µ 0 ) 2 = (X i X + X µ 0 ) 2 i=1 i=1 ==?= n (X i X) 2 + n( X µ 0 ) 2 i=1 więc Test λ(x) = (1 + n( X µ 0 ) 2 ) n 2 n i=1 (X i X) 2 φ(x) = 1 λ(x) > t n( X µ 0 ) 2 n i=1 (X > t i X) 2 Dobór stałej t E H0 φ(x) = α W Z Statmat 10.15

a. jeżeli H 0 jest prawdziwa, to n( X µ0 ) N(0, σ 2 ) czyli n( X µ 0 ) 2 σ 2 χ 2 1 b. dla wszystkich θ Θ 1 n ( Xi σ 2 X ) 2 χ 2 n 1 i=1 c. X oraz n i=1 ( Xi X ) 2 są niezależne Jeżeli hipoteza H 0 jest prawdziwa, to 1 n 1 n( X µ 0 ) 2 n i=1 (X i X) F 2 1,n 1 H 0 jest odrzucana na poziomie istotności α, jeżeli ( ) 1 n 1 n( X µ 0 ) 2 n i=1 (X i X) 2 > F (α; 1, n 1) Ponieważ t v = F 1,v, więc ( ) jest równoważne ( ) X µ 0 n > t(α; n 1) S Test ( ) nazywa się testem Studenta.................................................. W Z Statmat 10.16

Przykład (Model gaussowski). Wariancja σ 2 jest znana. Niech µ 0 R. ( R n, { N ( µ1 n, σ 2 I n ), θ = µ R }) Θ = R Θ 0 = (, µ 0 Θ 1 = (µ 0, ) H 0 : µ µ 0 H 1 : µ > µ 0 Stosując technikę poprzedniego przykładu otrzymujemy test o obszarze krytycznym X µ 0 σ n > u1 α Moc testu. Niech µ > µ 0. Prawdopodobieństwo odrzucenia H 0 { } X µ0 P µ n > u1 α = σ { X µ P µ n > uα µ µ } 0 n = σ σ ( 1 Φ u α µ µ ) 0 n σ W Z Statmat 10.17

Moc testu jest zależna od (µ µ 0 )/σ P µ {φ(x) = 1}.......... µ 0................................... n = 10.. n = 20... n = 100 µ Liczność próby. Niech (µ µ 0 )/σ = x 0 będzie daną liczbą. Powiedzmy, że interesuje nas osiągnięcie dla tej wartości mocy co najmniej γ. Szukamy takiego n, że 1 Φ(u 1 α x 0 n) γ Rozwiązanie: u 1 α x 0 n u1 γ Stąd n [ u1 α u 1 γ x 0 ] 2 W Z Statmat 10.18

γ (α=0.05) x 0 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 0.01 48987 55003 61720 69403 78488 89783 105073 129946 0.05 1959 2200 2468 2776 3139 3591 4202 5197 0.10 489 550 617 694 784 897 1050 1299 0.15 217 244 274 308 348 399 466 577 0.20 122 137 154 173 196 224 262 324 0.25 78 88 98 111 125 143 168 207 0.30 54 61 68 77 87 99 116 144 0.35 39 44 50 56 64 73 85 106 0.40 30 34 38 43 49 56 65 81 0.45 24 27 30 34 38 44 51 64 0.50 19 22 24 27 31 35 42 51 0.55 16 18 20 22 25 29 34 42 0.60 13 15 17 19 21 24 29 36 0.65 11 13 14 16 18 21 24 30 0.70 9 11 12 14 16 18 21 26 0.75 8 9 10 12 13 15 18 23 0.80 7 8 9 10 12 14 16 20 0.85 6 7 8 9 10 12 14 17 0.90 6 6 7 8 9 11 12 16 0.95 5 6 6 7 8 9 11 14 1.00 4 5 6 6 7 8 10 12.................................................. W Z Statmat 10.19

Wartość p value Przykład (Model gaussowski). Wariancja σ 2 jest znana. Niech µ 0 R. ( R n, { N ( µ1 n, σ 2 I n ), θ = µ R }) Θ = R Θ 0 = {µ 0 } Θ 1 = R \ {µ 0 } H 0 : µ = µ 0 H 1 : µ µ 0 Test oparty na statystyce ( X µ0 Z(X) = n σ Duże wartości Z przemawiają przeciwko H 0 Jeżeli H 0 jest prawdziwa, to Z(X) ma rozkład chi kwadrat z jednym stopniem swobody. Niech Z(x) będzie wartością statystyki Z zaobserwowaną w próbie. Liczbę p = P {χ 2 1 > Z(x)} ) 2 nazywamy p value.................................................. W Z Statmat 10.20