Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1
Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez statystycznych 2. Testowanie hipotezy dotyczącej: a. średniej z rozkładu normalnego b. porównaniu dwóch średnich z rozkładów normalnych c. porównaniu dwóch wariancji z rozkładów normalnych d. porównaniu dwóch frakcji z rozkładów dwupunktowych 2
Był problem Cecha X masa owocu pewnej odmiany ZałoŜenie Cecha X ma w populacji rozkład normalny, X ~ N(µ, σ 2 ), gdzie µ, σ 2 nieznane Cel Wyznaczyć ocenę średniej masy jednego owocu tej odmiany µ 3
Był problem cd. Działanie Estymujemy parametr µ na podstawie wylosowanej próby: x 1, x 2,..., x n ; np. 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2 4
Był problem cd. Wynik Ocena punktowa µ wynosi Ocena przedziałowa x = 194, 46g µ 190,75 ; 198,17 P = 95% 5
Jest problem Cecha X masa owocu pewnej odmiany ZałoŜenie Cecha X ma w populacji rozkład normalny, X ~ N(µ, σ 2 ), gdzie µ, σ 2 nieznane Cel Wyznaczyć ocenę średniej masy jednego owocu tej odmiany µ Zbadać wartość średniej masy jednego owocu tej odmiany µ. 6
Jest problem cd. Pytanie Czy moŝna przyjąć, Ŝe średnia masa jednego owocu tej odmiany µ jest równa 200? µ = 200 Decyzja tak / nie 7
Jest problem cd. µ = 200 Badana hipoteza Weryfikacja hipotezy (Testowanie hipotezy) tak / nie Decyzja 8
Idea testowania hipotez - przykład Badamy krąŝek o wymiarach zbliŝonych do monety jednozłotowej ze stronami oznaczonymi: A, B. Mamy ustalić, czy krąŝek jest symetryczny? (podczas rzutów tym krąŝkiem kaŝda ze stron będzie się pojawiać z jednakową częstością). Chcemy dostać odpowiedź: tak/nie 9
Hipoteza merytoryczna 1. Formułujemy hipotezę merytoryczną (stwierdzenie): inaczej: krąŝek jest symetryczny stosunek wyników A do B wynosi 1:1 inaczej: p-stwo otrzymania wyniku A wynosi 0,5 10
Testowanie hipotezy 2. Wybieramy wartość testową (test) do zbadania hipotezy: liczba wyników A w próbie, ozn. L A 3. Określamy regułę podejmowania decyzji tak/nie odnośnie hipotezy na podstawie wartości testowej dla próby 3. Losujemy próbę: x 1, x 2,..., x n 4. Wyznaczamy wartość testową dla wylosowanej próby 11
Testowanie hipotezy cd. 5. Formułujemy wniosek odnośnie hipotezy (podejmujemy decyzję odrzucić/nie odrzucić ) 12
Idea testowania hipotez przykład cd. Przykładowa reguła podejmowania decyzji: Jeśli wypadnie od 4, 5 lub 6 wyników A w 10-elementowej próbie, to krąŝek uznamy za symetryczny, w przeciwnym przypadku - za niesymetryczny. 13
Idea testowania hipotez przykład 1 Wylosowana próba: A B B B B A B B B B Wyznaczamy liczbę wyników A w próbie (wartości testu): L A = 2 Formułujemy wniosek odnośnie hipotezy: na podstawie próby odrzucamy hipotezę, Ŝe krąŝek jest symetryczny 14
Idea testowania hipotez przykład 2 Wylosowana próba: A A B A B A A B B A Wyznaczamy liczbę wyników A w próbie (wartość testu): L A = 6 Formułujemy wniosek odnośnie hipotezy: na podstawie próby przyjmujemy hipotezę, Ŝe krąŝek jest symetryczny 15
Teoretyczne podstawy testowania hipotez Doświadczenie losowe: rzut symetrycznym krąŝkiem ze stronami A, B hipoteza o symetryczności jest prawdziwa 16
Teoretyczne podstawy cd. X liczba wyników A w 10 - elementowej próbie X~B(n = 10, p = 0,5) Wyznaczymy rozkład p-stwa zmiennej losowej X ze wzoru Bernoulliego 17
Teoretyczne podstawy cd. Wykres funkcji rozkładu p-stwa zmiennej losowej X 0,3 p-stwo 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 wartości X 18
Teoretyczne podstawy cd. wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 P { X = 0} = 0,001 p-stwo zdarzenia, Ŝe w próbie wypadnie 0 wyników A (Ŝadnego wyniku A, same wyniki B) wynosi 0,001 19
Teoretyczne podstawy cd. wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 Przykładowa reguła podejmowania decyzji: hipotezę odrzucimy jeśli X = 0 lub X = 10 20
Teoretyczne podstawy cd. wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 Przykładowa reguła podejmowania decyzji: hipotezę odrzucimy jeśli X = 0 lub X = 10 Odrzucając hipotezę popełniamy błąd, bo jest ona prawdziwa. 21
Teoretyczne podstawy cd. wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 Przykładowa reguła: hipotezę odrzucimy jeśli X = 0 lub X = 10 Hipotezę odrzucamy z p-stwem P{ X = 0 lub X = 10} = = P{ X = 0} + P{ X = 10} = = 0,001 +0,001 = 0,002 22
Teoretyczne podstawy cd. wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 Przykładowa reguła: hipotezę odrzucimy jeśli X = 0 lub X = 10 Hipotezę odrzucamy z p-stwem 0,002 Odrzucając hipotezę popełnimy błąd Błąd popełniamy z pstwem 0,002 23
Teoretyczne podstawy cd. wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 Przykładowa reguła: hipotezę odrzucimy jeśli X = 0 lub X = 10 Błędną decyzję o odrzuceniu hipotezy prawdziwej podejmujemy z pstwem 0,002 24
Teoretyczne podstawy cd. Dalej: Jeśli liczba wyników A w próbie wyniesie od 1 do 9, to hipotezy nie moŝna odrzucić ( hipotezę przyjmujemy ). Przyjmując hipotezę prawdziwą nie popełniamy błędu. Poprawną decyzję o przyjęciu hipotezy podejmujemy z p-stwem 0,998. 25
Teoretyczne podstawy cd. Inna reguła podejmowania decyzji: hipotezę odrzucimy jeśli X { 0, 1, 2, 3, 7, 8, 9, 10 } Przy tej regule p-stwo popełnienia błędu (podjęcia błędnej decyzji o odrzuceniu hipotezy prawdziwej) wynosi P ( X { 0, 1, 2, 3, 7, 8, 9, 10 }) = 0, 344 26
Teoretyczne podstawy cd. Inne reguły podejmowania decyzji: Odrzucenie hipotezy przy liczbie wyników A X = 0 lub = 10 X 1 lub 9 Pstwo popełnienia błędu X 0,002 X 0,022 2 X 0,110 3 X 0,344 4 X 0,754 X { 0, 1,..., 10 } 1 X lub 8 X lub 7 X lub 6 27
Teoretyczne podstawy cd. Inne reguły podejmowania decyzji: Odrzucenie hipotezy przy liczbie wyników A X = 0 lub = 10 X 1 lub 9 Pstwo popełnienia błędu X 0,002 X 0,022 2 X 0,110 3 X 0,344 4 X 0,754 X { 0, 1,..., 10 } 1 X lub 8 X lub 7 X lub 6 Jakie p-stwo popełnienia błędu akceptujemy? 28
Teoretyczne podstawy cd. Jakie p-stwo popełnienia błędu akceptujemy? Graniczne p-stwo błędu poziom istotności, ozn. α (alfa) np. α = 0,05 albo α = 0,01 Jeśli przyjmiemy α = 0,2, to obszar krytyczny dla hipotezy (odrzucenia hipotezy) to zbiór {0,1, 2, 8, 9, 10}, a obszar dopuszczalny { 3, 4, 5, 6, 7}. 29
Teoretyczne podstawy cd. Odrzucenie hipotezy przy liczbie wyników A X = 0 lub = 10 X 1 lub 9 Pstwo popełnienia błędu X 0,002 X 0,022 2 X 0,110 3 X 0,344 4 X 0,754 X { 0, 1,..., 10 } 1 X lub 8 X lub 7 X lub 6 30
Teoretyczne podstawy cd. Dla α = 0,2 obszar krytyczny dla hipotezy (obszar odrzucenia hipotezy) to zbiór {0,1, 2, 8, 9, 10} a obszar dopuszczalny to zbiór { 3, 4, 5, 6, 7} 0 1 2 3 4 5 6 7 8 9 10 31
Teoretyczne podstawy cd. 1. Formułujemy hipotezę: p-stwo otrzymania wyniku A wynosi 0,5 2. Wybieramy test do zbadania hipotezy: liczba wystąpień wyniku A w próbie losowej, ozn.: L A 3. Przyjmujemy poziom istotności α (tym samym wyznaczamy obszar krytyczny testu) dla α = 0,2, obszar krytyczny to zbiór { 0, 1, 2, 8, 9, 10} 32
Teoretyczne podstawy cd. 4. Losowujemy próbę: A B B B B A B B B B 5. Wyznaczamy wartości testu dla wylosowanej próby: L A =2 33
Teoretyczne podstawy cd. 6. Formułujemy wniosek odnośnie hipotezy (hipotezę odrzucamy, gdy wartość testu wpada do obszaru krytycznego; w przeciwnym przypadku hipotezy nie odrzucamy Odrzucamy hipotezę, Ŝe krąŝek jest symetryczny 34
Terminologia i oznaczenia Hipoteza statystyczna to dowolne przypuszczenie dotyczące rozkładu p-stwa cechy X (typ rozkładu, parametr rozkładu) Testowaną hipotezę nazywamy hipotezą zerową, ozn.: H 0 W przykładzie cecha X~B(n, p); hipoteza zerowa H 0 : p = 0,5. 35
Terminologia i oznaczenia cd. Funkcja testowa ozn. np.: t-studenta, F-Fishera, χ 2 chi-kwadrat W przykładzie funkcja testowa L A = liczba wyników A Wartość empiryczna funkcji testowej (wartość funkcji testowej dla próby), np.: t emp, F emp, χ 2 emp. W przykładzie L Aemp = 2 36
Terminologia i oznaczenia cd. Poziom istotności α. α akceptowalne p-stwo popełnienia błędu (przy odrzucaniu hipotezy prawdziwej), np. α = 0,01, α = 0,05 37
Terminologia i oznaczenia cd. Wartość krytyczna funkcji testowej (wartość krytyczna testu) np.: t kryt, F kryt, χ 2 kryt; t kryt = t α,v taka, Ŝe P{ t v > t α,v } = α, gdzie t v jest zmienną losową o rozkładzie t-studenta z v stopniami swobody; F kryt = F α,u,v taka, Ŝe P{ F u,v > F α,u,v }= α, gdzie F u,v jest zmienną losową o rozkładzie F-Fishera z liczbami stopni swobody u, v. 38
Terminologia i oznaczenia cd. χ 2 kryt= χ 2 α, v taka, Ŝe P{ χ 2 v > χ 2 α, v } = α, gdzie χ 2 v jest zmienną losową o rozkładzie chi-kwadrat z liczbą stopni swobody v. Wartość p p = P{ t v > t emp } 39
Błędy wnioskowania STAN RZECZYWISTY H 0 prawdziwa H 0 nieprawdziwa (fałszywa) ODRZUCIĆ H 0 błąd I rodzaju, pstwo = α wniosek prawidłowy WNIOSEK NIE ODRZUCAĆ H 0 wniosek prawidłowy błąd II rodzaju, pstwo = β 40
Błędy wnioskowania - definicje Błąd I rodzaju - błąd wnioskowania polegający na odrzuceniu hipotezy zerowej, która jest prawdziwa; pstwo wystąpienia tego błędu powinno być małe, np. α = 0,05 lub α = 0,01; α - poziom istotności testu. Błąd II rodzaju - błąd wnioskowania polegający na nieodrzuceniu hipotezy zerowej, która jest fałszywa. 41
Hipoteza H 0 : µ = µ 0 ZałoŜenia: 1. cecha X ~ N(µ, σ 2 ), µ, σ 2 - nieznane 2. próba losowa: x 1, x 2,..., x n ; n liczebność próby H 0 : µ = µ 0 (porównanie z normą) test t - Studenta; poziom istotności α Funkcja testowa: t emp = x s µ 0 n 42
Wnioskowanie 1: Hipoteza H 0 : µ = µ 0 cd. jeŝeli t emp > t α,v= n-1, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. Wnioskowanie 2 (równowaŝne z wnioskowaniem 1): jeŝeli wartość p < α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. 43
Przykład H 0 : µ = 200 Cecha X masa owocu pewnej odmiany. ZałóŜmy, Ŝe X ~ N(µ, σ 2 ), gdzie µ, σ 2 nieznane Hipoteza zerowa H 0 : µ = 200 Test t -Studenta, poziom istotności α =0,05 Próba: 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2 44
Parametry próby: n=10, Przykład H 0 : µ = 200 cd. x = 194, 46g, s = 5,19 g Wartość empiryczna funkcji testowej: t emp x µ = 0 n = s 194,46 200 = 5,19 10 = 3,3755 Wartość krytyczna funkcji testowej t α,v = n-1 = t 0,05, 9 = 2,2622 45
Przykład H 0 : µ = 200 cd. Wnioskowanie 1 (wniosek statystyczny): t emp =3,3375> 2,2622 = t 0,05,9, zatem hipotezę zerową H 0 odrzucamy. Wniosek merytoryczny: nie moŝna przyjąć, Ŝe średnia masa owocu tej odmiany wynosi 200 g. 46
Wartości krytyczne rozkładu t-studenta X ~ t ν - X zmienna losowa o rozkładzie t-studenta z liczbą stopni swobody v, α - poziom istotności, t α, ν - wartość krytyczna - liczba taka, Ŝe P( X > t α, ν ) = α ν \ α 0,400 0,300 0,200 0,100 0,050 0,025 0,010 0,005 0,001 1 1,3764 1,9626 3,0777 6,3137 12,7062 25,4519 63,6559 127,3211 636,5776 2 1,0607 1,3862 1,8856 2,9200 4,3027 6,2054 9,9250 14,0892 31,5998 3 0,9785 1,2498 1,6377 2,3534 3,1824 4,1765 5,8408 7,4532 12,9244 4 0,9410 1,1896 1,5332 2,1318 2,7765 3,4954 4,6041 5,5975 8,6101 5 0,9195 1,1558 1,4759 2,0150 2,5706 3,1634 4,0321 4,7733 6,8685 6 0,9057 1,1342 1,4398 1,9432 2,4469 2,9687 3,7074 4,3168 5,9587 7 0,8960 1,1192 1,4149 1,8946 2,3646 2,8412 3,4995 4,0294 5,4081 8 0,8889 1,1081 1,3968 1,8595 2,3060 2,7515 3,3554 3,8325 5,0414 9 0,8834 1,0997 1,3830 1,8331 2,2622 2,6850 3,2498 3,6896 4,7809 10 0,8791 1,0931 1,3722 1,8125 2,2281 2,6338 3,1693 3,5814 4,5868 11 0,8755 1,0877 1,3634 1,7959 2,2010 2,5931 3,1058 3,4966 4,4369 12 0,8726 1,0832 1,3562 1,7823 2,1788 2,5600 3,0545 3,4284 4,3178 47
Przykład ilustracja graficzna Ozn.: t emp = X S µ n f(x) y = f (x) funkcja gęstości rozkładu t-studenta z v=9 stopniami swobody 0 wartości t 48
Przykład ilustracja graficzna cd. y = f (x) funkcja gęstości rozkładu t-studenta z v = 9 stopniami swobody α 0, 05 Pole = = = 0, 025 2 2 Pole=1-α=0,95 α 0, 05 Pole = = = 0, 025 2 2 - t 0,05, 9 = -2,2622 0 t 0,05,9 =2,2622 wartości t obszar dopuszczenia hipotezy obszar odrzucenia hipotezy (krytyczny) 49
Przykład ilustracja graficzna cd. y = f (x) funkcja gęstości rozkładu t-studenta z v = 9 stopniami swobody Pole = wartość p Pole = α = 0,05 -t emp =-3,34 - t kryt = -2,26 0 t kryt =2,26 t emp =3,34 wartości t 50
Hipoteza H 0 : µ 1 = µ 2 ZałoŜenia: 1. cecha X 1 ~N(µ 1, σ 2 ), cecha X 2 ~N(µ 2, σ 2 ), µ 1, µ 2, σ 2 - nieznane parametry, 2. pobrano n 1 elementową próbę z pierwszej populacji oraz n 2 -elementową próbę z drugiej populacji H 0 : µ 1 = µ 2 (porównanie średnich w dwóch populacjach), test t-studenta, poziom istotności α 51
52 Hipoteza H 0 : µ 1 = µ 2 cd. Funkcja testowa: r emp s x x t 2 1 = gdzie: + = 2 1 2 1 1 n n s s e r błąd stand. róŝnicy średnich, ( ) ( ) 2 1 1 2 1 2 2 2 1 2 1 2 + + = n n n s n s s e wspólna wariancja;
Hipoteza H 0 : µ 1 = µ 2 cd. Wnioskowanie 1: jeŝeli t emp >t α, v = n1+n2-2, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. Wnioskowanie 2: jeŝeli p < α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. 53
Hipoteza H 0 : σ 1 2 = σ 2 2 ZałoŜenia: 1. cecha X 1 ~N(µ 1, σ 1 2 ), cecha X 2 ~N(µ 2, σ 2 2 ), µ 1, µ 2, σ 1 2, σ 2 2 - nieznane parametry, 2. pobrano n 1 elementową próbę z pierwszej populacji oraz n 2 elementową próbę z drugiej populacji. H 0 : σ 1 2 = σ 2 2 (porównanie wariancji w dwóch populacjach), test F-Fishera, poziom istotności α. 54
Hipoteza H 0 : σ 1 2 = σ 2 2 cd. Funkcja testowa: F emp = max ( s min ( s 2 1 2 1,, s s 2 2 2 2 ) ) 55
Hipoteza H 0 : σ 1 2 = σ 2 2 Wnioskowanie 1: jeŝeli F emp > F α/2, v licz, v mian, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. UWAGA: v licz liczba stopni swobody dla licznika, v mian - liczba stopni swobody dla mianownika, v i = n i 1. 56
Hipoteza H 0 : σ 1 2 = σ 2 2 Wnioskowanie 2: jeŝeli wartość p < α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. 57
Hipoteza H 0 : p 1 = p 2 ZałoŜenia: 1. cecha X 1 ma rozkład dwupunktowy z nieznanym parametrem p 1, 2. cecha X 2 ma rozkład dwupunktowy z nieznanym parametrem p 2, 3. pobrano n 1 elementową próbę z pierwszej populacji oraz n 2 elementową próbę z drugiej populacji, k i liczba elementów wyróŝnionych w i-tej próbie; p = i k n i i p = k n 1 1 + + k n 2 2 58
Hipoteza H 0 : p 1 = p 2 cd. H 0 : p 1 = p 2 (porównanie frakcji w dwóch populacjach), test przybliŝony u (dla duŝych prób), poziom istotności α. Funkcja testowa: u emp = p p 1 p 1 2 1 ( 1 p) + n n 1 2 59
Wnioskowanie: Hipoteza H 0 : p 1 = p 2 cd. jeŝeli u emp u α, to hipotezę H 0 1 2 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. 60
Pojęcia cd. Hipoteza alternatywna, ozn. H 1 przyjmowana po odrzuceniu hipotezy zerowej. Moc testu - p-stwo nieodrzucenia prawdziwej hipotezy alternatywnej. Od testu wymagamy, aby był najmocniejszy, czyli z duŝym p-stwem odrzucał fałszywą hipotezę zerową. 61