WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Podobne dokumenty
Testowanie hipotez statystycznych

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Testowanie hipotez statystycznych cd.

Matematyka i statystyka matematyczna dla rolników w SGGW

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka matematyczna dla leśników

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Estymacja punktowa i przedziałowa

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

1 Estymacja przedziałowa

Wykład 3 Hipotezy statystyczne

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Testowanie hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka matematyczna i ekonometria

Hipotezy statystyczne

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Hipotezy statystyczne

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez cz. I

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Estymacja parametrów rozkładu cechy

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

166 Wstęp do statystyki matematycznej

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

hipotez statystycznych

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Testowanie hipotez statystycznych.

Wydział Matematyki. Testy zgodności. Wykład 03

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Zawartość. Zawartość

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wnioskowanie statystyczne. Statystyka w 5

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

1 Podstawy rachunku prawdopodobieństwa

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

WYKŁAD 5 TEORIA ESTYMACJI II

1 Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Rozkłady statystyk z próby

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyka Matematyczna Anna Janicka

Porównanie dwóch rozkładów normalnych

Zadania ze statystyki, cz.6

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Statystyka w przykładach

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Transkrypt:

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa

Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład normalny, X ~ N(µ, σ 2 ), gdzie µ, σ 2 nieznane; Cel: wyznaczyć ocenę średniej masy jednego owocu tej odmiany µ. o losujemy próbę: x 1, x 2,..., x n, np. 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2

Estymacja punktowa parametru µ: Estymacja przedziałowa parametru µ: o obliczamy średnią arytmetyczną x dla próby: x = 194, 46 g, Oceną punktową parametru µ jest średnia arytmetyczna x dla próby; w przykładzie oceną punktową średniej masy jednego owocu tej odmiany µ jest wartość 194,46 g. o wybieramy poziom ufności 1-α, np. 95%, o odczytujemy z tablic wartość krytyczną rozkładu t-studenta t α, n-1, np. t 0,05, 9 = 2,2622, o obliczamy parametry próby: x = 194, 46 g, s = 5,19 g, o wyznaczamy ze wzoru krańce przedziału ufności. Ocena przedziałowa parametru µ to przedział ufności; w przykładzie 95% przedziałem ufności dla średniej masy jednego owocu tej odmiany µ jest 190, 75;19817,. 194,46 190,75 194,46 198,17

Pytanie: Czy moŝna przyjąć, Ŝe średnia masa jednego owocu tej odmiany µ jest równa 200? Decyzja: tak/nie.

Idea testowania hipotez i podstawowe pojęcia Przykład. Badamy krąŝek o wymiarach zbliŝonych do monety jednozłotowej ze stronami oznaczonymi: A, B. Mamy ustalić, czy krąŝek jest symetryczny? (w wyniku rzutów tym krąŝkiem z jednakową częstością będzie pojawiać się kaŝda ze stron). Formułujemy hipotezę merytoryczną: krąŝek jest symetryczny; stosunek wyników A do B wynosi 1:1; pstwo otrzymania wyniku A wynosi 0,5.

Sprawdzenie hipotezy Testowanie (weryfikacja) hipotezy wykonujemy pewną liczbę rzutów n (n-elementowa próba), np. n = 10; określamy regułę podejmowania decyzji dotyczącej hipotezy na podstawie wyników w próbie: jeśli wypadnie od 4 do 6 wyników A w 10-elementowej próbie, to monetę uznamy za symetryczną, w przeciwnym przypadku uznamy ją za niesymetryczną, próba: A B B B B A B B B B wyznaczamy liczbę wyników A w próbie, k A = 2, podejmujemy decyzję dotyczącą hipotezy: na podstawie próby odrzucamy hipotezę, Ŝe moneta jest symetryczna.

Teoretyczny opis doświadczenia Doświadczenie losowe: rzut symetrycznym krąŝkiem ze stronami A, B (hipoteza o symetryczności jest prawdziwa); X liczba wyników A w 10-elementowej próbie; X~B(n = 10, p = 0,5). Wykres funkcji rozkładu pstwa zmiennej losowej X pstwo 0,3 0,25 0,2 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 wartości X

wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 P {X=0} = 0,001 Przykładowa reguła podejmowania decyzji: hipotezę odrzucimy jeśli X=0 lub X=10. P {X=0 lub X=10} = P{X=0}+P{X=10}= = 2 0,001 = 0,002 Jeśli liczba wyników A w próbie wyniesie 0 lub 10, to hipotezę odrzucimy. Odrzucając hipotezę popełniamy błąd. Ten błąd popełniamy z pstwem 0,002. Błędną decyzję podejmujemy z pstwem 0,002.

Jeśli liczba wyników A w próbie wyniesie od 1 do 9, to hipotezy nie moŝna odrzucić ( hipotezę przyjmujemy ). Przyjmując hipotezę nie popełniamy błędu. Prawidłową decyzję o przyjęciu hipotezy podejmujemy z pstwem 0,998. Inna reguła podejmowania decyzji: hipotezę odrzucimy jeśli { 0, 1, 2, 3, 7, 8, 9, 10 } X. Przy tej regule pstwo popełnienia błędu (podjęcia błędnej decyzji o odrzuceniu hipotezy wynosi P ( X { 0, 1, 2, 3, 7, 8, 9, 10 }) = 0, 344.

Inne reguły podejmowania decyzji: Odrzucenie hipotezy przy liczbie wyników A Pstwo popełnienia błędu X = 0 lub X = 10 0,002 X 1 lub X 9 0,022 X 2 lub X 8 0,011 X 3 lub X 7 0,344 X 4 lub X 6 0,754 X { 0, 1,..., 10 } 1 Jakie pstwo popełnienia błędu akceptujemy? Graniczne pstwo błędu poziom istotności, ozn. α (np. α = 0,05 albo α = 0,01). Jeśli przyjmiemy α = 0,05, to obszar krytyczny dla hipotezy (odrzucenia hipotezy) to zbiór { 0, 1, 2, 8, 9, 10}, a obszar dopuszczalny { 3, 4, 5, 6, 7}.

Testowanie hipotez (ogólnie): stawiamy hipotezę, wybieramy funkcję testową f (statystykę testową, test statystyczny), przyjmujemy poziom istotności α; tym samym wyznaczamy obszar krytyczny testu (wartość krytyczną funkcji testowej f kryt ), losujemy próbę, wyliczamy wartość funkcji testowej dla próby f emp (wartość empiryczną funkcji testowej), porównujemy f emp z f kryt, hipotezę odrzucamy, gdy f emp f kryt ; w przeciwnym przypadku hipotezy nie odrzucamy.

Terminologia i oznaczenia: Hipoteza statystyczna to dowolne przypuszczenie dotyczące rozkładu pstwa cechy X (jest to formalny zapis przypuszczenia merytorycznego). Testowaną hipotezę nazywamy hipotezą zerową, ozn.: H 0. W przykładzie cecha X~B(n, p); hipoteza zerowa H 0 : p = 0,5. Funkcja testowa np.: t-studenta, F-Fishera, χ 2 chi-kwadrat. W przykładzie funkcja testowa k = liczba wyników A. Wartość empiryczna funkcji testowej (wartość funkcji testowej dla próby), np.: t emp, F emp, χ 2 emp. W przykładzie k emp = 2.

Poziom istotności α. Wartość krytyczna funkcji testowej (wartość krytyczna testu), np.: t kryt, F kryt, χ 2 kryt. t kryt = t α,v taka, Ŝe P{ t v > t α,v } = α, gdzie t v jest zmienną losową o rozkładzie t-studenta z v stopniami swobody. F kryt = F α,u,v taka, Ŝe P{ F u,v > F α,u,v }= α, gdzie F u,v jest zmienną losową o rozkładzie F-Fishera z liczbami stopni swobody u, v. χ 2 kryt= χ 2 α, v taka, Ŝe P{ χ 2 v > χ 2 α, v } = α, gdzie χ 2 v jest zmienną losową o rozkładzie chi-kwadrat z liczbą stopni swobody v. Wartość p p = P{ t v > t emp }

Błędy wnioskowania o prawdziwości hipotezy zerowej Stan rzeczywisty Wniosek odrzucić H 0 nie odrzucać H 0 H 0 prawdziwa błąd I rodzaju, pstwo = α wniosek prawidłowy H 0 nieprawdziwa (fałszywa) wniosek prawidłowy błąd II rodzaju, pstwo = β Błąd I rodzaju - błąd wnioskowania polegający na odrzuceniu hipotezy zerowej, która jest prawdziwa; pstwo wystąpienia tego błędu powinno być małe, np. α = 0,05 lub α = 0,01; α - poziom istotności testu. Błąd II rodzaju - błąd wnioskowania polegający na nieodrzuceniu hipotezy zerowej, która jest fałszywa.

Hipotezy i testy statystyczne ZałoŜenia: 1. cecha X ~ N(µ, σ 2 ), µ, σ 2 - nieznane parametry, 2. próba losowa: x 1, x 2,...x n ; n liczebność próby; H 0 : µ = µ 0 (porównanie z normą), test t-studenta; poziom istotności α. x µ Funkcja testowa: t emp = 0 n s Wnioskowanie 1: jeŝeli t emp > t α, n-1, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. Wnioskowanie 2 (równowaŝne z wnioskowaniem 1): jeŝeli wartość p < α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić.

Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: X ~ N(µ, σ 2 ), gdzie µ, σ 2 nieznane. Hipoteza zerowa H 0 : µ = 200, test t-studenta, poziom istotności α = 0,05. Próba: 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2; n=10; parametry próby: x = 194, 46 g, s = 5,19 g. Wartość empiryczna funkcji testowej x µ 0 194, 46 200 t emp = n = 10 = 3, 3755 s 519,. Wartość krytyczna funkcji testowej t α,n-1 = t 0,05, 9 = 2,2622. Wnioskowanie 1 (wniosek statystyczny): t emp =3,3375> 2,2622 = t 0,05,9, zatem hipotezę zerową H 0 odrzucamy. Wniosek merytoryczny: nie moŝna przyjąć, Ŝe średnia masa owocu tej odmiany wynosi 200 g.

Ozn.: t emp = X S µ n y = f (x) funkcja gęstości rozkładu t-studenta z v=9 stopniami swobody f(x) 0 wartości t

y = f (x) funkcja gęstości rozkładu t-studenta z v = 9 stopniami swobody α 0, 05 Pole = = = 0, 025 2 2 Pole=1-α=0,95 α 0, 05 Pole = = = 0, 025 2 2 - t 0,05, 9 = -2,2622 0 t 0,05,9 =2,2622 wartości t obszar dopuszczenia hipotezy obszar odrzucenia hipotezy (krytyczny)

y = f (x) funkcja gęstości rozkładu t-studenta z v = 9 stopniami swobody Pole = wartość p Pole = α = 0,05 -t emp =-3,34 - t kryt = -2,26 0 t kryt =2,26 t emp =3,34 wartości t

ZałoŜenia: 1. cecha X 1 ~N(µ 1, σ 2 ), cecha X 2 ~N(µ 2, σ 2 ), µ 1, µ 2, σ 2 - nieznane parametry, 2. pobrano n 1 elementową próbę losową z pierwszej populacji oraz n 2 -elementową próbę losową z drugiej populacji. H 0 : µ 1 = µ 2 (porównanie średnich w dwóch populacjach), test t-studenta, poziom istotności α. x1 x2 Funkcja testowa: temp = s gdzie: 2 1 1 s = r se + n1 n błąd stand. róŝnicy średnich, 2 2 ( n 1) + s ( n 1) r 2 2 s1 1 2 2 s e = n1 + n2 2 wspólna wariancja Wnioskowanie 1: jeŝeli t emp >t α,n1+n2-2, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. Wnioskowanie 2: jeŝeli p<α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić.

ZałoŜenia: 1. cecha X 1 ~N(µ 1, σ 2 ), cecha X 2 ~N(µ 2, σ 2 ), µ 1, µ 2, σ 2 - nieznane parametry, 2. pobrano n 1 elementową próbę losową z pierwszej populacji oraz n 2 elementową próbę losową z drugiej populacji. 2 2 H 0 : σ 1 = σ 2 (porównanie wariancji w dwóch populacjach), test F-Fishera, poziom istotności α. 2 2 max ( s, s ) 1 2 F Funkcja testowa: emp = 2 2 min ( s, s ) Wnioskowanie 1: jeŝeli F emp > F α/2, v licz, v mian, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. UWAGA: v licz liczba stopni swobody dla licznika, v mian - liczba stopni swobody dla mianownika, v i = n i 1. Wnioskowanie 2: jeŝeli wartość p<α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. 1 2

ZałoŜenia: 1. cecha X 1 ma rozkład dwupunktowy z nieznanym parametrem p 1, 2. cecha X 2 ma rozkład dwupunktowy z nieznanym parametrem p 2, 3. pobrano n 1 elementową próbę losową z pierwszej populacji oraz n 2 elementową próbę losową z drugiej populacji, k i liczba elementów k i k1 + k 2 wyróŝnionych w i-tej próbie; p i =, p = n + n. n i 1 2 H 0 : p 1 = p 2 (porównanie frakcji w dwóch populacjach), test przybliŝony u (dla duŝych prób), poziom istotności α. p1 p2 uemp = Funkcja testowa: 1 1 ( ) p 1 p + n1 n 2 Wnioskowanie: jeŝeli u emp u w przeciwnym przypadku H 0 nie moŝna odrzucić. α 1 2, to hipotezę H 0 odrzucamy,

Pojęcia cd.: Hipoteza alternatywna, ozn. H 1 przyjmowana po odrzuceniu hipotezy zerowej. Moc testu - p-stwo nieodrzucenia prawdziwej hipotezy alternatywnej. Od testu wymagamy, aby był najmocniejszy, czyli z duŝym p-stwem odrzucał fałszywą hipotezę zerową.