166 Wstęp do statystyki matematycznej

Podobne dokumenty
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych

Statystyka matematyczna dla leśników

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Hipotezy statystyczne

Hipotezy statystyczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Wydział Matematyki. Testy zgodności. Wykład 03

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna i ekonometria

Wykład 3 Hipotezy statystyczne

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyka matematyczna i ekonometria

6.4 Podstawowe metody statystyczne

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych.

STATYSTYKA

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Testowanie hipotez statystycznych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych cd.

Prawdopodobieństwo i statystyka

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Statystyka Matematyczna Anna Janicka

Testowanie hipotez statystycznych

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Weryfikacja hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Testowanie hipotez statystycznych. Wprowadzenie

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyka matematyczna

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Testowanie hipotez statystycznych.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna i ekonometria

1 Estymacja przedziałowa

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II

Spis treści 3 SPIS TREŚCI

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Wprowadzenie do analizy korelacji i regresji

WNIOSKOWANIE STATYSTYCZNE

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Testowanie hipotez cz. I

Testowanie hipotez statystycznych

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

STATYSTYKA MATEMATYCZNA

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Weryfikacja hipotez statystycznych

Transkrypt:

166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej w języku teorii prawdopodobieństwa. Powinniśmy wiedzieć, jakiego typu jest to rozkład i dysponować oszacowaniem jego parametrów. Statystyka dysponuje jednak jeszcze jednym narzędziem, którego rola polega między innymi na weryfikacji wiedzy, jaką pozyskaliśmy stosując zaprezentowane wyżej metody 2 i 3. Narzędziem tym jest teoria testów statystycznych. Niech dane będzie populacja generalna będąca przedmiotem obserwacji z punktu widzenia cechy X. Przez hipotezę statystyczną będziemy rozumieli każde przypuszczenie odnoszące się do rozkładu tej cechy formułowane w kategoriach bądź jakościowych dotyczących postaci tego rozkładu, bądź ilościowych związanych z jego parametrami. Będziemy wtedy mówili, że mamy do czynienia odpowiednio z hipotezą nieparametryczną albo hipotezą parametryczną. Podstawą do formułowania przypuszczeń na temat cechy populacji generalnej jest próba prosta. Proces weryfikacji sformułowanej hipotezy nazywamy testem statystycznym. Stąd też procedura testowania hipotez dzieli się na: testy parametryczne i nieparametryczne. U podstaw każdego testu znajduje się założenie, że obok hipotezy weryfikowanej, zwanej też hipotezą zerową i oznaczaną przez H o,formułuje się hipotezę będącą w swojej treści wynikiem zaprzeczenia hipotezy H o, którą nazywamy z tego powodu hipotezą alternatywną i oznaczamy przez. Wtedy, w przypadku odrzucenia hipotezy H o w wyniku przeprowadzonego testu, za prawdziwą uznaje się hipotezę. Jak zaznaczyliśmy wyżej, podstawą do przeprowadzenia weryfikacji hipotezy H o przeciwko hipotezie jest próba prosta. Z teoretycznego punktu widzenia istnieje więc możliwość popełnienia błędu. Mogą zdarzyć się co najmniej dwie sytuacje: H o jest prawdziwa albo H o jest fałszywa. Jeśli w sytuacji pierwszej odrzucimy H o (a więc przyjmiemy ), to mówimy wtedy o popełnionym błędzie I rodzaju, a jego miarą jest wtedy pewna liczba α. W sytuacji drugiej, jeśli H o przyjmujemy (a więc odrzucamy ), to mówimy o błędzie II rodzaju ijegomiarę oznaczamy przez β. Aby zrozumieć znaczenie obu zdefiniowanych błędów musimy dokładniej opisać przebieg procesu testowania hipotez. Niech (x 1,...,x n )=(X 1,...,X n )(ω o ) dla pewnego zdarzenia elementarnego ω o oznacza próbę prostą naszej populacji generalnej. Wtedy (x 1,...,x n ) W =(X 1,...,X n )(Ω) R n, co oznacza, że próba prosta jest jedną z wielu realizacji procesu obserwacji populacji generalnej, którą opisuje tutaj mnogośćw. Zadaniem testu statystycznego jest skonstruowanie takiego podzbioru Q W,żejeśli(x 1,...,x n ) Q, to hipotezę H o odrzucimy na korzyść hipotezy oraz w przypadku gdy (x 1,...,x n ) W \Q,

6.4 Podstawowe metody statystyczne 167 to H o przyjmujemy. Z tego względu zbiór Q nazywamy obszarem krytycznym (mówimy też o obszarze odrzucenia), w przeciwieństwie do zbioru W \ Q zwanego obszarem przyjęcia hipotezy H o. Wtedy znaczenie ilościowe zdefiniowanych wyżej błędów α i β jest następujące: α = P ((x 1,...,x n ) Q H o ),β= P ((x 1,...,x n ) W \ Q ). Z metodologicznego punktu widzenia pierwszą z powyższych równości traktuje się jako równanie z niewiadomą Q, przyjmując, że α jest małą liczbą równą zazwyczaj 0, 1 albo 0, 05. Nazywamy ją wtedy poziomem istotności (wtedy 1 α nazywa się poziomem ufności). Testy statystyczne, które kontrolują tylko błąd I rodzaju nazywamy testami istotności. Można zapytać, co dzieje się z błędem II rodzaju, jeśli błąd I rodzaju został zminimalizowany. Czy on również przyjmuje minimalną wartość? Okazuje się, że tak nie jest. Jest akurat na odwrót, czyli wartości β rosną, jeśli wartości α maleją (patrz np. [19]). Wobec tego testy istotności jako metoda ignorująca z założenia kontrolę błędu II-rodzaju z jednej strony kontrolują na poziomie α odrzucenie hipotezy H o (gdy (x 1,x 2,...,x n ) Q), ale nie wypowiadają się na temat jej przyjęcia. Dlatego wnioskowanie w przypadku przeprowadzenia takiego testu sprowadza się do następującej konkluzji: 1. odrzucenia hipotezy H o i przyjęcia albo 2. braku podstaw do odrzucenia hipotezy H o. Zaczniemy od omówienia podstaw związanych z tzw. testami parametrycznymi (patrz też [4], [19]). Przypuśćmy, że na podstawie próby prostej (x 1...x n )=(X 1...X n )(ω o ) oraz metod opartych na pojęciu dystrybuanty empirycznej (histogramu) i teorii estymacji otrzymaliśmy następujące wyniki: 1. poznaliśmy typ rozkładu cechy X, czyli jej dystrybuantę F, ewentualnie dysponujemy wiedzą na temat istnienia momentów tego rozkładu i parametrów, od których rozkład ten zależy, 2. zakładając, celem uproszczenia sytuacji, że rozkład F zależy od jednego parametru, powiedzmy τ, określiliśmy metodą estymacji przedziałowej jego przedział na zadanym poziomie ufności 1 α. Pojawia się problem wyboru wartości tego parametru. Faza wstępna testu parametrycznego polega na zdefiniowaniu dwóch hipotez: hipotezy zerowej H o przeciwko hipotezie alternatywnej,

168 Wstęp do statystyki matematycznej gdzie gdzie τrτ o H o : τ = τ o, : τrτ o, na ogół oznacza jedną z trzech relacji: τ τ o, τ < τ o, τ > τ o. Rola testu statystycznego, jak pisaliśmy wyżej, polega na tym, aby zweryfikować hipotezę zerową przeciwko hipotezie alternatywnej. Pozytywna weryfikacja kończy się na ogół stwierdzeniem, że nie ma powodów do jej odrzucenia, conie musi oznaczać, że hipotezę zerową przyjmuje się. Zazwyczaj w tej sytuacji cały proces analizy statystycznej zaczyna się od początku, a więc od pobrania nowej próby prostej. W przypadku negatywnej weryfikacji hipotezy zerowej albo przy aktualnych wynikach zmienia się jej treść i powtarza weryfikację albo przyjmuje się hipotezę alternatywną. Podstawą procesu weryfikacji jest, jak pisaliśmy wyżej, obszar krytyczny Q, który w praktyce definiuje się jako podzbiór prostej rzeczywistej, a nie przestrzeni R n. Aby go wyznaczyć potrzebna jest odpowiednia statystyka Z, czyli gdzie Z = f(x 1...X n ), (x 1...x n )=(X 1...X n )(ω o ) jest próbą prostą cechy X populacji generalnej. Wtedy obszar Q wyznaczony jest przez warunek (patrz definicja błędu I rodzaju) P ({ω Ω : Z(ω) Q}) =α, przy założeniu, że zaszła hipoteza H o. Jeśli teraz z obs = Z(ω o ) Q, gdzie z obs jest wartością zaobserwowaną statystyki Z, to hipotezę H o należy odrzucić na korzyść hipotezy. W przeciwnym razie mówimy, że nie ma podstaw do jej odrzucenia. Dalej w kolejnych przykładach pokażemy sposoby konstruowania statystyki Z i odpowiadających jej obszarów krytycznych (patrz też [10]).

6.4 Podstawowe metody statystyczne 169 Przykład 6.4.6 Cecha X populacji generalnej ma rozkład typu N (m, σ 2 ), gdzie parametr σ jest znany. Wtedy dla zweryfikowania hipotezy zerowej H o : m = m o posługujemy się styatystyką Natomiast hipoteza alternatywna 1. Z = X n m n. σ i obszar krytyczny mają wtedy postać: : m m o, Q =(, n α ) (n α, + ), gdzie n α, przy założeniu hipotezy H o określone jest równaniem P ({ω Ω : Z o (ω) n α })=2(1 Φ(n α )) = α, 2. bowiem statystyka Z o = X n m o n σ ma przy założeniu hipotezy zerowej rozkład standardowy normalny. : m>m o, Q =(n + α, + ) gdzie n + α, przy założeniu hipotezy H o określone jest równaniem P ({ω Ω: Z o (ω) >n + α }) =1 Φ(n + α )=α, 3. gdzie statystyka Z o jest identyczna, jak w sytuacji poprzedniej. : m<m o, Q =(, n + α ) gdzie n + α i statystyka Z o są jak wyżej. Przeprowadźmy teraz symulację liczbową. W tym celu odwołamy się do wyników z przykładu 6.4.1. Dostaliśmy tam Postawmy hipotezę zerową m (1,838, 2,328), x 4 =2,083, σ =0,25, α =0,05. H o : m =2przeciwko : m 2.

170 Wstęp do statystyki matematycznej Wtedy, przy założeniu hipotezy zerowej n α =1,96, i przedział krytyczny ma postać Q =(, 1,96) (1,96, + ). Tymczasem z obs = 2,083 2 0,25 =0,684 / Q, co oznacza, że nie ma powodu do odrzucenia hipotezy zerowej. Z drugiej strony biorąc dostalibyśmy H o : m =1,9 przeciwko : m<1,9 Φ(n + α )=1 α =0,95, skąd Q =(, 1,65). Ponieważ teraz z obs = 1,46, zatem również nie ma podstaw, aby nie przyjąć m =1,9. Okazuje się, że dopiero H o : m =2,3 przeciwko : m<2,3 daje z obs = 1,736 Q = (, 1,65), co oznacza, że hipotezę tę należy odrzucić. Jeśli pobrana próba była reprezentatywna, to oznacza to, że najprawdopodobnie wartość średnia cechy X jest mniejsza od 2,3. Przykład 6.4.7 Cecha X populacji generalnej ma rozkład typu N (m, σ 2 ), gdzie oba parametry są nieznane. Wtedy dla zweryfikowania hipotezy zerowej H o : m = m o wykorzystamy statystykę t = X n m n 1. S Natomiast hipoteza alternatywna i obszar krytyczny mają wtedy postać: 1. : m m o, Q =(, t α ) (t α, + ), gdzie t α, przy założeniu hipotezy H o określone jest równaniem P ({ω Ω : t o (ω) t α })=α, bowiem statystyka t o = X n m o n 1 S ma przy założeniu hipotezy zerowej rozkład t Studenta o n 1 stopniach swobody.