Statystyka Matematyczna Anna Janicka

Podobne dokumenty
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Hipotezy statystyczne

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Hipotezy statystyczne

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych

Statystyka matematyczna i ekonometria

Wykład 3 Hipotezy statystyczne

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych

Wykład 10 Testy jednorodności rozkładów

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

166 Wstęp do statystyki matematycznej

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez cz. I

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Spis treści 3 SPIS TREŚCI

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Wydział Matematyki. Testy zgodności. Wykład 03

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Testowanie hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA

Weryfikacja hipotez statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka matematyczna

Wykład 9 Testy rangowe w problemie dwóch prób

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Weryfikacja hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testowanie hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Weryfikacja hipotez statystycznych

Kolokwium ze statystyki matematycznej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Ekonometria. Zajęcia

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Testowanie hipotez statystycznych.

Wykład 11 Testowanie jednorodności

Testowanie hipotez statystycznych. Wprowadzenie

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez statystycznych cd.

Testy dotyczące wartości oczekiwanej (1 próbka).

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka r.

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Weryfikacja hipotez statystycznych

Własności statystyczne regresji liniowej. Wykład 4

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Transkrypt:

Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności, p-value 5. Schemat przeprowadzania testu statystycznego 6. Moc testu, rozmiar testu

Hipoteza statystyczna ogólnie: pewna wypowiedź na temat rozkładu prawdopodobieństwa rządzącego interesującym nas zjawiskiem (obserwowaną zmienną losową) cel: chcemy wnioskować o prawdziwości tej hipotezy na podstawie zaobserwowanych wartości zmiennej losowej

Przykłady hipotez statystycznych X 1, X 2,..., X n są próbą z rozkładu wykładniczego X 1, X 2,..., X n są próbą z rozkładu normalnego (to zakładamy) z param (5, 1) EX i = 7 (wartość oczekiwana rozkładu to 7) Var X i > 1 (wariancja rozkładu jest większa niż 1) X 1, X 2,..., X n są niezależne EX i =EY j (X 1, X 2,..., X n oraz Y 1, Y 2,..., Y m mają takie same wartości oczekiwane)

Typy hipotez hipotezy parametryczne: dotyczą parametrów rozkładu nieparametryczne: dotyczą innych własności/postaci rozkładu hipotezy proste: wyznaczają dokładnie jeden rozkład złożone: wyznaczają rodzinę rozkładów

Hipoteza zerowa i alternatywna Hipoteza zerowa: podstawowa, ozn. H 0 Hipoteza alternatywna: kontr-hipoteza hipoteza, jaką przyjmujemy w przypadku odrzucenia hipotezy zerowej, ozn. H 1 np.: H 0 : λ = 1, H 1 : λ 1 H 0 : λ = 1, H 1 : λ = 2 H 0 : λ = 1, H 1 : λ > 1

Hipoteza zerowa i alternatywna cd. Hipotezy zerowa i alternatywna nie są równoprawne. Hipoteza zerowa: stwierdzenie, wniosek z dotychczas obowiązującej teorii, przyjmowane za prawdziwe dopóki nie pojawią się obserwacje bardzo trudne do pogodzenia z tym przypuszczeniem. Albo spekulacja. Hipoteza alternatywna: możliwość brana pod uwagę, jeśli zmuszeni będziemy do odrzucenia hipotezy zerowej

Test statystyczny Procedura, która na podstawie konkretnych obserwacji (tj. dla każdej wartości obserwowanej zmiennej losowej) prowadzi do jednej z dwóch decyzji: odrzucić hipotezę zerową (na rzecz alternatywnej) nie odrzucać hipotezy zerowej odrzucamy H 0 nie ma podstaw do odrzucenia H 0

Test statystyczny formalnie Punkt wyjścia: model statystyczny X = (X 1, X 2,..., X n ) wektor obserwacji X X ~ P θ, {P θ : θ Θ} rodzina rozkładów Hipotezy H 0, H 1 : H 0 : θ Θ 0 H 1 : θ Θ 1 t. że Θ 0 Θ 1 = (hipotezy się wzajemnie wykluczają)

Test statystyczny formalnie cd. Test hipotezy H 0 przeciw H 1 : statystyka δ : X {0,1} wartość 1 interpretujemy jako decyzję o odrzuceniu H 0 (na rzecz H 1 ) zaś 0 jako nieodrzucenie H 0 Obszar (zbiór) krytyczny testu: K = {x X: δ (x) = 1} zbiór wyników, przy których odrzucamy H 0 ; Obszar (zbiór) afirmacji testu: A = {x X: δ (x) = 0} zbiór wyników, przy których nie odrzucamy H 0 K A= X, K A=

Test statystyczny formalnie cd. (2) Obszar krytyczny testu przeważnie ma postać K = {x X: T(x) > c} dla pewnej statystyki T (tzw. statystyki testowej) oraz liczby c (tzw. wartości krytycznej), odpowiednio dobranych Opisy testu statystycznego (równoważne): podanie T i c podanie K podanie δ często obszarem krytycznym testu nazywa się przedział wartości statystyki, a nie prowadzący do niego zakres wartości obserwacji

Test statystyczny przykład Sprawdzamy, czy moneta jest symetryczna Rzucamy tą monetą 400 razy X ~ B(400, p) H 0 : p = ½, H 1 : p ½ Jakie wyniki skłonią nas do odrzucenia H 0? X 200 < c nie odrzucamy H 0. X 200 c odrzucamy H 0 na rzecz H 1. tzn. T(x) = x 200 jakie powinno być c?

Błędy I-go i II-go rodzaju Z uwagi na losowość obserwacji, zawsze jest możliwość popełnienia błędu decyzja H 0 prawdziwa Stan faktyczny H 0 fałszywa odrzucić H 0 błąd I-go rodzaju OK nie odrzucać H 0 OK błąd II-go rodzaju P θ (K) dla θ Θ 0 p-stwo błędu I-go rodzaju P θ (A) dla θ Θ 1 p-stwo błędu II-go rodzaju jest trade-off między błędami I-go i II-go rodzaju... nie można ich minimalizować jednocześnie

Błędy I-go i II-go rodzaju: interpretacja graficzna (1) rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej θ = θ 0 θ = θ 1 c błąd I-go rodzaju błąd II-go rodzaju

Błędy I-go i II-go rodzaju: interpretacja graficzna (2) rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej θ = θ 0 θ = θ 1 c błąd I-go rodzaju błąd II-go rodzaju

Poziom istotności Test jest na poziomie istotności α, jeśli dla każdego θ Θ 0 mamy P θ (K) α. Zwykle: szukamy testów o możliwie najmniejszym p-stwie popełnienia błędu IIgo rodzaju dla ustalonego poziomu istotności α, zwykle = 0,1 lub 0,05 lub 0,01 Błąd I-go rodzaju zwykle ważniejszy nie tylko konserwatyzm.

Test statystyczny przykład cd. Wyznaczanie obszaru krytycznego Chcemy: poziom istotności α = 0,01 Tzn. szukamy c t. że (przy założeniu p= ½) P( X 200 > c) = 0,01 Z tw. de Moivre a Laplace a mamy P( X 200 > c) 2 Φ(-c/10), żeby = 0,01 to c 25,8 dla dużych n! Na poziomie istotności około 0,01 odrzucamy H 0 gdy liczba orłów mniejsza niż 175 lub większa niż 225 K = {0,1,...,174} {226, 227,..., 400}

Test statystyczny przykład cd. (2). p-value Nieco inne pytanie: co by było, gdyby liczba orłów była równa 220 (T = 20)? Mamy: P ½ ( X 200 > 20) 0,05 p-value: prawdopodobieństwo błędu I-go rodzaju, gdyby przyjąć za wartość krytyczną uzyskaną wartość statystyki testowej A zatem: p-value dla wartości statystki testowej T = 20 wynosi ok. 0,05

p-value p-value prawdopodobieństwo pojawienia się wartości obserwacji co najmniej tak samo ekstremalnych jak zaobserwowane (przeczących hipotezie zerowej nie mniej niż te zaobserwowane) decyzje: p-value < α odrzucamy hipotezę zerową p-value α nie ma podstaw do odrzucenia hipotezy zerowej

Test statystyczny przykład cd. (3) Wpływ wyboru hipotezy alternatywnej Dla innej hipotezy alternatywnej... Np. przegramy, jeśli na monecie będzie wypadał orzeł za często. H 0 : p = ½, H 1 : p > ½ Jakie wyniki skłonią nas do odrzucenia H 0? X 200 c nie odrzucamy H 0. X 200 > c odrzucamy H 0 na rzecz H 1. tzn. T(x) = x 200 H 0 mogłoby brzmieć p ½

Test statystyczny przykład cd. (4) Wpływ wyboru hipotezy alternatywnej Również z tw. de Moivre a Laplace a: P ½ (X 200 > c) 0,01 dla c 23,3, a zatem na poziomie istotności 0,01 odrzucamy H 0 : p = ½ na rzecz H 1 : p > ½ gdy liczba orłów jest równa co najmniej 224 A co gdy wypadnie 220 orłów? p-value wynosi ok. 0,025; nie odrzucamy H 0

Schemat przeprowadzania testu statystycznego 1. Określenie modelu statystycznego 2. Postawienie hipotezy zerowej H 0 i alternatywnej H 1 3. Wybór poziomu istotności α 4. Wybór statystyki testowej T / zdefiniowanie obszaru krytycznego K 5. Decyzja: zależna od tego, czy wartość statystyki testowej wpada do obszaru krytycznego (ew. z porównania p-value i α)

Moc testu (przy hipotezie alternatywnej) P θ (K) dla θ Θ 1 moc testu (przy hipotezie alternatywnej) Funkcja mocy testu: β : Θ 1 [0,1] t. że β (θ) = P θ (K) Zwykle: szukamy testów na zadanym poziomie istotności o jak największej mocy.

Test statystyczny przykład cd. (5) Moc testu Testujemy H 0 : p = ½ przeciw H 1 : p = ¾ testem: T(x) = X 200, K = {T(x) > 23,3} (tj. na poziomie istotności α = 0,01) Moc testu dla hipotezy alternatywnej: β (¾) = P(T(x) > 23,3 p = ¾) = P ¾ (X>223,3) 1-Φ((223,3-300)/5 3) Φ(8,85) 1 Ale gdy np. H 1 : p = 0,51 β (0,51) = P(T(x) > 23,3 p = 0,51) Φ(1,93) 0,973 A gdyby np. H 1 : p = ¼ to dla statystyki testowej T β (¼) = P(T(x) > 23,3 p = ¼) 1-Φ(14,23) 0

Moc testu: interpretacja graficzna (1) rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej θ = θ 0 θ = θ 1 moc testu dla hipotezy alternatywnej c błąd I-go rodzaju błąd II-go rodzaju

Moc testu: interpretacja graficzna (2) rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej θ = θ 1 θ = θ 0 moc testu dla hipotezy alternatywnej c błąd I-go rodzaju błąd II-go rodzaju

Czułość i swoistość Swoistość odsetek wyników prawdziwie ujemnych (gdy fałszywa H 0 ) Czułość odsetek wyników prawdziwie dodatnich (gdy prawdziwa H 0 ) zwł. w badaniach medycznych (H 0 to choroba)

Rozmiar testu czasem mówi się również o rozmiarze testu: supθ Θ 0 P θ (K) wówczas: poziom istotności = α jeśli rozmiar testu nie przekracza α. Czasem poszukuje się tzw. nieobciążonych testów: moc testu musi być co najmniej tak duża jak rozmiar testu.