Prawdopodobieństwo i statystyka

Podobne dokumenty
Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

STATYSTYKA

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych

Hipotezy statystyczne

Hipotezy statystyczne

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych.

Testowanie hipotez cz. I

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka Matematyczna Anna Janicka

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

166 Wstęp do statystyki matematycznej

Testowanie hipotez statystycznych.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych cd.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych

Wydział Matematyki. Testy zgodności. Wykład 03

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Na podstawie dokonanych obserwacji:

Statystyka matematyczna

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka matematyczna i ekonometria

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Weryfikacja hipotez statystycznych

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Prawdopodobieństwo i statystyka r.

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Podsadny þ jest winien. róúzne. W prawodawstwie wielu krajów przyjmuje sie, þ úze pierwszy bład þ jest bardziej dotkliwy - sady þ skazujaþ

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Własności statystyczne regresji liniowej. Wykład 4

Statystyka matematyczna i ekonometria

Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testowanie hipotez statystycznych

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Prawdopodobieństwo i statystyka

Wykład 7 Testowanie zgodności z rozkładem normalnym

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wykład 9 Wnioskowanie o średnich

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyczna analiza danych

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Wykład 3 Hipotezy statystyczne

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Prawdopodobieństwo i rozkład normalny cd.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Weryfikacja hipotez statystycznych testy t Studenta

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Testowanie hipotez statystycznych.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Elementy statystyki STA - Wykład 5

Transkrypt:

Wykład XI: Testowanie hipotez statystycznych 12 stycznia 2015

Przykład Motywacja X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, δ 2 ). Chcemy sprawdzić, czy µ = ν i σ 2 = δ 2, czyli że w obu populacjach badana cecha ma ten sam rozkład. Nie interesują nas konkretne wartości parametrów, a jedynie ich identyczność! Jednak prawdopodobieństwo, że X N = ȲM oraz S 2,X N = S 2,Y M wynosi zero. Dane empiryczne na ogół sugerują więc, że rozkłady są różne. Pytanie: jak zweryfikować empirycznie hipotezę wobec hipotezy alternatywnej H 0 : µ = ν, σ 2 = δ 2 H 1 : µ ν lub σ 2 δ 2.

Niech będzie dany model statystyczny (X, B, {P θ } θ Θ ). Hipoteza: niepusty podzbiór H 0 Θ. Hipoteza prosta: podzbiór jednoelementowy H 0 = {θ 0 } Θ. Hipoteza złożona: podzbiór wieloelementowy Θ. Hipoteza alternatywna wobec hipotezy H 0 : podzbiór H 1 Θ \ H 0. Test hipotezy H 0 wobec hipotezy alternatywnej H 1 : statystyka φ : (X, B) [0, 1], na podstawie której podejmujemy następujące decyzje: przyjmujemy hipotezę H 0 gdy φ(x) = 0, odrzucamy hipotezę H 0 na rzecz H 1, gdy φ(x) = 1. Dla wartości φ(x) (0, 1) możemy określić dalsze procedury, np. randomizację.

Przykład: Jak konstruować test? X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, σ 2 ). σ 2 - znane! X N ȲM N (µ ν, σ 2 (1/N + 1/M)). Ustalmy poziom istotności α (0, 1) (bliski zeru, np. 0,01). Rozważmy obszar krytyczny K = { X N Ȳ M > σ 1 N + 1 M Φ 1( 1 α ) }. 2 Jeżeli µ = ν (hipoteza H 0!), to P µ,ν (K) = α. Jeżeli µ ν (hipoteza H 1!), to P µ,ν (K c ) jest małe dla dużych N i M. W pełni intuicyjny jest więc test { 0, jeśli x K c, φ(x) = 1, jeśli x K.

Porównywanie średnich - cd. A jak porównywać średnie, gdy nie znamy wariancji? Założenie: wariancje w obu populacjach są te same. Rozważmy statystykę: X N ȲM Nj=1 (X j X N ) 2 + M k=1 (Y k ȲM) 2 MN(M + N 2). M + N Prz założeniu µ = ν, ma ona rozkład t-studenta o M + N 2 stopniach swobody. Rozkładem t-studenta o k stopniach swobody nazywamy rozkład zmiennej losowej T = Z 0 Z 2 1 + Z 2 2 +... Z 2 k k, gdzie Z 0, Z 1,... Z k są niezależne o rozkładzie N (0, 1).

Jeżeli test φ przyjmuje tylko wartości 0 i 1 (test niezrandomizowany), to zbiór K φ = {x X : φ(x) = 1} nazywamy zbiorem (lub obszarem) krytycznym testu. Mówimy, że test φ hipotezy H 0 ma poziom istotności α (0, 1), jeśli E θ φ α, θ H 0. Jeżeli test φ hipotezy H 0 jest niezrandomizowany, to E θ φ = P θ (K φ ) jest prawdopodobieństwem (względem P θ ) odrzucenia hipotezy H 0, a poziom istotności testu narzuca pułap dla prawdopodobieństwa błędu pierwszego rodzaju, tzn. odrzucenia hipotezy H 0, gdy jest ona prawdziwa. W praktyce α = 0, 01 lub 0, 05.

Niech φ będzie testem hipotezy H 0 wobec hipotezy alternatywnej H 1. Funkcja H 1 θ 1 E θ φ określa prawdopodobieństwo błędu drugiego rodzaju, tj. nieodrzucenia hipotezy H 0, gdy jest ona fałszywa (gdy zachodzi hipoteza alternatywna H 1 ). Funkcję H 1 θ E θ φ nazywamy mocą testu φ (lub funkcją mocy testu).

Niech φ i ψ będą testami na poziomie istotności α. Mówimy, że test φ jest równie mocny co test ψ, jeśli dla każdego θ H 1 E θ φ E θ ψ. Test φ jest mocniejszy niż test ψ, gdy jest równie mocny co ψ i ponadto dla pewnego θ 1 H 1 E θ1 φ > E θ1 ψ. Test φ hipotezy H 0, na poziomie istotności α, wobec hipotezy H 1, jest jednostajnie najmocniejszy, gdy jest równie mocny co wszystkie inne testy na poziomie istotności α.

Lemat Neymana-Pearsona Przykład Konkluzje Podstawowy lemat Neymana-Pearsona Twierdzenie (zwane Lematem Neymana-Pearsona) Niech P 0 i P 1 będą rozkładami prawdopodobieństwa na (X, B), zadawanymi przez gęstości prawdopodobieństwa p 0 (x) i p 1 (x) względem pewnej miary µ na (X, B). Ustalmy α (0, 1). Istnieje test hipotezy prostej H 0 = {P 0 } wobec prostej hipotezy alternatywnej H 1 = {P 1 }, który jest jednostajnie najmocniejszy na poziomie istotności α. Każdy test φ hipotezy H 0 wobec H 1, który jest jednostajnie najmocniejszy na poziomie istotności α, spełnia dla pewnego t warunek { 1, gdy p1 (x) > tp 0 (x), φ(x) = 0, gdy p 1 (x) < tp 0 (x).

Lemat Neymana-Pearsona Przykład Konkluzje Przykład (za R. Zielińskim Siedem wykładów... ) Niech X = N. Rozważmy hipotezę prostą H 0 = {B(10; 0, 1)} (rozkład dwumianowy: liczba sukcesów 10, p-stwo sukcesu 0, 01) przeciw hipotezie prostej H 1 = {Po(1)} (rozkład Poissona z parametrem 1). x B(10; 0, 1) Po(1) Po(1) B(10;0,1) 0 0,3468 0, 36788 1,05506 1 0,38742 0,36788 0,94956 2 0,19371 0,18394 0,94956 3 0,05739 0,06131 1,06830 4 0,01116 0,01533 1,37366 5 0,00149 0,00307 2,06040 6 0,00014 0,00051 3,64286 7 0,00001 0,00007 7,0000 8 0,00000 0,00001 +

Lemat Neymana-Pearsona Przykład Konkluzje Przykład (za R. Zielińskim Siedem wykładów... ) - cd. obszar krytyczny K P H0 (K) P H1 (K) {x : x 8} 0,00000 0,00001 {x : x 7} 0,00001 0,00008 {x : x 6} 0,00015 0,00059 {x : x 5} 0,00164 0,00366 {x : x 4} 0,01280 0,01899 {x : x 3} 0,07019 0,08030 Test niezrandomizowany na poziomie istotności α = 0, 05: { 1, gdy x 4 φ(x) = 0, gdy x < 4. Rozmiar testu E PH0 φ = P H0 {x : x 4} = 0, 01280.

Lemat Neymana-Pearsona Przykład Konkluzje Przykład (za R. Zielińskim Siedem wykładów... ) - cd. Jeśli γ = 0, 6482, to P H0 {x : x 4} + γp H0 {x : x = 3} = 0, 05. Test zrandomizowany na poziomie istotności α = 0, 05 1, gdy x 4 φ(x) = 0, 6482 gdy x = 3 0, gdy x 2. ma również rozmiar 0, 05. Jaka jest moc tego testu? Tylko 0, 05873! Interpretacja: prawdopodobieństwo nieodrzucenia weryfikowanej hipotezy H 0 = {B(10; 0, 1)}, gdy prawdziwa jest hipoteza alternatywna H 1 = {Po(1)}, wynosi 0,94127.

Konkluzje Motywacja Lemat Neymana-Pearsona Przykład Konkluzje W przypadku hipotez złożonych teorię Neymana-Pearsona można przenieść na tzw. modele z monotonicznym ilorazem wiarogodności. Teoria porównywania testów ma ograniczone znaczenie praktyczne. Mimo braku ogólnych rozstrzygnięć, poziom istotności i moc testu są ważnymi parametrami oceny jakości testu.