Testowanie hipotez statystycznych.

Podobne dokumenty
Testowanie hipotez statystycznych.

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Wykład 7 Testowanie zgodności z rozkładem normalnym

Testowanie hipotez statystycznych.

Centralne twierdzenie graniczne

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Weryfikacja hipotez statystycznych

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Kolokwium ze statystyki matematycznej

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład 10 Testy jednorodności rozkładów

Hipotezy statystyczne

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka matematyczna. Wykład VI. Zesty zgodności

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Estymacja parametrów w modelu normalnym

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Hipotezy statystyczne

1 Estymacja przedziałowa

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Prawdopodobieństwo i statystyka

Wykład 12 Testowanie hipotez dla współczynnika korelacji

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Własności statystyczne regresji liniowej. Wykład 4

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Estymacja parametrów rozkładu cechy

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Metody Statystyczne. Metody Statystyczne.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyczna analiza danych

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Wydział Matematyki. Testy zgodności. Wykład 03

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Testowanie hipotez statystycznych

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka w analizie i planowaniu eksperymentu

Wykład 9 Testy rangowe w problemie dwóch prób

Dokładne i graniczne rozkłady statystyk z próby

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Metody probabilistyczne

Prawdopodobieństwo i statystyka

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Statystyka w analizie i planowaniu eksperymentu

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Statystyka w analizie i planowaniu eksperymentu

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Wykład 9 Wnioskowanie o średnich

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych. Wprowadzenie

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka matematyczna i ekonometria

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Transkrypt:

Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011

Temat. Weryfikacja hipotez statystycznych dotyczących proporcji.

Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio p = P(X 1 = 1) i q = 1 p = P(X 1 = 0), oraz X = 1 n n X i. i=1

Centralne Twierdzenie Graniczne Niech X 1, X 2,..., X n będzie prostą próbą losową z rozkładu o średniej µ i skończonej wariancji σ 2. Wówczas dla dużych liczności próby n rozkład standaryzowanej średniej próbkowej X µ σ n, jest bliski rozkładowi zmiennej losowej Z o standardowym rozkładzie normalnym N(0, 1).

Centralne Twierdzenie Graniczne Centralne Twierdzenie Graniczne Niech X 1, X 2,..., X n będzie prostą próbą losową z rozkładu o średniej µ i i skończonej wariancji σ 2. Wtedy dla dowolnych liczb rzeczywistych a i b gdy n dąży do nieskończoności to ( P a X ) µ σ n b Φ(b) Φ(a), gdzie Φ(x). Rozkład X jest w przybliżeniu równy rozkładowi N(µ, σ/ n).

Centralne Twierdzenie Graniczne Centralne Twierdzenie Graniczne Niech X 1, X 2,..., X n będzie prostą próbą losową z rozkładu o średniej µ i i skończonej wariancji σ 2. Wtedy dla dowolnych liczb rzeczywistych a i b gdy n dąży do nieskończoności to ( P a X ) µ σ n b Φ(b) Φ(a), gdzie Φ(x). Rozkład X jest w przybliżeniu równy rozkładowi N(µ, σ/ n).

Centralne Twierdzenie Graniczne Centralne Twierdzenie Graniczne Niech X 1, X 2,..., X n będzie prostą próbą losową z rozkładu o średniej µ i i skończonej wariancji σ 2. Wtedy dla dowolnych liczb rzeczywistych a i b gdy n dąży do nieskończoności to ( P a X ) µ σ n b Φ(b) Φ(a), gdzie Φ(x). Rozkład X jest w przybliżeniu równy rozkładowi N(µ, σ/ n).

Centralne Twierdzenie Graniczne W przypadku próby prostej z rozkładu 0-1 z prawdopodobieństwem sukcesu równym p centralne twierdzenie graniczne przyjmuje następującą postać Twierdzenie Moivre a-laplace a Dla dowolnych liczb rzeczywistych a i b zachodzi zbieżność P a X n p b Φ(b) Φ(a), p(1 p) n gdy n dąży do nieskończoności.

Centralne Twierdzenie Graniczne Przy konstrukcji statystyki testowej nie znamy wartości wariancji zastępujemy ją estymatorem X n (1 X n ). Okazuje się, że po takiej modyfikacji centralne twierdzenie graniczne nadal jest prawdziwe. Twierdzenie. Dla dowolnych liczb rzeczywistych a i b zachodzi zbieżność P a X n p Xn(1 X n) n b Φ(b) Φ(a), gdy n dąży do nieskończoności.

Uwaga praktyczna. W praktyce możemy korzystać z aproksymacji rozkładem normalnym gdy spełnione są jednocześnie nierówności n X n 5 oraz n(1 X n ) 5.

Test dla proporcji. Testujemy hipotezę H 0 : p = p 0 przeciwko jednej z następujących hipotez alternatywnych H 1 : p < p 0, H 2 : p > p 0, H 3 : p p 0.

Test dla proporcji. Testujemy hipotezę H 0 : p = p 0 przeciwko jednej z następujących hipotez alternatywnych H 1 : p < p 0, H 2 : p > p 0, H 3 : p p 0.

Test dla proporcji. Testujemy hipotezę H 0 : p = p 0 przeciwko jednej z następujących hipotez alternatywnych H 1 : p < p 0, H 2 : p > p 0, H 3 : p p 0.

Statystyka testowa. Przy założeniu hipotezy zerowej statystyka Xn(1 X n) n Z = X n p 0 ma w przybliżeniu rozkład normalny i zagadnienie testowania hipotezy zerowej przeciwko jednej z wymienionych hipotez alternatywnych sprowadza się do testowania hipotezy dotyczącej wartości oczekiwanej rozkładu normalnego.,

Statystyka testowa. Przy założeniu hipotezy zerowej statystyka Xn(1 X n) n Z = X n p 0 ma w przybliżeniu rozkład normalny i zagadnienie testowania hipotezy zerowej przeciwko jednej z wymienionych hipotez alternatywnych sprowadza się do testowania hipotezy dotyczącej wartości oczekiwanej rozkładu normalnego.,

Statystyka testowa. Przy założeniu hipotezy zerowej statystyka Xn(1 X n) n Z = X n p 0 ma w przybliżeniu rozkład normalny i zagadnienie testowania hipotezy zerowej przeciwko jednej z wymienionych hipotez alternatywnych sprowadza się do testowania hipotezy dotyczącej wartości oczekiwanej rozkładu normalnego.,

Przykład. Z partii zakupionych odczynników losujemy próbkę liczebności n = 500 i sprawdzamy ich czystość. Okazało się, że 20 z nich było zanieczyszczonych. Chcemy sprawdzić zapewnienie producenta, że tylko przeciętnie 1 na 100 odczynników może być zanieczyszczonych. W tym celu obliczamy statystykę X n(1 X n) n Z = X n p 0. W naszym przypadku X n = 0, 04 oraz p 0 = 0, 01 tak więc z = 0, 04 0, 01 0,04(1 0,04) 500 = 6, 742.

Przykład. Z partii zakupionych odczynników losujemy próbkę liczebności n = 500 i sprawdzamy ich czystość. Okazało się, że 20 z nich było zanieczyszczonych. Chcemy sprawdzić zapewnienie producenta, że tylko przeciętnie 1 na 100 odczynników może być zanieczyszczonych. W tym celu obliczamy statystykę X n(1 X n) n Z = X n p 0. W naszym przypadku X n = 0, 04 oraz p 0 = 0, 01 tak więc z = 0, 04 0, 01 0,04(1 0,04) 500 = 6, 742.

Przykład. Z partii zakupionych odczynników losujemy próbkę liczebności n = 500 i sprawdzamy ich czystość. Okazało się, że 20 z nich było zanieczyszczonych. Chcemy sprawdzić zapewnienie producenta, że tylko przeciętnie 1 na 100 odczynników może być zanieczyszczonych. W tym celu obliczamy statystykę X n(1 X n) n Z = X n p 0. W naszym przypadku X n = 0, 04 oraz p 0 = 0, 01 tak więc z = 0, 04 0, 01 0,04(1 0,04) 500 = 6, 742.

Przykład. Z partii zakupionych odczynników losujemy próbkę liczebności n = 500 i sprawdzamy ich czystość. Okazało się, że 20 z nich było zanieczyszczonych. Chcemy sprawdzić zapewnienie producenta, że tylko przeciętnie 1 na 100 odczynników może być zanieczyszczonych. W tym celu obliczamy statystykę X n(1 X n) n Z = X n p 0. W naszym przypadku X n = 0, 04 oraz p 0 = 0, 01 tak więc z = 0, 04 0, 01 0,04(1 0,04) 500 = 6, 742.

Przykład. Z partii zakupionych odczynników losujemy próbkę liczebności n = 500 i sprawdzamy ich czystość. Okazało się, że 20 z nich było zanieczyszczonych. Chcemy sprawdzić zapewnienie producenta, że tylko przeciętnie 1 na 100 odczynników może być zanieczyszczonych. W tym celu obliczamy statystykę X n(1 X n) n Z = X n p 0. W naszym przypadku X n = 0, 04 oraz p 0 = 0, 01 tak więc z = 0, 04 0, 01 0,04(1 0,04) 500 = 6, 742.

Przykład cd. Ponieważ z α/2 = z 0,025 = 1, 96 więc na poziomie istotności α = 0, 05 sprawdzaną hipotezę zerową odrzucamy na korzyść dwustronnej hipotezy alternatywnej H 1 : p p 0.

Zagadnienie dwóch prób W przypadku gdy na podstwie dwóch prób X (a) 1, X (a) (a) 2,..., X n a oraz X (b) 1, X (b) 2,..., X n (b) b, chcemy przetestować hipotezę o równości dwóch proporcji H 0 : p a = p b, możemy postąpić w podoby sposób jak w przypadku jednej próby i skorzystać z aproksymacji odpowiednich średnich próbkowych rozkładami normalnymi.

Jako statystyki testowej możemy użyć następujacej statystyki Z = X (a+b) n X (a) n ( 1 X n (b) ) ( ) 1 + 1 na nb X (a+b) n gdzie X (a+b) n = n a X (a) n b i + i=1 i=1 X (b) i, która przy załozeniu hipotezy zerowej H 0 ma w przybliżeniu rozkład normalny N(0, 1).

Testowanie zgodności z rozkładem normalnym. Wykres kwantylowy Wykreślamy na płaszczyźnie punkty, dla których współrzędna są równe kwantylom teoretycznym rozkładu normalnego i kwantylom empirycznym wyliczonym na podstawie danych. Na osi OY odkładamy kolejne kwantyle rzędu k n, k = 1, 2,..., n 1 rozkładu normalnego, a na osi OX otrzymane na podstwie danych kwantyle empiryczne rzędu k n. Przy założeniu, że dane pochodzą z rozkładu normalnego otrzymamy punkty leżące w przybliżeniu na linii prostej.

Testowanie zgodności z rozkładem normalnym. Wykres kwantylowy Wykreślamy na płaszczyźnie punkty, dla których współrzędna są równe kwantylom teoretycznym rozkładu normalnego i kwantylom empirycznym wyliczonym na podstawie danych. Na osi OY odkładamy kolejne kwantyle rzędu k n, k = 1, 2,..., n 1 rozkładu normalnego, a na osi OX otrzymane na podstwie danych kwantyle empiryczne rzędu k n. Przy założeniu, że dane pochodzą z rozkładu normalnego otrzymamy punkty leżące w przybliżeniu na linii prostej.

Testowanie zgodności z rozkładem normalnym. Wykres kwantylowy Wykreślamy na płaszczyźnie punkty, dla których współrzędna są równe kwantylom teoretycznym rozkładu normalnego i kwantylom empirycznym wyliczonym na podstawie danych. Na osi OY odkładamy kolejne kwantyle rzędu k n, k = 1, 2,..., n 1 rozkładu normalnego, a na osi OX otrzymane na podstwie danych kwantyle empiryczne rzędu k n. Przy założeniu, że dane pochodzą z rozkładu normalnego otrzymamy punkty leżące w przybliżeniu na linii prostej.

Histogram dla danych normalnych. 100 80 60 40 20 4 3 2 1 0 1 2 3 4

Wykres kwantylowo-kwantylowy. Probability 0.999 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 0.001 Normal Probability Plot 4 3 2 1 0 1 2 3 Data

Histogram dla danych wykładniczych. 250 200 150 100 50 0 1 2 3 4 5 6 7 8

Wykres kwantylowo-kwantylowy. Probability 0.999 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 0.001 Normal Probability Plot 0 1 2 3 4 5 6 7 Data

Histogram dla danych z rozkładu beta. 200 150 100 50 0 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Wykres kwantylowo-kwantylowy. Probability 0.999 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 Normal Probability Plot 0.10 0.05 0.02 0.01 0.003 0.001 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Data

Histogram dla danych z rozkładu dwumodalnego. 250 200 150 100 50 0 1 2 3 4

Wykres kwantylowo-kwantylowy. Probability 0.999 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 0.001 Normal Probability Plot 0 1 2 3 4 5 6 7 Data