Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Podobne dokumenty
Porównanie dwóch rozkładów normalnych

1 Estymacja przedziałowa

Porównanie wielu rozkładów normalnych

Estymacja parametrów rozkładu cechy

Weryfikacja hipotez statystycznych

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Statystyka matematyczna. Wykład VI. Zesty zgodności

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wydział Matematyki. Testy zgodności. Wykład 03

hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

1 Weryfikacja hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

1 Podstawy rachunku prawdopodobieństwa

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna dla leśników

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Wykład 7 Testowanie zgodności z rozkładem normalnym

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych cd.

Statystyka matematyczna

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wykład 12 Testowanie hipotez dla współczynnika korelacji

1.1 Wstęp Literatura... 1

Teoria Estymacji. Do Powyżej

Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Estymacja punktowa i przedziałowa

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

166 Wstęp do statystyki matematycznej

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Zadania ze statystyki, cz.6

Testowanie hipotez statystycznych.

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

Testowanie hipotez statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Hipotezy statystyczne

Testowanie hipotez statystycznych.

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyka matematyczna i ekonometria

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Statystyczna analiza danych

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Statystyka matematyczna. w zastosowaniach

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Wykład 11 Testowanie jednorodności

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Prawdopodobieństwo i statystyka r.

Transkrypt:

Badanie zgodności z określonym rozkładem H 0 : Cecha X ma rozkład F F jest dowolnym rozkładem prawdopodobieństwa Test chi kwadrat zgodności F jest rozkładem ciągłym Test Kołmogorowa F jest rozkładem normalnym Test Shapiro Wilka W Z Statystyka 9.1

Test Chi kwadrat zgodności (poziom istotności α) Statystyka testowa Klasa Liczebność 1 n 1 2 n 2.. k n k χ 2 emp = k i=1 (n i n t i )2 n t i n t i = Np t i, N = k n i, i=1 p t i = P F {X przyjęła wartość z klasy i} Wartość krytyczna χ 2 (α; k u 1) (u jest liczbą nieznanych parametrów hipotetycznego rozkładu F ) Wniosek. Jeżeli χ 2 emp > χ 2 (α; k u 1), to hipotezę H 0 odrzucamy W Z Statystyka 9.2

Przykład. Pracodawca przypuszcza, że liczba pracowników nieobecnych w różne dni tygodnia nie jest taka sama. W tym celu w ciągu pewengo okresu czasu zebrał następujące dane Dzień n i Poniedziałek 200 Wtorek 160 Środa 140 Czwartek 140 Piątek 100 Populacja: Cecha X: dzień nieobecności pracownika Założenie: cecha przyjmuje wartości będące nazwami dni tygodnia (cecha jakościowa) W Z Statystyka 9.3

Formalizacja: Liczbę pracowników nieobecnych w kolejne dni tygodnia można przedstawić jako odesetek załogi. Odsetki te można interpretować jako prawdopodobieństwo nieobecności pracownika w danym dniu tygodnia. Jeżeli ilość pracowników nieobecnych w kolejne dni tygodnia jest mniej więcej taka sama, to można ten fakt sformalizować jako identyczne prawdopodobieństwo nieobecności pracownika w poszczególne dni tygodnia. Tak więc, weryfikowana będzie hipoteza H 0 : X ma rozkład Pon Wtk Śro Czw Ptk 1/5 1/5 1/5 1/5 1/5 Technika statystyczna: test chi kwadrat zgodności poziom istotności α = 0.05 W Z Statystyka 9.4

Obliczenia Dzień n i p t i n t i (n i n t i )2 /n t i Poniedziałek 200 1/5 148 Wtorek 160 1/5 148 Środa 140 1/5 148 Czwartek 140 1/5 148 Piątek 100 1/5 148 (200 148) 2 148 =18.270 (160 148) 2 148 = 0.973 (140 148) 2 148 = 0.432 (140 148) 2 148 = 0.432 (100 148) 2 148 =15.676 740 χ 2 emp =35.676 Wartość krytyczna χ 2 (α; k u 1) = χ 2 (0.05; 5 0 1) = 9.4877 Odpowiedź: hipotezę odrzucamy Wniosek: Odrzucamy hipotezę o równomiernym rozkładzie nieobecności w tygodniu. Zatem przypuszczenie pracodawcy można uznać za uzasadnione W Z Statystyka 9.5

Przykład. Na pewnej uczelni badano strukturę miesięcznych dochodów (na głowę) w rodzinach studentów. W tym celu wylosowano grupę 192 studentów i zanotowano miesięczne dochody w ich rodzinach. Uzyskano następujące wyniki (w setkach złotych): x i x i+1 n i poniżej 6 6 6 7 11 7 8 18 8 9 27 9 10 32 10 11 35 11 12 24 12 13 20 13 14 13 powyżej 14 6 Czy można, że rozkładów dochodów w rodzinach studenckich jest normalny? W Z Statystyka 9.6

Populacja: studenci pewnej uczelni Cecha X: miesięczne dochody na głowę w rodzinach studentów Założenie: cecha ciągła Formalizacja: H 0 : Cecha X ma rozkład normalny N(µ, σ 2 ) Technika statystyczna: test chi kwadrat zgodności poziom istotności α = 0.05 Obliczenia Szereg ma k = 10 klas Do całkowitego określenia hipotetycznego rozkładu brakuje dwóch parametrów, czyli u = 2 Wartość krytyczna χ 2 (α; k u 1) = χ 2 (0.05; 10 2 1) = 14.0671 W Z Statystyka 9.7

Wyznaczenie wartości statystyki χ 2 emp Wyznaczenie prawdopodobieństw teoretycznych p t i =P {x i <X <x i+1 }=F ( ) ( ) xi+1 µ xi µ F σ σ Z próby wyznaczamy x = 10.09, s 2 = 4.81 p t i = F ( xi+1 x s ) F ( ) xi x s = F (z i+1 ) F (z i ) x i x i+1 z i z i+1 F (z i ) F (z i+1 ) p t i poniżej 6 1.82 0.0000 0.0344 0.0344 6 7 1.82 1.36 0.0344 0.0869 0.0525 7 8 1.36 0.91 0.0869 0.1814 0.0943 8 9 0.91 0.45 0.1814 0.3264 0.1450 9 10 0.45 0.00 0.3264 0.5000 0.1736 10 11 0.00 0.45 0.5000 0.6736 0.1736 11 12 0.45 0.91 0.6736 0.8186 0.1450 12 13 0.91 1.36 0.8186 0.9131 0.0943 13 14 1.36 1.82 0.9131 0.9656 0.0525 powyżej 14 1.82 0.9656 1.0000 0.0344 W Z Statystyka 9.8

Wyznaczenie wartości statystyki testowej x i x i+1 n i p t i n t i (n i n t i )2 /n t i poniżej 6 6 0.0344 6.53 0.36 6 7 11 0.0525 10.18 0.07 7 8 18 0.0943 18.05 0.00 8 9 27 0.1450 27.84 0.02 9 10 32 0.1736 33.41 0.06 10 11 35 0.1736 33.41 0.08 11 12 24 0.1450 27.84 0.53 12 13 20 0.0943 18.05 0.21 13 14 13 0.0525 10.18 0.78 powyżej 14 6 0.0344 6.53 0.03 192 2.14 Odpowiedź. Nie odrzucamy hipotezy Wniosek. Możemy uznać, że miesięczne dochody na głowę w rodzinach studentów mają rozkład normalny N(10.09, 4.81) W Z Statystyka 9.9

H 0 : Cecha X ma rozkład ciągły F Test Kołmogorowa zgodności (poziom istotności α) Próba X 1,..., X n Próbę X 1,..., X n porządkujemy niemalejąco X (1) X (2) X (n) Tak uporządkowane obserwacje nazywamy statystykami pozycyjnymi Statystyka testowa D n = max {max{ F (X (i)) i 1 1 i n n, i n F (X (i)) }} Wartość krytyczna testu Kołmogorowa D(α; n) Jeżeli D n > D(α; n), to hipotezę H 0 odrzucamy W Z Statystyka 9.10

Przykład. Obserwujemy cechę X H 0 : X ma rozkład jednostajny na przedziale (0, 1) Test Kołmogorowa zgodności (α = 0.05) Dystrybuanta rozkładu jednostajnego F (x) = { 0, jeżeli x 0, x, jeżeli 0 < x 1, 1, jeżeli x 1. Próba: 0.62799, 0.06409, 0.70428, 0.98945, 0.59274, 0.49986, 0.31380, 0.02692, 0.63097, 0.95539, 0.84967, 0.86341, 0.80649, 0.73106, 0.99956, 0.86344, 0.00744, 0.28036, 0.66399, 0.21092. Wartość statystyki testowej D 20 = 0.24274 Wartość krytyczna D(0.05; 20) = 0.29408 Ponieważ D 20 < D 0.05,20, więc nie odrzucamy weryfikowanej hipotezy W Z Statystyka 9.11

Wyznaczenie wartości statystyki testowej i F (X (i) ) i/n (i 1)/n F (X (i) i/n F (X (i) (i 1)/n 1 0.00744 0.05 0.00 0.04256 0.00744 2 0.02692 0.10 0.05 0.07308 0.02308 3 0.06409 0.15 0.10 0.08591 0.03591 4 0.21092 0.20 0.15 0.01092 0.06092 5 0.28036 0.25 0.20 0.03036 0.08036 6 0.31380 0.30 0.25 0.01380 0.06380 7 0.49986 0.35 0.30 0.14986 0.19986 8 0.59274 0.40 0.35 0.19274 0.24274 9 0.62799 0.45 0.40 0.17799 0.22799 10 0.63097 0.50 0.45 0.13097 0.18097 11 0.66399 0.55 0.50 0.11399 0.16399 12 0.70428 0.60 0.55 0.10428 0.15428 13 0.73106 0.65 0.60 0.08106 0.13106 14 0.80649 0.70 0.65 0.10649 0.15649 15 0.84967 0.75 0.70 0.09967 0.14967 16 0.86341 0.80 0.75 0.06341 0.11341 17 0.86344 0.85 0.80 0.01344 0.06344 18 0.95539 0.90 0.85 0.05539 0.10539 19 0.98945 0.95 0.90 0.03945 0.08945 20 0.99956 1.00 0.95 0.00044 0.04956 W Z Statystyka 9.12

H 0 : Cecha X ma rozkład normalny Test Shapiro Wilka (poziom istotności α) Próbę X 1,..., X n porządkujemy niemalejąco X (1) X (2) X (n) Tak uporządkowane obserwacje nazywamy statystykami pozycyjnymi Statystyka testowa W = ( [n/2] i=1 a i:n (X (n i+1) X (i) ) ) 2 varx a i:n są stablicowanymi współczynnikami [n/2] = { n/2, dla n parzystych (n 1)/2, dla n nieparzystych Wartość krytyczna testu Shapiro Wilka W n (α) Jeżeli W W n (α), to hipotezę H 0 odrzucamy. W Z Statystyka 9.13

Przykład. Z cechy X pobrano próbę (n = 19): 12.4, 14.2, 14.9, 15.6, 16.1, 17.3, 17.9, 18.2, 18.6, 19.3, 19.7, 20.4, 21.9, 22.8, 23.7, 25.2, 25.9, 27.4. H 0 : Cecha X ma rozkład normalny Test Shapiro Wilka (α = 0.05) Licznik statystyki W x = 19.3842, varx = 730.57 i x (19 i+1) x (i) a i:19 a i:19 (x (19 i+1) x (i) ) 1 27.4 12.4=15.0 0.4808 7.21200 2 25.9 14.2=11.7 0.3232 3.78144 3 25.2 14.9=10.3 0.2561 2.63783 4 23.7 15.6= 8.1 0.2059 1.66779 5 22.8 16.1= 6.7 0.1641 1.09947 6 21.9 16.8= 5.1 0.1271 0.64821 7 20.4 17.3= 3.1 0.0932 0.28892 8 19.7 17.9= 1.8 0.0612 0.11016 9 19.3 18.2= 1.1 0.0303 0.03333 17.47915 Statystyka testowa W = 305.52 730.57 = 0.418 Wartość krytyczna W 19 (0.05) = 0.901 Ponieważ W < W 19 (0.05), więc hipotezę odrzucamy W Z Statystyka 9.14