Elementarne metody statystyczne 9

Podobne dokumenty
Wykład 11 Testowanie jednorodności

Wykład 8 Dane kategoryczne

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Badania eksperymentalne

Wykład 10 Testy jednorodności rozkładów

Testowanie hipotez statystycznych.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wykład 9 Testy rangowe w problemie dwóch prób

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Testowanie hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Wykład 12 Testowanie hipotez dla współczynnika korelacji

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Przykład 1. (A. Łomnicki)

Test t-studenta dla jednej średniej

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyczna analiza danych

Statystyka matematyczna Test χ 2. Wrocław, r

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

STATYSTYKA MATEMATYCZNA

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Wydział Matematyki. Testy zgodności. Wykład 03

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testy nieparametryczne

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

166 Wstęp do statystyki matematycznej

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna dla leśników

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa dwuwymiarowa i korelacja

1 Estymacja przedziałowa

Porównanie dwóch rozkładów normalnych

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Teoria Estymacji. Do Powyżej

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Elementy statystyki STA - Wykład 5

Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zadania ze statystyki cz.8. Zadanie 1.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA, LISTA 3

Ćwiczenia 7. Badanie istotności róŝnic część II.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

STATYSTYKA MATEMATYCZNA

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Kolokwium ze statystyki matematycznej

Ekonometria. Zajęcia

Hipotezy statystyczne

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka matematyczna

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Hipotezy statystyczne

Testowanie hipotez statystycznych.

Transkrypt:

Elementarne metody statystyczne 9 Wybrane testy nieparametryczne - ciąg dalszy Test McNemary W teście takim dysponujemy próbami losowymi z dwóch populacji zależnych pewnej cechy X. Wyniki poszczególnych pomiarów określone są za pomocą jedynie dwóch kategorii, oznaczanych wartościami -1 i +1 (np. tak i nie ; poprawa, brak poprawy ). Weryfikacji podlega hipoteza H 0 o tym, że rozkład badanej cechy jest identyczny w obu populacjach, co w praktyce oznacza, że proporcja pomiędzy dwiema kategoriami cechy X jest jednakowa w obu próbach (np. zastosowanie nowego leku nie wpływa na poprawę stanu zdrowia pacjentów). Załóżmy, że w obu próbach losowych (P1 i P2) zaobserwowano następujące liczebności kategorii cechy X : Statystyka testowa jest następująca: χ 2 = P2 (+1) P2 (-1) P1 (+1) a b P1 (-1) c d (b c)2 b + c χ 2 1 przy n. H0 Obszar krytyczny ma następującą postać: K = (χ 2 1,1 α, ). Lepsze przybliżenie do rozkładu χ 2 uzyskuje się za pomocą statystyki: χ 2 0 = ( b c 1)2. b + c Test symetrii Bowkera Test ten stanowi uogólnienie testu McNemary na przypadek, gdy wartości cechy X są określone przez r > 2 kategorii. Testujemy następującą hipotezę: wobec alternatywy H 0 : p ij = p ji dla wszystkich par i, j = 1, 2,..., r, gdzie j > i H 0 : p ij p ji dla choć jednej pary i, j = 1, 2,..., r, gdzie j > i, przy czym p ij = P{X1 = x i X2 = x j } (X1 i X2 oznaczają wartości cechy X w 1. i 2. próbie). Wartość p ij jest więc prawdopodobieństwem pojawienia się w pary (x i, x j ). Statystyka testowa jest następująca: χ 2 = r j>i (N ij N ji ) 2 χ 2 r(r 1) N ij + N ji 2 przy n. Wartość N ij oznacza liczbę pojawień się obserwacji (x i, x j ) w próbie zależnej. Zbiór krytyczny testu ma postać: K = (χ 2 r(r 1) 2,1 α, ). Test Q Cochrana Uogólnieniem testu McNemary na przypadek k > 2 zależnych prób jest test Q Cochrana. Załóżmy, że mamy n obserwacji cechy X w k zależnych populacjach. Przyjmijmy, że cecha X opisywana jest dwiema wartościami: 0 i 1. Statystyka testowa jest następująca: Q = (k 1)(kC T )2 kt R 1 χ 2 k 1 przy n,

gdzie k ( n ) 2, C = C ij n ( k ) 2, R = C ij n k T = C ij, przy czym C ij oznacza wartość i tej obserwacji w j tej próbie (i = 1, 2,..., n; j = 1, 2,..., k). Zbiór krytyczny testu Q Cochrana ma postać: K = (χ 2 k 1,1 α, ). Test Friedmana Test Friedmana jest testem jednorodności rozkładów pewnej cechy X typu ciągłego w k 2 zależnych populacjach. Załóżmy, że k wymiarowa próba losowa liczy n elementów. Niech R (j) i oznacza rangę elementu x ij w uporządkowanym ciągu wartości x 1j, x 2j,..., x kj. Niech ponadto R i = n R (j) i. Statystyka testowa jest następująca: T = 12 nk(k + 1) k Ri 2 3n(k + 1) χ 2 k 1 przy n, zaś zbiór krytyczny testu ma postać K = (χ 2 k 1,1 α, ). Test zgodności rang Kendalla W teście tym badamy istotność korelacji między k zbiorami rang przyporządkowanych n obiektom, a więc np. badamy zgodność ocen k ekspertów (sędziów) przyporządkowujących rangi n kategoriom. Hipoteza zerowa oznacza brak korelacji między zbiorami rang. Niech R ij będzie rangą elementu x ij w uporządkowanym ciągu wartości x i1,..., x in (i = 1,..., k; j = 1,..., n). Niech R j = k R ij. Statystyką testową jest tzw. współczynnik zgodności (konkordancji) Kendalla, przyjmujący wartości z przedziału [0,1] i określony wzorem: gdzie Mamy także: W = 12S k 2 n(n 2 1), n S = Rj 2 1 ( n ) 2. R j n χ 2 = k(n 1)W χ 2 n 1 przy n. Zbior krytyczny testu ma postać: K = (χ 2 n 1,1 α, ). 1. Badaniu statystycznemu poddano poparcie jednego z kandydatów wobec zbliżających się wyborów. Dane zebrano u 250 ankietowanych osób przed rozpoczęciem kampanii i w ostatnim jej dniu. Wyniki były następujące: Po - tak Po - nie Przed - tak 72 65 Przed - nie 53 60 Na poziomie istotności α = 0.05 zweryfikuj hipotezę o braku wpływu kampanii wyborczej na poparcie kandydata. Wykorzystaj test McNemary. 2

2. Badaniu poddano pracowników pewnej firmy pod względem spełnianych norm wydajności pracy. Dane zebrano przed i po szkoleniu. Były one następujące: Po - tak Po - nie Przed - tak 120 6 Przed - nie 53 30 Czy szkolenie miało istotny wpływ na wzrost wydajności pracy? Przyjmij α = 0.01 i wykorzystaj test McNemary. 3. 20 pacjentom zmierzono poziom cukru we krwi przed i po zastosowaniu pewnej kuracji. Wyniki były następujące: Po - w normie Po - poza normą Przed - w normie 4 6 Przed - poza normą 6 4 Czy kuracja istotnie wpływa na poziom cukru we krwi? Zweryfikuj hipotezę przyjmując α = 0.02. Wykorzystaj test McNemary. 4. Pewien materiał poddano badaniu wytrzymałościowemu przed i po narażeniu na działanie pewnego czynnika. Przebadano 16 próbek materiału i otrzymano wyniki: Po - odporny Po - nieodporny Przed - odporny 4 9 Przed - nieodporny 2 1 Na poziomie istotności α = 0.05, testem McNemary, zweryfikuj hipotezę o braku wpływu czynnika na odporność materiału. 5. Obserwacji poddano 20 uczniów szkół średnich, którzy wykonywali ten sam zestaw ćwiczeń sprawnościowych (opisywanych 1, gdy zostały zaliczone oraz 0, gdy nie zostały zaliczone) w godzinach: 8.00 (P1), 14.00 (P2) i 20.00 (P3). Wyniki były następujące: (1, 1, 1), (1, 0, 0), (1, 1, 0), (1, 1, 1), (1, 1, 0), (1, 0, 0), (0, 1, 0), (0, 1, 1), (0, 0, 0), (1, 1, 1), (0, 0, 1), (0, 1, 1), (0, 0, 1), (1, 1, 0), (0, 1, 0), (1, 0, 1), (0, 1, 0), (1, 1, 1), (0, 0, 0), (1, 1, 0). Czy pora dnia ma istotny wpływ na wynik testu? Zweryfikuj ten pogląd przyjmując α = 0.01. Wykorzystaj test Q Cochrana. 6. 10 losowo wybranych klientów pewnego supermarketu zapytano o ocenę trzech nowych produktów: A, B, i C. Oceniano w dwóch kategoriach: 1 - aprobata, 0 - dezaprobata. Wyniki eksperymentu przedstawia tabela: Klient Produkt A Produkt B Produkt C 1 1 0 0 2 1 0 1 3 0 0 0 4 1 1 0 5 1 0 1 6 1 1 1 7 1 0 0 8 0 0 1 9 1 0 0 10 1 1 0 3

Testem Q Cochrana na poziomie istotności α = 0.01 zweryfikuj hipotezę o niezależności ocen poszczególnych produktów. 7. Dysponujemy próbą losową 200 pacjentów, którym podano w pierwszej kolejności lek A, a po jakimś czasie placebo i każdorazowo zapytano o stan zdrowia. Odpowiedzi uzyskano w 3 kategoriach: poprawa, bez zmian, pogorszenie. Wyniki (liczby pacjentów) zebrano w poniższej tabeli: Lek / Placebo Poprawa Bez zmian Pogorszenie Poprawa 10 16 26 Bez zmian 52 30 11 Pogorszenie 12 41 2 Na poziomie istotności α = 0.05, testem symetrii Bowkera, zweryfikuj hipotezę o braku istotnych różnic w stanie zdrowia pacjentów po podaniu leku A i placebo. 8. Badaniu poddano reakcję organizmu na alergeny A i B. Wyniki uzyskano w 3 kategoriach: brak, słaba, silna. Testem Bowkera na poziomie istotności α = 0.01 zweryfikuj hipotezę o braku zależności między reakcjami na obydwa alergeny, jeżeli próba losowa 30 pacjentów dała następujące wyniki: A / B Brak Słaba Silna Brak 2 4 1 Słaba 3 5 4 Silna 2 3 6 9. Wysokości plonów w pewnym okresie czasu (w q/ha) uzyskane przy użyciu 3 różnych metod uprawy dały w próbie losowej następujące wyniki: Obserwacja Metoda 1 Metoda 2 Metoda 3 1 74 80 69 2 70 79 70 3 69 81 72 4 65 76 75 5 78 78 80 6 80 72 65 7 70 85 64 8 68 91 78 9 59 83 73 10 70 82 75 Na poziomie istotności α = 0.05 zweryfikuj hipotezę o jednakowym rozkładzie wysokości plonów dla każdej z metod. Wykorzystaj test Friedmana. 10. Zbadano natężenie ruchu (liczba samochodów / godzina) w 6 różnych punktach sieci drogowej miasta. Dane zebrano w 3 losowo wybranych dniach roboczych (w marcu, czerwcu i październiku). Wyniki były następujące: 4

Punkt Marzec Czerwiec Październik 1 323 280 369 2 430 379 570 3 369 381 372 4 565 476 575 5 780 780 805 6 802 772 865 Testem Friedmana, przyjmując α = 0.01, zweryfikuj hipotezę o jednakowym rozkładzie natężenia ruchu we wszystkich badanych populacjach. 11. 6 różnych metod badawczych zostało ocenionych przez 4 ekspertów, którzy według swojej wiedzy nadali im rangi, przyjmując 1 za najwyższą ocenę danej metody. Na poziomie istotności α = 0.05 zweryfikuj hipotezę o braku korelacji między ocenami ekspertów, wykorzystując test zgodności rang Kendalla wiedząc, że wyniki oceny były następujące: Metoda Ekspert 1 Ekspert 2 Ekspert 3 Ekspert 4 I 1 2 1 4 II 5 3 6 3 III 2 1 4 1 IV 3 4 2 2 V 4 5 3 6 VI 6 6 5 5 12. 3 ekspertów oceniało wpływ 10 różnych czynników na pewne zjawisko, nadając czynnikom odpowiednie rangi (najniższa ranga = najniższy wpływ czynnika). Na poziomie istotności α = 0.01 zweryfikuj hipotezę o zbieżności ocen ekspertów, jeśli były one następujące: Wykorzystaj test zgodności rang Kendalla. Czynnik Ekspert 1 Ekspert 2 Ekspert 3 A 1 3 1 B 9 10 10 C 2.5 1 5 D 2.5 2 4 E 4 4 3 F 10 9 9 G 7.5 8 6.5 H 5 7 2 I 7.5 6 6.5 J 6 5 8 5