Elementarne metody statystyczne 9 Wybrane testy nieparametryczne - ciąg dalszy Test McNemary W teście takim dysponujemy próbami losowymi z dwóch populacji zależnych pewnej cechy X. Wyniki poszczególnych pomiarów określone są za pomocą jedynie dwóch kategorii, oznaczanych wartościami -1 i +1 (np. tak i nie ; poprawa, brak poprawy ). Weryfikacji podlega hipoteza H 0 o tym, że rozkład badanej cechy jest identyczny w obu populacjach, co w praktyce oznacza, że proporcja pomiędzy dwiema kategoriami cechy X jest jednakowa w obu próbach (np. zastosowanie nowego leku nie wpływa na poprawę stanu zdrowia pacjentów). Załóżmy, że w obu próbach losowych (P1 i P2) zaobserwowano następujące liczebności kategorii cechy X : Statystyka testowa jest następująca: χ 2 = P2 (+1) P2 (-1) P1 (+1) a b P1 (-1) c d (b c)2 b + c χ 2 1 przy n. H0 Obszar krytyczny ma następującą postać: K = (χ 2 1,1 α, ). Lepsze przybliżenie do rozkładu χ 2 uzyskuje się za pomocą statystyki: χ 2 0 = ( b c 1)2. b + c Test symetrii Bowkera Test ten stanowi uogólnienie testu McNemary na przypadek, gdy wartości cechy X są określone przez r > 2 kategorii. Testujemy następującą hipotezę: wobec alternatywy H 0 : p ij = p ji dla wszystkich par i, j = 1, 2,..., r, gdzie j > i H 0 : p ij p ji dla choć jednej pary i, j = 1, 2,..., r, gdzie j > i, przy czym p ij = P{X1 = x i X2 = x j } (X1 i X2 oznaczają wartości cechy X w 1. i 2. próbie). Wartość p ij jest więc prawdopodobieństwem pojawienia się w pary (x i, x j ). Statystyka testowa jest następująca: χ 2 = r j>i (N ij N ji ) 2 χ 2 r(r 1) N ij + N ji 2 przy n. Wartość N ij oznacza liczbę pojawień się obserwacji (x i, x j ) w próbie zależnej. Zbiór krytyczny testu ma postać: K = (χ 2 r(r 1) 2,1 α, ). Test Q Cochrana Uogólnieniem testu McNemary na przypadek k > 2 zależnych prób jest test Q Cochrana. Załóżmy, że mamy n obserwacji cechy X w k zależnych populacjach. Przyjmijmy, że cecha X opisywana jest dwiema wartościami: 0 i 1. Statystyka testowa jest następująca: Q = (k 1)(kC T )2 kt R 1 χ 2 k 1 przy n,
gdzie k ( n ) 2, C = C ij n ( k ) 2, R = C ij n k T = C ij, przy czym C ij oznacza wartość i tej obserwacji w j tej próbie (i = 1, 2,..., n; j = 1, 2,..., k). Zbiór krytyczny testu Q Cochrana ma postać: K = (χ 2 k 1,1 α, ). Test Friedmana Test Friedmana jest testem jednorodności rozkładów pewnej cechy X typu ciągłego w k 2 zależnych populacjach. Załóżmy, że k wymiarowa próba losowa liczy n elementów. Niech R (j) i oznacza rangę elementu x ij w uporządkowanym ciągu wartości x 1j, x 2j,..., x kj. Niech ponadto R i = n R (j) i. Statystyka testowa jest następująca: T = 12 nk(k + 1) k Ri 2 3n(k + 1) χ 2 k 1 przy n, zaś zbiór krytyczny testu ma postać K = (χ 2 k 1,1 α, ). Test zgodności rang Kendalla W teście tym badamy istotność korelacji między k zbiorami rang przyporządkowanych n obiektom, a więc np. badamy zgodność ocen k ekspertów (sędziów) przyporządkowujących rangi n kategoriom. Hipoteza zerowa oznacza brak korelacji między zbiorami rang. Niech R ij będzie rangą elementu x ij w uporządkowanym ciągu wartości x i1,..., x in (i = 1,..., k; j = 1,..., n). Niech R j = k R ij. Statystyką testową jest tzw. współczynnik zgodności (konkordancji) Kendalla, przyjmujący wartości z przedziału [0,1] i określony wzorem: gdzie Mamy także: W = 12S k 2 n(n 2 1), n S = Rj 2 1 ( n ) 2. R j n χ 2 = k(n 1)W χ 2 n 1 przy n. Zbior krytyczny testu ma postać: K = (χ 2 n 1,1 α, ). 1. Badaniu statystycznemu poddano poparcie jednego z kandydatów wobec zbliżających się wyborów. Dane zebrano u 250 ankietowanych osób przed rozpoczęciem kampanii i w ostatnim jej dniu. Wyniki były następujące: Po - tak Po - nie Przed - tak 72 65 Przed - nie 53 60 Na poziomie istotności α = 0.05 zweryfikuj hipotezę o braku wpływu kampanii wyborczej na poparcie kandydata. Wykorzystaj test McNemary. 2
2. Badaniu poddano pracowników pewnej firmy pod względem spełnianych norm wydajności pracy. Dane zebrano przed i po szkoleniu. Były one następujące: Po - tak Po - nie Przed - tak 120 6 Przed - nie 53 30 Czy szkolenie miało istotny wpływ na wzrost wydajności pracy? Przyjmij α = 0.01 i wykorzystaj test McNemary. 3. 20 pacjentom zmierzono poziom cukru we krwi przed i po zastosowaniu pewnej kuracji. Wyniki były następujące: Po - w normie Po - poza normą Przed - w normie 4 6 Przed - poza normą 6 4 Czy kuracja istotnie wpływa na poziom cukru we krwi? Zweryfikuj hipotezę przyjmując α = 0.02. Wykorzystaj test McNemary. 4. Pewien materiał poddano badaniu wytrzymałościowemu przed i po narażeniu na działanie pewnego czynnika. Przebadano 16 próbek materiału i otrzymano wyniki: Po - odporny Po - nieodporny Przed - odporny 4 9 Przed - nieodporny 2 1 Na poziomie istotności α = 0.05, testem McNemary, zweryfikuj hipotezę o braku wpływu czynnika na odporność materiału. 5. Obserwacji poddano 20 uczniów szkół średnich, którzy wykonywali ten sam zestaw ćwiczeń sprawnościowych (opisywanych 1, gdy zostały zaliczone oraz 0, gdy nie zostały zaliczone) w godzinach: 8.00 (P1), 14.00 (P2) i 20.00 (P3). Wyniki były następujące: (1, 1, 1), (1, 0, 0), (1, 1, 0), (1, 1, 1), (1, 1, 0), (1, 0, 0), (0, 1, 0), (0, 1, 1), (0, 0, 0), (1, 1, 1), (0, 0, 1), (0, 1, 1), (0, 0, 1), (1, 1, 0), (0, 1, 0), (1, 0, 1), (0, 1, 0), (1, 1, 1), (0, 0, 0), (1, 1, 0). Czy pora dnia ma istotny wpływ na wynik testu? Zweryfikuj ten pogląd przyjmując α = 0.01. Wykorzystaj test Q Cochrana. 6. 10 losowo wybranych klientów pewnego supermarketu zapytano o ocenę trzech nowych produktów: A, B, i C. Oceniano w dwóch kategoriach: 1 - aprobata, 0 - dezaprobata. Wyniki eksperymentu przedstawia tabela: Klient Produkt A Produkt B Produkt C 1 1 0 0 2 1 0 1 3 0 0 0 4 1 1 0 5 1 0 1 6 1 1 1 7 1 0 0 8 0 0 1 9 1 0 0 10 1 1 0 3
Testem Q Cochrana na poziomie istotności α = 0.01 zweryfikuj hipotezę o niezależności ocen poszczególnych produktów. 7. Dysponujemy próbą losową 200 pacjentów, którym podano w pierwszej kolejności lek A, a po jakimś czasie placebo i każdorazowo zapytano o stan zdrowia. Odpowiedzi uzyskano w 3 kategoriach: poprawa, bez zmian, pogorszenie. Wyniki (liczby pacjentów) zebrano w poniższej tabeli: Lek / Placebo Poprawa Bez zmian Pogorszenie Poprawa 10 16 26 Bez zmian 52 30 11 Pogorszenie 12 41 2 Na poziomie istotności α = 0.05, testem symetrii Bowkera, zweryfikuj hipotezę o braku istotnych różnic w stanie zdrowia pacjentów po podaniu leku A i placebo. 8. Badaniu poddano reakcję organizmu na alergeny A i B. Wyniki uzyskano w 3 kategoriach: brak, słaba, silna. Testem Bowkera na poziomie istotności α = 0.01 zweryfikuj hipotezę o braku zależności między reakcjami na obydwa alergeny, jeżeli próba losowa 30 pacjentów dała następujące wyniki: A / B Brak Słaba Silna Brak 2 4 1 Słaba 3 5 4 Silna 2 3 6 9. Wysokości plonów w pewnym okresie czasu (w q/ha) uzyskane przy użyciu 3 różnych metod uprawy dały w próbie losowej następujące wyniki: Obserwacja Metoda 1 Metoda 2 Metoda 3 1 74 80 69 2 70 79 70 3 69 81 72 4 65 76 75 5 78 78 80 6 80 72 65 7 70 85 64 8 68 91 78 9 59 83 73 10 70 82 75 Na poziomie istotności α = 0.05 zweryfikuj hipotezę o jednakowym rozkładzie wysokości plonów dla każdej z metod. Wykorzystaj test Friedmana. 10. Zbadano natężenie ruchu (liczba samochodów / godzina) w 6 różnych punktach sieci drogowej miasta. Dane zebrano w 3 losowo wybranych dniach roboczych (w marcu, czerwcu i październiku). Wyniki były następujące: 4
Punkt Marzec Czerwiec Październik 1 323 280 369 2 430 379 570 3 369 381 372 4 565 476 575 5 780 780 805 6 802 772 865 Testem Friedmana, przyjmując α = 0.01, zweryfikuj hipotezę o jednakowym rozkładzie natężenia ruchu we wszystkich badanych populacjach. 11. 6 różnych metod badawczych zostało ocenionych przez 4 ekspertów, którzy według swojej wiedzy nadali im rangi, przyjmując 1 za najwyższą ocenę danej metody. Na poziomie istotności α = 0.05 zweryfikuj hipotezę o braku korelacji między ocenami ekspertów, wykorzystując test zgodności rang Kendalla wiedząc, że wyniki oceny były następujące: Metoda Ekspert 1 Ekspert 2 Ekspert 3 Ekspert 4 I 1 2 1 4 II 5 3 6 3 III 2 1 4 1 IV 3 4 2 2 V 4 5 3 6 VI 6 6 5 5 12. 3 ekspertów oceniało wpływ 10 różnych czynników na pewne zjawisko, nadając czynnikom odpowiednie rangi (najniższa ranga = najniższy wpływ czynnika). Na poziomie istotności α = 0.01 zweryfikuj hipotezę o zbieżności ocen ekspertów, jeśli były one następujące: Wykorzystaj test zgodności rang Kendalla. Czynnik Ekspert 1 Ekspert 2 Ekspert 3 A 1 3 1 B 9 10 10 C 2.5 1 5 D 2.5 2 4 E 4 4 3 F 10 9 9 G 7.5 8 6.5 H 5 7 2 I 7.5 6 6.5 J 6 5 8 5