PRZEGLD STATYSTYCZNY R. LXIII ZESZYT 2 2016 PIOTR SULEWSKI 1 MOC TESTÓW NIEZALENOCI W TABLICY DWUDZIELCZEJ WIKSZEJ NI 2 2 1. WPROWADZENIE Moc testów niezalenoci to prawdopodobiestwo odrzucenia hipotezy zerowej H 0, gdy nie jest ona prawdziwa. W kadym popularnym podrczniku ze statystyki znajduj si informacje o m.in. takich testach jak: niezalenoci, t Studenta, Komogorowa czy Behrensa-Fishera. Nie sposób nie zgodzi si zatem z tez, e testy niezaleno- ci obok wspomnianych wczeniej testów s zapewne najczciej stosowanymi narzdziami statystycznym. Dane do testów niezalenoci aranuje si w postaci tablic dwudzielczych (TD). W pracy porównano rodzin szeciu tzw. statystyk chi-kwadrat w skad której wchodzi powszechnie znana i czsto stosowana statystyka 2 Pearsona ze statystyk moduow zaproponowan w Sulewski (2013). Pearson w statystyce 2 uy kwadratu dlatego, aby móc skorzysta z rozkadu chi-kwadrat jako miary rozbienoci. Kwadrat uyty w liczniku statystyki 2 powoduje równie, e due rozbienoci midzy liczebnoci empiryczn a oczekiwan s jeszcze wiksze, a mae rozbienoci jeszcze mniejsze. Innym celem jego zastosowania byo uniknicie wzajemnego niwelowania si rozbienoci. Do tego jednak celu zamiast kwadratu odchyle mona uy take ich wartoci bezwzgldnej, std narodzi si pomys na statystyk moduow. W Sulewski (2014) pokazano, e tzw. statystyki chi-kwadrat : 2 Pearsona, G 2 ilorazu wiarygodnoci, N Neymana, KL Kullbacka-Leiblera, FT Freemana-Tukeya oraz CR Cressiego-Reada, maj rozkad chi-kwadrat dla próbek liczcych przynajmniej kilkaset elementów. Korzystanie ze statystyk chi-kwadrat szczególnie dla maych próbek wie si ze stosowaniem rónego rodzaju ogranicze. Np. ze statystyki 2 Pearsona w tablicach dwudzielczych wikszych ni 2 2 mona korzysta, gdy wszystkie liczebnoci oczekiwane s nie mniejsze od 1oraz gdy nie wicej ni 20% tych wartoci jest mniejsze ni 5 (Yates i inni, 1999; Shier, 2004). Zdaniem Cochran a (1952) statystyk 2 Pearsona dla tablic wikszych ni 2 2 mona stosowa, gdy przynajmniej jedna z liczebnoci oczekiwanych jest wiksza ni 5. W celu zniesienia powyszych ogranicze w niniejszej pracy zaproponowano wyznaczanie wartoci krytycznych na drodze symulacji komputerowych metod Monte Carlo. Wyznaczanie 1 Akademia Pomorska w Supsku, Instytut Matematyki, ul. Arciszewskiego 22, 76-200 Supsk, Polska, e-mail: piotr.sulewski@apsl.edu.pl.
192 Piotr Sulewski wartoci krytycznych na podstawie np. 100.000 wartoci statystyki testowej w dobie wydajnych komputerów z procesorami wielordzeniowymi nie stanowi problemu, bo trwa kilkadziesit sekund. Wymienione powyej testy porównano ze wzgldu na ich moc czyli zdolnoci TD w k do odrzucenia H 0 mówicej o tym, e nie ma zwizku midzy cechami X i Y. Do wyznaczenia mocy testów tablice dwudzielcze w k generowano za pomoc metody supkowej oraz zaproponowano miar nieprawdziwoci H 0 przyjmujc róne wartoci dla danego schematu wyznaczania prawdopodobiestw p ij (i,j = 1,2), dla których H 0 jest niesuszna. Niniejsza praca jest kontynuacj rozwaa podjtych w Sulewski (2016), gdzie omawian tematyk zastosowano dla TD 2 2. Pierwszym celem pracy jest przedstawienie teorii dotyczcej testów niezalenoci dla TD w k, drugim celem wprowadzenie miary nieprawdziwoci H 0 oraz porównanie jakoci testów za pomoc ich mocy. Praca skada si z dwóch czci. W czci I realizowany jest cel pierwszy, zdefiniowano w niej TD w k oraz siedem testów niezalenoci, opisano sposób generowania TD i wyznaczania wartoci krytycznych. W czci II realizowany jest cel drugi, zdefiniowano w niej miar nieprawdziwoci H 0 oraz wyznaczono moc analizowanych testów niezalenoci w celu wyonienia najlepszego testu. 2. TABLICA DWUDZIELCZA w k Tabela 1 przedstawia tablic dwudzielcz w k, która skada si z wartoci n ij (i = 1,2,,w; j = 1,2,,k) rozkadu cznego cech X i Y takich, e. Cecha X Tablica dwudzielcza w k liczebnoci Cecha Y Y 1 Y 2... Y k Tabela 1. Razem X 1 n 11 n 12... n 1k n 1 X 2 n 21 n 22... n 2k n 2.................. X w n 12 n 12... n wk n 12 Razem n 1 n 2... n * k n ródo: opracowanie wasne. Liczebnoci oczekiwane i-tego wiersza i j-tej kolumny wyznacza si ze wzoru, (i = 1,2,,w; j = 1,2,,k). (1)
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 193 Tablic dwudzielcz w k mona take przedstawi wykorzystujc prawdopodobiestwa p ij (i = 1,2,,w; j = 1,2,,k) takie, e. W odniesieniu do tabeli 1 wartoci te wyznaczane s ze wzoru p ij = n ij / n (i = 1,2,,w; j = 1,2,,k). Generacj TD w k niezbdn do przeprowadzenia symulacji i wyznaczenia mocy testów przeprowadzono metod supkow. W tym celu przedzia (o,1 podzielono na w k podprzedziaów o szerokociach równych wartoci prawdopodobiestw p ij w taki sposób, e pierwszy podprzedzia ma szeroko p 11, drugi p 12,, k-ty p 1k,, ostatni p wk. Wielkoci p ij speniaj oczywicie warunek normalizacji i dobrano je w taki sposób, aby uzyska dan warto miary nieprawdziwoci H 0. Kada z n wygenerowanych liczb losowych równomiernych wpada do jednego z podprzedziaów i tym samym zostaje o jedn zwikszona liczba obiektów w odpowiadajcej temu podprzedziaowi komórce TD. Wielkoci n ij speniajce równo s liczebnoci obiektów w poszczególnych komórkach TD. Rysunek 1 przedstawia schemat wypeniania komórek TD 4 2 dla liczebnoci próby n = 2000 i miary nieprawdziwoci H 0 równej 0, czyli p ij = 0,125 dla kadego i = 1,2,,4; j = 1,2. Tabela 2 prezentuje odpowiadajc temu schematowi tablic dwudzielcz. n = 2000 liczb losowych równomiernych p 11 p 12 p 21 p 22 p 31 p 32 p 41 p 42 0 0,125 0,25 0,325 0,5 0,625 0,75 0,875 1 n 11 = 264 n 12 = 245 n 21 = 245 n 22 = 231 n 31 = 274 n 32 = 253 n 41 = 252 n 42 = 236 Rysunek 1. Schemat wypeniania komórek TD 4 2 ródo: opracowanie wasne. Tablica dwudzielcza w k otrzymana metoda supkow Tabela 2. Cecha X Cecha Y Y 1 Y 2 Razem X 1 264 245 509 X 2 245 231 476 X 3 274 253 527 X 4 252 236 488 Razem 1035 965 2000 ródo: opracowanie wasne.
194 Piotr Sulewski 3. TESTY NIEZALENOCI W TABLICY DWUDZIELCZEJ w k Do badania niezalenoci cech X i Y w TD w k skorzystano ze statystyki modu- owej bdcej modyfikacj statystyki 2 Pearsona (Sulewski, 2013): (2) oraz z rodziny statystyk, które dla TD w k maj asymptotyczny rozkad chi-kwadrat z (w-1)(k-1) stopniami swobody i dlatego s okrelane mianem statystyk chi-kwadrat (Cressie, Read, 1984). S to: 1) Powszechnie znana i czsto stosowana statystyka 2 Pearsona (Pearson, 1900) ; (3) 2) Statystyka G 2 ilorazu wiarygodnoci (Sokal, Rohlf, 2012) 3) Statystyka N Neymana (Neyman, 1949) ; (4) 4) Statystyka KL Kullbacka-Leiblera (Kullback, 1959) ; (5) ; (6) 5) Statystyka FT Freemana-Tukeya (Freeman, Tukey, 1950) 6) Statystyka CR Cressiego-Reada (Cressie, Read, 1984) ; (7). (8)
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 195 Charakterystyk statystyk chi-kwadrat dla tablic dwudzielczych, trójdzielczych i czterodzielczych wraz z implementacj komputerow mona znale w pracy Sulewskiego (2014). W Sulewski, Motyka (2015a), korzystajc z metody Monte Carlo, porównano jako statystyk chi-kwadrat wyraon w funkcji mocy przy zaoeniu, e statystyki te jak twierdz ich autorzy podlegaj rozkadowi chi-kwadrat. Badania wykazay, e jako testu 2 Pearsona oraz CR Cressiego-Reada jest porównywalna i znacznie lepsza od pozostaych. Liczebnoci n ij (i = 1,2,,w; j = 1,2,,k) w TD w k s zmiennymi losowymi. Godnym uwagi jest, e zmienne losowe bdce odwrotnoci lub ilorazem zmiennych losowych nie posiadaj wartoci oczekiwanej i w konsekwencji take niektórych momentów wyszych rzdów. Rozkad chi-kwadrat jak powszechnie wiadomo posiada wszystkie momenty. Ponadto podanym jest, aby poszczególne skadniki statystyki testowej gdy H 0 o niezalenoci cech X i Y jest suszna byy tego samego znaku i jak najblisze 0. Skadniki statystyk (4), (6) i (8) s rónego znaku i wzajemnie si rekompensuj i tylko dla bardzo duych prób podlegaj rozkadowi chi-kwadrat (Sulewski, 2014). Aby to pokaza metod supkow opisan powyej wygenerowano tablic dwudzielcz 3 3 o liczebnoci próby n = 150, gdy hipoteza H 0 o niezalenoci cech X i Y jest suszna, czyli p ij = 1/9(i,j = 1,2,3). Tabela 3 przedstawia wartoci poszczególnych skadników statystyk chi-kwadrat (wartoci ujemne pogrubiono). Wartoci skadników statystyk chi-kwadrat Tabela 3. Skadnik 2 G 2 N KL FT CR i=1, j=1 0,029 1,362 0,028-1,305 0,007 0,829 i=1, j=2 0,003 0,429 0,003-0,424 0,001 0,259 i=1, j=3 0,060-1,698 0,065 1,823 0,016-0,995 i=2, j=1 0,381-4,933 0,444 5,755 0,103-2,813 i=2, j=2 0,616-6,652 0,741 8,003 0,169-3,755 i=2, j=3 2,547 14,901 1,816-10,620 0,534 10,030 i=3, j=1 0,250 4,240 0,222-3,769 0,059 2,647 i=3, j=2 0,638 7,481 0,538-6,312 0,146 4,753 i=3, j=3 2,202-8,301 3,699 13,945 0,702-4,210 Razem 6,726 6,829 7,556 7,095 1,735 6,744 ródo: opracowanie wasne.
196 Piotr Sulewski 4. WYZNACZANIE WARTOCI KRYTYCZNYCH W okresie ostatnich kilkudziesiciu lat zaproponowano róne testy niezalenoci dla tablic dwudzielczych oraz okrelono warunki ich stosowalnoci szczególnie dla maych prób, które najczciej s przedmiotem bada statystycznych. W dobie coraz to szybszych komputerów z procesorami wielordzeniowymi oraz rozbudowan pamici operacyjn, mona za pomoc stosownego oprogramowania znie te ograniczenia i drog symulacyjn wyznaczy wartoci krytyczne. Przy wyznaczaniu wartoci krytycznych, gdy midzy cechami nie ma zwizku, zawarto tablic dwudzielczych w k o liczebnoci próby n generowano za pomoc metody supkowej przyjmujc p ij = 1/(w k) (i = 1,2,,w; j = 1,2,,k). Dla kadej TD w k obliczono r = 10 5 wartoci kadej analizowanej statystyki testowej, które nastpnie uporzdkowano w kolejnoci rosncej. Warto krytyczn na poziomie istotnoci = 0,1 wyznaczono ze wzoru:. (9) Tak dua liczba powtórze r przy wyznaczaniu wartoci statystyki testowej zapewnia uzyskanie dokadnego wyniku. 5. MOC TESTU Moc testu to prawdopodobiestwo odrzucenia hipotezy zerowej H 0, gdy nie jest ona prawdziwa. Moc testu zaley od liczebnoci próby im liczniejsza próba, tym wiksza moc. Moc testu zaley take od poziomu istotnoci testu im niszy poziom istotnoci, tym mniejsza moc testu. Moc testu zaley równie od siy zwizku midzy cechami im wiksza sia zwizku, tym wiksza moc testu. Wicej informacji o mocy testu znale mona m.in. w Sulewski (2015b). W celu wyznaczenia mocy testu czyli zdolnoci TD do odrzucenia hipotezy mówicej o tym, e nie ma zwizku midzy cechami X i Y gdy w istocie zwizek jest, niezbdna jest generacja tablic dwudzielczych. Dane podlegajce opracowaniu musz by danymi pochodzcymi z generatora liczb losowych, a nie danymi wzitymi z praktyki. Uwzgldniajc narzucon si zwizku midzy cechami wyraon za pomoc miary nieprawdziwoci H 0 danej wzorem, (10) do wypenienia TD w k skorzystano z metody supkowej wykorzystujcej prawdopodobiestwa p ij (i = 1,2,,w; j = 1,2,,k). Znajc warto statystyki testowej dla rónych liczebnoci próby n wyznaczono moc testu za pomoc wzoru m = u/r, gdzie u okrela liczb tych sporód r = 10 5
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 197 wszystkich moliwych przypadków, kiedy to warto statystyki testowej jest nie mniejsza od wartoci krytycznej cv. Hipoteza zerowa H 0 mówica o tym, e midzy cechami X i Y w TD w k nie ma zwizku jest suszna, gdy p ij = p i p j dla i = 1,2,,w; j = 1,2,,k. Zatem miara (10) przyjmuje warto 0, gdy hipoteza H 0 jest suszna. Im wiksze wartoci mn, tym wiksza jest moliwo faszywoci H 0. Do wyznaczenia mocy testu dla TD w k skorzystano z rónych schematów wyznaczania prawdopodobiestw p ij (i = 1,2,,w; j = 1,2,,k), dla których hipoteza zerowa H 0 jest niesuszna. Prawdopodobiestwa te jak równie przedziay zmienno- ci miary mn dla omawianych schematów przedstawiono w tabelach 5, 7, 9, 11, 13. Wynika z nich, e miara nieprawdziwoci hipotezy H 0 zmienia si w rónych przedziaach. Minimalna liczebno próby dla danej TD i dla danego schematu zostaa tak dobrana, aby liczebnoci oczekiwane byy róne od zera. Maksymaln warto próby ustalono tak, aby uzyska maksymaln moc testu. Dla statystyki moduowej oraz dla statystyki chi-kwadrat o najwikszej mocy, uzyskane wyniki porównano za pomoc testu o równoci prawdopodobiestw stawiajc hipotez zerow, e moce testów s równe, czyli rónice s statystycznie nieistotne. TABLICA DWUDZIELCZA 2 3 Schematy prawdopodobiestw ukazujce zwizek midzy cechami dla TD 2 3 Tabela 4. Schemat A p 0 = 1/6, p = p 0 /10, k = 0,1,,9 Y 1 Y 2 Y 3 Schemat B X 1 p o k p p o p o X 2 p o p o p o + k p Y 1 Y 2 Y 3 Schemat C X 1 p o k p p o k p p o X 2 p o p o + k p p o + k p Y 1 Y 2 Y 3 X 1 p o k p p o k p p o Schemat D X 2 p o + k p p o + k p p o Y 1 Y 2 Y 3 X 1 p o k p p o p o + k p X 2 p o + k p p o p o k p p o ródo: opracowanie wasne.
198 Piotr Sulewski I II III IV V VI VII VIII Rysunek 2. Moc testów niezalenoci dla TD 2 3 oraz liczebnoci próby n I. Schemat A, n = 125 V. Schemat C, n = 50 II. Schemat A, n = 150 VI. Schemat C, n = 75 III. Schemat B, n = 125 VII. Schemat D, n = 30 IV. Schemat B, n = 150 VIII. Schemat D, n = 40 ródo: opracowanie wasne.
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 199 Miara nieprawdziwoci H 0 dla TD 2 3 i k = 0,1,...,9 Tabela 5. Schemat A Schemat B Schemat C Schemat D mn 2 3 = k / 45 mn 2 3 = mn 2 3 = 2k / 45 mn 2 3 = k / 15 mn 2 3 0;0,2 mn 2 3 0;0,28 mn 2 3 0;0,4 mn 2 3 0;0,6 ródo: opracowanie wasne. Rysunek 2 przedstawia zaleno mocy testów niezalenoci od miary mn dla TD 2 3, na poziomie istotnoci = 0,1 i liczebnoci próby n. Z rysunku 2 wynika, e statystyki chi-kwadrat dla TD 2 3 maj podobn moc, a wystpujce midzy nimi rónice s statystycznie nieistotne. Dla schematu A rónice midzy statystyk, a pozostaymi analizowanymi statystykami s statystycznie istotne dla mn 0,133;0,178. Dla schematu B oraz n = 125, n = 150 rónice te s statystycznie istotne odpowiednio dla mn 0,147;0,280 i mn 0,111;0,231. Dla schematu C statystyka ma istotnie wiksz moc od pozostaych statystyk, gdy mn 0,222;0,4. Dla schematu D rónice midzy statystykami s statystycznie nieistotne. TABLICA DWUDZIELCZA 2 4 Schematy prawdopodobiestw ukazujce zwizek midzy cechami dla TD 2 4 Tabela 6. Schemat A p 0 = 1/8, p = p 0 /10, k = 0,1,,9 Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o p o p o X 2 p o p o p o p o + k p Schemat B Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p p o p o X 2 p o p o p o + k p p o + k p Schemat C Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p p o p o X 2 p o + k p p o + k p p o p o
200 Piotr Sulewski Tabela 6. (cd.) Schemat D Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p p o + k p p o + k p X 2 p o + k p p o + k p p o k p p o k p ródo: opracowanie wasne. Miara nieprawdziwoci H 0 dla TD 2 4 i k = 0,1,...,9 Tabela 7. Schemat A Schemat B Schemat C Schemat D mn 2 4 = k / 40 mn 2 4 = k 2 / 400 mn 2 4 = k / 20 mn 2 4 = 3k / 40 mn 2 4 0;0,225 mn 2 4 0;0,2025 mn 2 4 0;0,45 mn 2 4 0;0,675 ródo: opracowanie wasne. Rysunek 3 przedstawia zaleno mocy testów niezalenoci od miary mn dla TD 2 4, na poziomie istotnoci = 0,1 i liczebnoci próby n. Z rysunku 3 wynika, e dla schematów A, C, D statystyki chi-kwadrat dla TD 2 4 maj podobn moc, a wystpujce midzy nimi rónice s statystycznie nieistotne. Dla schematu A statystyka charakteryzuje si wiksz moc ni pozostae statystyki, jednak przewaga ta jest statystycznie istotna dla n = 175 i mn = 0,175. Podobna sytuacja jest dla schematu B, gdy mn 0,09;0,203. Dla schematu C rónica istotna statystycznie na korzy statystyki moduowej jest dla n = 50 i mn 0,3;0,45 oraz n = 100 i mn 0,3;0,35. Dla schematu D rónice midzy statystykami s nieistotne statystycznie.
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 201 I II III IV V VI VII VIII Rysunek 3. Moc testów niezalenoci dla TD 2 4 oraz liczebnoci próby n I. Schemat A, n = 150 V. Schemat C, n = 50 II. Schemat A, n = 175 VI. Schemat C, n = 100 III. Schemat B, n = 150 VII. Schemat D, n = 30 IV. Schemat B, n = 200 VIII. Schemat D, n = 50 ródo: opracowanie wasne.
202 Piotr Sulewski TABLICA DWUDZIELCZA 3 3 Schematy prawdopodobiestw ukazujce zwizek midzy cechami dla TD 3 3 Tabela 8. Schemat A p 0 = 1/9, p = p 0 /10, k = 0,1,,9 Y 1 Y 2 Y 3 X 1 p o k p p o k p / 2 p o X 2 p o k p / 2 p o p o + k p / 2 X 3 p o p o + k p / 2 p o + k p Schemat B Y 1 Y 2 Y 3 X 1 p o k p p o k p p o X 2 p o p o p o X 3 p o + k p p o + k p p o Schemat C Y 1 Y 2 Y 3 X 1 p o k p p o p o + k p X 2 p o p o p o X 3 p o + k p p o p o k p ródo: opracowanie wasne. Miara nieprawdziwoci H 0 dla TD 3 3 i k = 0,1,...,9 Tabela 9. Schemat A Schemat B Schemat C mn 3 3 = k 2 / 900 mn 3 3 = 0,02963 k mn 3 3 = 2k / 45 mn 3 3 0;0,09 mn 3 3 0;0,2667 mn 3 3 0;0,04 ródo: opracowanie wasne. Rysunek 4 przedstawia zaleno mocy testów niezalenoci od miary mn dla TD 3 3, na poziomie istotnoci = 0,1 i liczebnoci próby n. Z rysunku 4 wynika, e dla schematów B, C statystyki chi-kwadrat dla TD 3 3 maj podobn moc, a wystpujce midzy nimi rónice s statystycznie nieistotne. Dla schematu A statystyka charakteryzuje si wiksz moc ni statystyka N, jednak przewaga ta jest statystycznie istotna dla n = 300 i mn 0,04;0,09 oraz n = 400 i mn 0,028;0,09. Statystyka charakteryzuje si take wiksz moc
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 203 od pozostaych statystyk dla schematu B i przewaga ta jest statystycznie istotna dla mn 0,148;0,267. Dla schematu C statystyki chi-kwadrat maj wiksz moc od statystyki moduowej, jednak przewaga ta jest statystycznie istotna tylko dla n = 50 i mn = 0,311. I II III IV V VI Rysunek 4. Moc testów niezalenoci dla TD 3 3 oraz liczebnoci próby n I. Schemat A, n = 300 IV. Schemat B, n = 100 II. Schemat A, n = 400 V. Schemat C, n = 50 III. Schemat B, n = 75 VI. Schemat C, n = 75 ródo: opracowanie wasne.
204 Piotr Sulewski TABLICA DWUDZIELCZA 3 4 Schematy prawdopodobiestw ukazujce zwizek midzy cechami dla TD 3 4 Tabela 10. Schemat A p 0 = 1/12, p = p 0 /10, k = 0,1,,9 Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p / 2 p o k p / 3 p o X 2 p o k p / 2 p o p o p o + k p / 2 X 3 p o p o + k p / 3 p o + k p / 2 p o + k p Schemat B Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p p o p o X 2 p o p o p o p o X 3 p o + k p p o + k p p o p o Schemat C Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p / 2 p o + k p / 2 p o + k p X 2 p o p ov p o p o X 3 p o + k p p o + k p / 2 p o k p / 2 p o k p ródo: opracowanie wasne. Miara nieprawdziwoci H 0 dla TD 3 4 i k = 0,1,...,9 Tabela 11. Schemat A Schemat B Schemat C mn 3 4 = k 2 / 1250 + k / 500 mn 3 4 = k / 30 mn 3 4 = k / 20 mn 3 4 0;0,084 mn 3 4 0;0,03 mn 3 4 0;0,45 ródo: opracowanie wasne. Rysunek 5 przedstawia zaleno mocy testów niezalenoci od miary mn dla TD 3 4, na poziomie istotnoci = 0,1 i liczebnoci próby n. Z rysunku 5 (schemat A) wynika, e statystyki chi-kwadrat charakteryzuj si rón moc. Przy n = 400 rónice midzy statystyk a statystyk N jako reprezentanta statystyk chi-kwadrat o najwikszej mocy, s statystycznie istotne dla mn 0,031;0,054, z kolei przy n = 500 dla mn 0,042;0,054. Dla schematu B moc testu dla statystyk chi-kwadrat jest bardzo podobna. Rónice midzy staty-
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 205 styk a pozostaymi statystykami s statystycznie istotne dla mn 0,2;0,3 z korzy- ci dla statystyki moduowej. Dla schematu C i próby n = 75 funkcje mocy testów dla statystyki i N s bardzo podobne. Dla n = 100 funkcje mocy analizowanych testów maj podobne przebiegi. I II III IV V VI Rysunek 5. Moc testów niezalenoci dla TD 3 4 oraz liczebnoci próby n I. Schemat A, n = 400 IV. Schemat B, n = 125 II. Schemat A, n = 500 V. Schemat C, n = 75 III. Schemat B, n = 100 VI. Schemat C, n = 100 ródo: opracowanie wasne.
206 Piotr Sulewski TABLICA DWUDZIELCZA 4 4 Schematy prawdopodobiestw ukazujce zwizek midzy cechami dla TD 4 4 Tabela 12. Schemat A p 0 = 1/16, p = p 0 /10, k = 0,1,,9 Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p / 2 p o k p / 3 p o X 2 p o k p / 2 p o k p / 3 p o p o + k p / 3 X 3 p o k p / 3 p o p o + k p / 3 p o + k p / 2 X 4 p o p o + k p / 3 p o + k p / 2 p o + k p Schemat B Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p p o p o X 2 p o k p / 2 p o k p / 2 p o p o X 3 p o + k p / 2 p o + k p / 2 p o p o X 4 p o + k p p o + k p p o p o Schemat C Y 1 Y 2 Y 3 Y 4 X 1 p o k p p o k p / 2 p o k p / 3 p o X 2 p o k p / 2 p o k p / 3 p o p o + k p / 3 X 3 p o k p / 3 p o p o + k p / 3 p o + k p / 2 X 4 p o p o + k p / 3 p o + k p / 2 p o + k p ródo: opracowanie wasne. Miara nieprawdziwoci H 0 dla TD 4 4 i k = 0,1,...,9 Tabela 13. Schemat A Schemat B Schemat C mn 4 4 mn 4 4 = 3k / 80 mn 4 4 = 3k / 40 ródo: opracowanie wasne. mn 4 4 0;0,084 mn 4 4 0;0,338 mn 4 4 0;0,675 Rysunek 6 przedstawia zaleno mocy testów niezalenoci od miary mn dla TD 4 4, na poziomie istotnoci = 0,1 i liczebnoci próby n.
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 207 I II III IV V VI Rysunek 6. Moc testów niezalenoci dla TD 4 4 oraz liczebnoci próby n I. Schemat A, n = 300 IV. Schemat B, n = 125 II. Schemat A, n = 500 V. Schemat C, n = 60 III. Schemat B, n = 100 VI. Schemat C, n = 80 ródo: opracowanie wasne. Z rysunku 6 (schemat A) wynika, e rónice midzy statystyk a statystyk N jako reprezentanta statystyk chi-kwadrat o najwikszej mocy, s statystycznie nieistotne z wyjtkiem mn = 0,084. Dla schematu B rónice midzy statystyk a pozostaymi statystykami s statystycznie istotne dla mn > 0,188 z korzyci dla statystyki moduowej. Dla schematu C analizowane statystyki maj podobn moc z wyjtkiem statystyki N, która dla n = 80 i mn 0,3;0,525 ma istotnie mniejsz moc ni pozostae statystyki.
208 Piotr Sulewski 6. PODSUMOWANIE Kwadrat uyty w liczniku statystyki 2 powoduje, e du e rozbienoci midzy liczebnoci empiryczn a teoretyczn s jeszcze wiksze, a mae rozbienoci jeszcze mniejsze. Innym celem zastosowania kwadratu byo uniknicie wzajemnego niwelowania si rozbienoci. Do tego jednak celu zamiast kwadratu odchyle mona uy take ich wartoci bezwzgldnej, std pomys na statystyk moduow. Zaproponowana miara mn dla analizowanych schematów prawdopodobiestw zmienia si w rónych przedziaach. Minimalna liczebno próby dla danej TD i dla danego schematu zostaa tak ustalona, by liczebnoci oczekiwane byy niezerowe. Maksymaln warto próby dobrano tak, by uzyska maksymaln moc testu. Artyku zwraca uwag na fakt, e testy niezalenoci wykorzystujce statystyki chi-kwadrat tylko dla schematów prawdopodobiestw o najmniejszym zakresie zmiennoci miary mn charakteryzuj si rón moc dla danej liczebnoci próby n i miary mn. Najwiksz moc wród nich ma statystyka N i ona jest bezporednio porównywana ze statystyk moduow. Jeeli widoczna jest przewaga statystyki moduowej nad statystykami chi-kwadrat, to gównie dla nie pocztkowych wartoci miary mn w ramach danego przedziau zmiennoci tej miary. Dla ostatniego analizowanego w ramach danej TD schematu nieprawdziwoci H 0 przedstawiajcego najwikszy zakres zmiennoci miary mn, test wykorzystujcy statystyk moduow ma podobn moc jak pozostae testy niezalenoci, z wyjtkiem TD 3 3, liczebnoci próby n = 50 i miary mn = 0,311, kiedy to statystyka ma istotnie mniejsz moc od pozostaych statystyk. Reasumujc statystyka moduowa charakteryzuje si wiksz moc ni statystyki chi-kwadrat, szczególnie jest to widoczne dla schematów prawdopodobiestw o mniejszych zakresach zmiennoci miary mn. Dla schematów C lub D o najwikszym zakresie zmiennoci miary mn statystyka moduowa nie odstpuje pod wzgldem mocy od pozostaych analizowanych statystyk. Na korzy statystyki moduowej przemawia take fakt, e mona z niej skorzysta w sytuacji, gdy jedna komórka lub dwie lece na przektnej s puste. Statystyk G 2, N i KL nie mona stosowa w tej sytuacji. LITERATURA Cochran W. G., (1954), Some Methods for Strengthening the Common 2 Tests, Biometrics, 10, 417 451. Cressie N., Read T., (1984), Multinomial Goodness-of -Fit Tests, Journal of the Royal Statistical Society, Series B (Methodological), 46 (3), 440 464. Freeman M. F., Tukey J. W., (1950), Transformations Related to the Angular and the Square root, Annals of Mathematical Statistics, 21, 607 611. Kullback S., (1959), Information Theory and Statistics, Wiley, New York. Neyman J., (1949), Contribution to the Theory of the 2 Test, Proceedings of the (First) Berkeley Symposium on Mathematical Statistics and Probability, University of California Press, 239 273.
Moc testów niezalenoci w tablicy dwudzielczej wikszej ni 2 2 209 Pearson K., (1900), On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is Such that It Can be Reasonably Supposed to Have Arisen from Random Sampling, Philosophy Magazine Series, 5 (50), 157 172. Shier R., (2004), The Chi-squared Test for Two-Way Tables, Mathematics Learning Support Centre. Sokal R. R., Rohlf F. J., (2012), Biometry: The Principles and Practice of Statistics in Biological Research, Freeman, New York. Sulewski P., (2013), Modyfikacja testu niezalenoci, Wiadomoci Statystyczne, GUS, 10, 1 19. Sulewski P., (2014), Statystyczne badanie wspózalenoci cech typu dyskretne kategorie, Akademia Pomorska, Supsk. Sulewski P., Motyka R., (2015a), Independence Test. A Comparative Analysis of Its Six Variants, ZN AMW, Gdynia, LVI,1, 37 46. Sulewski P., (2015b), Ocena zdolnoci tablic dwudzielczych do wykrywania zwizku midzy uporzdkowanymi cechami typu jakociowego, Wiadomoci Statystyczne, GUS, 5, 1 16. Sulewski P., (2016), Moc testów niezalenoci w tablicy dwudzielczej 2 2, Wiadomoci Statystyczne, GUS, 8. Yates D., Moore D., McCabe G., (1999), The Practice of Statistics, 1st Ed., New York, W. H. Freeman. MOC TESTÓW NIEZALENOCI W TABLICY DWUDZIELCZEJ WIKSZEJ NI 2 2 Streszczenie W literaturze statystycznej istnieje wiele miar testowych do badania niezalenoci cech w tablicach dwudzielczych. Do analiz statystycznych wybrano rodzin szeciu tzw. statystyk chi-kwadrat w tym statystyk 2 Pearsona oraz propozycj autora w postaci statystyki moduowej. W celu uwolnienia si od ogranicze stosowalnoci statystyk chi-kwadrat, wartoci krytyczne dla wszystkich analizowanych statystyk wyznaczono symulacyjnie metodami Monte Carlo. W celu porównania testów zaproponowano miar nieprawdziwoci H 0 oraz wyznaczono moc testów, czyli zdolno tablicy dwudzielczej w k do odrzucenia H 0 mówicej o tym, e midzy cechami X i Y nie ma zwizku. Sowa kluczowe: tablica dwudzielcza, test niezalenoci, wartoci krytyczne, Monte Carlo POWER ANALYSIS OF INDEPENDENCE TESTING FOR TWO-WAY CONTINGENCY TABLES BIGGER THAN 2 2 Abstract In the statistical literature there are many test measures to study the independence features in the two-way contingency tables. For statistical analysis, the family of six so-called chi-squared statistic was selected including Pearson s 2 statistics and the proposal of the author in the form of modular statistics. In order to free themselves from the limitations of the applicability of the chi-squared statisti c, critical values for all analyzed statistics were determined by simulation methods of Monte Carlo. In order to compare the tests, the measure of untruthfulness of H 0 was proposed and calculated the power of the tests which is the ability of two-way contingency tables to reject null hypothesis which says that between features X and Y there is no relation. Keywords: two-way contingency tables, independence test, critical values, Monte Carlo study