176 Wtȩp do tatytyki matematycznej trści wynika że H o : p 1 przeciwko hipotezie H 3 1: p< 1. Aby zweryfikować tȩ 3 hipotezȩ zatujemy tet dla frekwencji. Wtedy z ob 45 1 150 3 1 3 2 3 150 0 346. Tymczaem lewotronny obzar krytyczny Q ( n α ) gdzie n α jet rozwi azaniem równania P ({ω Ω: X (ω n α )}) α równoważnego równaniu 2(1 Φ(n α )) α dla α 0 05 ma potać Q ( 2 23). Ponieważ z ob / Q wiȩc wnoimy że nie ma powodów do odrzucenia hipotey zerowej. Należy wiȩ przyj ać że co najmniej trzecia czȩść tudentów badanej uczelni zdaje wzytkie egzaminy w pierwzym terminie. Zaprezentujemy teraz podtawowe metody nieparametrycznych tetów itotności. Na ogó l tety te dotycz a trzech kwetii: 1. roztrzygniȩcia hipotezy czy rozk lad cechy X populacji generalnej jet określonego typu F.Mówimy wtedy o tzw. teście zgodności 2. zbadania czy pobrany materia l tatytyczny pe lnia wymogi określone przez definicjȩ próby protej. Takie tety nazywamy tetami loowości 3. zbadanie wpó lzależności dwóch i wiȩcej cech tej amej populacji. Mówimy wtedy o tetach niezależności. Tet zgodności chi kwadrat (χ 2 ) Pearona. Niech (x 1...x n )(X 1...X n )(ω o )bȩdzie prób a prot a cechy X populacji generalnej. Stawiamy hipotezȩ na temat nieznanego rozk ladu F cechy X w potaci H o : F F o dlapewnegorozk ladu F o o k parametrach. Wtedy hipoteza alternatywna H 1 oznacza że dytrybuanta F jet inna aniżeli F o czyli H 1 : F F o. Dla celów weryfikacji hipotezy H o utalamy poziom itotności α (na ogó l α 0 05) oraz za tatytykȩ tetow a bierzemy tatytykȩ χ 2 Pearona o której wiȩcej powiemy za chwilȩ. Najpierw muimy zwrócić uwagȩ na kilka faktów zwi azanych ze truktur a próby protej. Przede wzytkim należy podkreślić że tet zgodności χ 2 Pearona ma zatoowanie zarówno dla rozk ladów ci ag lych jak i dykretnych. Poniżej
6.4 Podtawowe metody tatytyczne 177 pokażemy na przyk ladach każd a z ytuacji. W przypadku rozk ladów ci ag lych należy elementy próby protej podzielić nar roz l acznych kla. W tym celu zaleca iȩ (mówi o tym Polka norma PN 85 N 01052.07) aby n 100 r {10...25} oraz n i ilość elementów w i tej klaie by la równa co najmniej 5. Wróćmy teraz do tatytyki χ 2. Wtedy jej wartość w punkcie ω o który wyznacza próbȩprot a mapotać (patrz [4]) χ(ω o ) 2 r i1 (n i ) 2 gdzie r n n i maj a znaczenie jak wyżej. Przy za lożeniu hipotezy H o tatytyka χ 2 ma rozk lad chi kwadrat o r k 1 topniach wobody gdzie k oznacza liczbȩ parametrów dytrybuanty F o. Wtedy dla 2 i r p i Φ(y i ) Φ(y i 1 ) gdzie y i x i x gdzie Φ oznacza dytrybuantȩ tandardowego rozk ladu normalnego x i jet górn a wartości a i tej klay x jet średni a zpróby protej natomiat 2 odchyleniem tandardowym. Wtedy p 1 1 r i2 p i. Dla dotatecznie dużych n (n 100) obzar krytyczny Q który jet zawze obzarem prawotronnym wyznacza równość P ({ω Ω: χ 2 (ω) χ 2 α })α. Wtedy Q Q + (χ 2 α + ). Jeśli teraz χ 2 ob χ2 (ω o ) Q to odrzucamy hipotezȩ H o przyjmuj ac hipotezȩ H 1. W przeciwnym razie wniokujemy że nie ma podtaw aby H o odrzucić a wiȩc nie ma powodów do tego aby nie przyj ać że F F o. Przyk lad 6.4.11 W pewnej miejcowości wyloowano niezależnie 500 gopodartw i zbadano mieiȩczne zużycie energii elektrycznej w każdym z nich. Zebrane dane przedtawia poniżza tabela Zużycie energii w KWh 35 45 45 55 55 65 65 75 75 85 Liczba gopodartw 70 100 140 110 80 Na poziomie itotności 0 05 należy zweryfikować hipotezȩ że rozk lad zużytej energii przez gopodartwa jet normalny. Sprawdzimy najpierw czy pe lnione a warunki umożliwiaj ace toowaniete- tu zgodności. Mamy odpowiednio: n 500 r 5 n 1 70 n 2 100 n 3 140 n 4 110 n 5 80.
178 Wtȩp do tatytyki matematycznej Jak widać wartość liczby kla jet trochȩ ma la. Może to rzutować nawiarygodność ca lej procedury. Niech x i dla i 1 2...5 oznacza górne wartości kolejnych kla. Wtedy x 1 45 x 2 55 x 3 65 x 4 75 x 5 85. Wyznaczymy wartości p i. W tym celu należy tandaryzować rozk lad F o. Wtedy F o (x i )Φ( x i x ). Ponieważ x 1 r n i x o i n i1 gdzie x o i oznacza środek i tej klay wiȩc po podtawieniu danych liczbowych otrzymamy x 1 ( + 45 + 55 + 65 + 75 + 85 ) 70 35 +100 45 +140 55 +110 65 +80 75 60 6. 500 2 2 2 2 2 Podobnie 2 1 r (x o i x) 2 n i n i1 k ad 2 1 ( (40 60 6) 2 70+(50 60 6) 2 100+(60 60 6) 2 140+(70 60 6) 2 110+ 500 ) (80 60 6) 2 80 161 65 idlatego. Wtakimrazie y 1 x 1 x 45 60 6 1 227y 2 x 2 x 55 60 6 0 440 y 3 x 3 x 65 60 6 y 5 x 5 x 0 346y 4 x 4 x Możemy teraz obliczyć wartości p i : 85 60 6 1 919. 75 60 6 1 132 p 2 Φ(y 2 ) Φ(y 1 )Φ( 0 440) Φ( 1 227) Φ(1 227) Φ(0 440) 0 888767 0 670031 0 219 p 3 Φ(y 3 ) Φ(y 2 )Φ(0 346) Φ( 0 440)
6.4 Podtawowe metody tatytyczne 179 Φ(0 346) (1 Φ(0 440)) 0 633072 (1 0 670031) 0 304 p 4 Φ(y 4 ) Φ(y 3 )Φ(1 132) Φ(0 346) 0 870762 0 633072 0 238 p 5 Φ(y 5 ) Φ(y 4 )Φ(1 919) Φ(1 132) 0 971933 0 870762 0 101 gdzie p 1 1 (p 2 +...+ p 5 )1 0 862 0 138. uzykane dane i pozota le niezbȩdne dla wyliczenia wartości zaoberwowanej tatytyki χ 2 zebraliśmy w poniżzej tabeli x i n i y i p i (n i ) 2 45 70 1 227 0 138 69 0 014 55 100 0 440 0 219 109 5 0 824 65 140 0 346 0 304 152 0 947 75 110 1 132 0 238 119 0 680 85 80 1 919 0 101 50 5 17 232 Σ 500 1 000 500 χ 2 ob 19 694 Ponieważ P ({ω Ω: χ 2 (ω) χ 2 αr k 1 })α P ({ω Ω: χ2 (ω) χ 2 005 2 })0 05 wiȩc P ({χ 2 (ω) χ 2 0052 })5 991 <χ2 ob co oznacza że hipotezȩ H o należy odrzucić. Przy okazji tego przyk ladu warto zauważyć że (patrz powyżza tabela) oznaczaj a liczebność teoretyczn a kolejnych kla w odróżnieniu od wartości n i które oznaczaj a liczebność zmierzon a. Przejdziemy teraz do omówienia przyk ladu w którym pokażemy poób po lugiwania iȩ tetem zgodności w przypadku rozk ladu dykretnego. Przyk lad 6.4.12 Kandydatów na kierowcȩ poddano badaniom prawdzaj acym reflek i uwagȩ. Każdy z nich mia l do wykonania zadania na czterech tanowikach. W wyniku przebadania 100 loowo wybranych oób otrzymano natȩpuj ace dane: Liczba wykonanych zadań 0 1 2 3 4 Liczba kandydatów 5 12 23 40 20
180 Wtȩp do tatytyki matematycznej Na poziomie itotności 0 01 zweryfikować hipotezȩ rozk ladem dwumianowym. że rozk lad ten jet Rozk lad dwumianowy zależy od dwóch parametrów z których jeden (ilość powtórzeń) znamy. Aby utalić wartość tatytyki χ 2 muimy wyznaczyć prawdopodobieńtwo ukceu w tym rozk ladzie. Sukceem jet tutaj zdarzenie polegaj ace na tym że ooba przechodz aca badania zaliczy la pomyślnie tety na wzytkich czterech tanowikach. Z powyżzych danych wynika zatem że p 20 1.Odpowiednie dane potrzebne dla celów weryfikacji hipotezy H o : F B(n p) przy 100 5 hipotezie alternatywnej H 1 : F / B(n p) zebraliśmy w poniżzej tabeli x i n i (n i ) 2 (n i ) 2 0 5 20 225 11 25 1 12 20 64 3 2 2 23 20 9 0 45 3 40 20 400 20 4 20 20 0 0 Σ 100 100 χ 2 ob 34 9 Określimy obzar krytyczny dla tego tetu. W tym celu należy rozwi azać równanie P ({ω Ω: χ 2 (ω) χ 2 αr k 1}) α. Poniewż r k 1 5 1 1 3 oraz przyjȩliśmy że α 0 01 ztablic rozk ladu χ 2 wynika że χ 2 001 3 5 841. St ad obzar krytyczny jet przedzia lem Q (5 841 + ). Ponieważ χ 2 ob 34 9 Q wiȩc należy odrzucić hipotezȩ zerow a nakorzyść hipotezy alternatywnej.