1 Testy statystyczne Podczas sprawdzania hipotez statystycznych moga¾ wystapić ¾ dwa rodzaje b ¾edów. Prawdopodobieństwo b ¾edu polegajacego ¾ na odrzuceniu hipotezy zerowej (H 0 ), gdy jest ona prawdziwa, czyli tzw. b ¾edu I rodzaju określa si ¾e zazwyczaj przez ; natomiast p-stwo pope nienia b ¾edu II rodzaju polegajacego ¾ na przyj ¾eciu hipotezy zerowej, gdy jest ona fa szywa określa si ¾e symbolem Przedstawimy teraz ogólny schemat przebiegu procedury wery kacyjnej Sformu owanie hipotezy zerowej i alternatywnej + Wybór statystyki testowej + Określenie poziomu istotności + Wyznaczenie obszaru krytycznego testu + Obliczenie statystyki na podstawie próby + Nie odrzucać H 0 (= Podj¾ecie decyzji =) Odrzucić H 0 + + Wnioskujemy, ze H 0 mo ze być prawdziwa Wnioskujemy, ze H 1 jest prawdziwa Rodzaje testów Testy parametryczne najcz ¾eściej wery kuja¾ sady ¾ o takich parametrach populacji, jak średnia arytmetyczna, wskaźnik struktury i wariancja. Testy te sa¾ konstruowane przy za o zeniu znajomości dystrybuanty w populacji generalnej. Wi ¾ekszość z nich zak ada, ze rozk ad badanej cechy w populacji jest rozk adem normalnym. Testy nieparametryczne nie wymuszaja ¾ zadnych za o zeń dotyczacych ¾ postaci badanych zmiennych w populacji, w zwiazku ¾ z tym cz¾esto sa¾ określane mianem testów niezwiazanych ¾ z rozk adem. S u z a¾ one do wery kacji ró znorodnych hipotez dotyczacych, ¾ m. in. zgodności rozk adu cechy w populacji z określonym rozk adem teoretycznym, zgodności rozk adów w dwóch populacjach, a tak ze chocia zby losowości wyboru próby. W szczególnych przypadkach dla ma ych prób i rozk adów nienormalnych zast ¾epuja¾ testy parametryczne. Schemat rozwa zanych w dalszej w cz ¾eści testów przedstawia si ¾e nast ¾epujaco ¾ 1
1) testy s u z ace ¾ do wery kacji w asności populacji jednowymiarowych Testy porównujace ¾ oceny parametrów ze wzorcem =) Testy parametryczne - test dla średniej - test dla poporcji - test dla wariancji Testy oceniajace ¾ zgodność rozk adu empirycznego z teoretycznym =) Testy nieparametryczne test zgodności test zgodności Ko mogorowa test serii (= Testy oceniaj ace ¾ losowość próby ) test s u z ace ¾ do porównywania w asności dwóch populacji Testy porównujace ¾ oceny parametrów z dwóch prób + Testy parametryczne - testy dla dwóch średnich - testy dla dwóch proporcji - testy dla dwóch wariancji Testy oceniajace ¾ zgodność dwóch rozk adów empirycznych + Testy nieparametryczne - test Ko mogorowa-smirnowa - test jednorodności - test mediany - test serii - test znaków.1 Testy dla populacji jednowymiarowej Poni zej przedstawimy przeglad ¾ najwa zniejszych testów stosowanych do wery- kacji hipotez o w asnościach populacji jednowymiarowej.
.1.1 Testy dla średniej W testach dla średniej wery kacji poddaje si ¾e hipotez ¾e zerowa¾ postaci H 0 = 0 wobec hipotezy alternatywnej, która przyjmuje jedna¾ z trzech postaci H 1 6= 0 lub > 0 lub < 0 Statystyka testowa zale zy od trzech czynników - rozk adu cechy w populacji - znajomości odchylenia standardowego w populacji - liczebności próby Test I. W teście tym zak adamy, ze badana cecha ma rozk ad normalny o nieznanej średniej, jednak ze znanym odchyleniu, tzn. X N (; ), nieznane, znane, ponadto liczebność próby jest bez znaczenia. Jako statystyk¾e testowa¾ stosujemy wówczas statystyk¾e Z = X 0 p = X 0 p n n Decyzj¾e o odrzuceniu H 0 podejmujemy w zale zności od tego czy obliczona wartość statystyki testowej Z nale zy do przedzia u krytycznego. Przedzia krytyczny jest zale zny od postaci hipotezy alternatywnej. Ogólnie przy określaniu przedzia u dla średniej mo zemy posi kować si ¾e nast ¾epujacymi ¾ wskazówkami. Hipoteza alternatywna Obszar krytyczny H 0 6= 0 W = 1; z H 0 > 0 W = [z ; 1) H 0 < 0 W = ( 1; z ] [ z ; 1 (1) gdzie z jest kwantylem rz¾edu 1 standardowego rozk adu normalnego. Test II. W teście tym zak ada si¾e rozk ad populacji jest dowolny o nieznanej średniej oraz nieznanym odchyleniu, jednak ze liczebność próby przekracza 30. W tym przypadku jako statystyk¾e testowa¾ stosuje si ¾e statystyk¾e Z = X 0 p n; S gdzie S jest odchyleniem obliczanym z próby. W tym teście obszary krytyczne pokrywaja¾ si¾e z tymi wyst¾epujacymi ¾ w teście I. Test III. W tym przypadku zak adamy, ze badana cecha ma rozk ad normalny o nieznanych parametrach oraz ; natomiast liczebność próby nie przekracza 30. Stosujemy wówczas statystyk¾e testowa¾ T = X p 0 n 1 S 3
Obszar krytyczny równie z jest uzale zniony od postaci hipotezy alternatywnej i jest zbli zony do danych zawartych we wzorach (1), nale zy jednak zastapić ¾ z przez t ;n 1 ; gdzie t ;n 1 jest kwantylem rz¾edu 1 rozk adu t Studenta o n 1 stopniach swobody..1. Test dla proporcji Test dla proporcji s u zy do wery kacji hipotezy o udziale w ca ej populacji jednostek posiadajacych ¾ wyró zniony wariant danej cechy, co jest określane mianem frakcji, proporcji lub wskaźnika struktury. Zak ada si ¾e, ze populacja ma rozk ad dwumianowy z parametrem p oraz próba jest liczna n > 50 Wery kacji poddaje si¾e nast¾epujace ¾ hipotezy H 0 p = p 0 H 1 p 6= p 0 ; lub p > p 0 ; lub p < p 0 Jako statystyk¾e testowa¾ stosuje si ¾e statystyk¾e Z = k n p 0 p p0q 0 n gdzie k- liczba elementów wyró znionych w próbie, p 0 + q 0 = 1 Jako obszarów krytycznych u zywa si ¾e obszarów ze wzorów (1)..1.3 Test dla wariancji W teście tym zak ada si ¾e, ze rozwa zana cecha ma rozk ad normalny. Wyró znia si ¾e ponadto dwa przypadki w zale zności od liczebności próby. W przypadku próby nie przekraczajacej ¾ 30 elementów do wery kacji hipotez stosuje si ¾e statystyk¾e ; H 0 = 0 () H 1 6= 0; lub > 0; lub < 0 (3) = ns 0 = (n 1) S b ; 0 gdzie S b jest wariancja¾ nieobcia zon ¾ a¾ z próby. Dla powy zszej statystyki obszary krytyczne równie z uzale znione sa¾ od postaci hipotezy (3) i przyjmuja¾ nast¾epujac ¾ a¾ postać Hipoteza alternatywna H 0 6= 0 H 0 > 0 H 0 < 0 Obszar krytyczny W = 0; 1 [ ; 1 W = ; 1 W = 0; 4
Dobór poszczególnych przypadków precyzuja¾ poni zsze rysunki Nale zy w tym miejscu jeszcze zaznaczyć, ze rozk ad wraz ze wzrostem liczby stopni swobody zbiega do rozk adu normalnego, w zwiazku ¾ z tym przy du zej próbie ( n 30 ) korzysta si¾e z przekszta cenia statystyki w statystyk¾e Z za pomoca¾ wzoru Z = p p 1 = p p n 3 Statystyka ta ma asymptotycznie rozk ad normalny N (0; 1) a przedzia y krytyczne pokrywaja¾ si¾e z tymi ze wzorów (1). 5
. Testy nieparametryczne dla wnioskowania o w asnościach populacji jednowymiarowej...1 Test serii Test losowości próby, zwany równie z testem serii Stevensa, jest przydatny w sytuacjach, gdy odnotowane wyniki eksperymentu chcemy uogólnić na wi ¾eksza¾ liczb ¾e przypadków, jednak ze przed zastosowaniem procedur wnioskowania musimy si ¾e upewnić, czy zebrane informacje spe niaja¾ postulat losowości próby. W zwiazku ¾ z tym dokonujemy wery kacji nast ¾epujacych ¾ hipotez H 0 dobór jednostek do próby jest losowy H 1 dobór jednostek do próby nie jest losowy Wartość statystyki z próby wyznaczamy w nast ¾epujacy ¾ sposób 1. Kolejno zapisane n obserwacji zmiennej losowej ciag ej ¾ tworzy ciag ¾ podstawowy;. Obserwacje porzadkujemy ¾ i wyznaczamy median ¾e; 3. W ciagu ¾ podstawowym oznaczamy wartości literami A i B zgodnie z poni zsza¾ zasada ¾ x i < Me! A x i = Me x i > Me! B! pomijamy 4. Dla nowego ciagu ¾ liter A i B zliczamy liczb ¾e serii k, która jest wartościa¾ statystyki otrzymana¾ z próby. Obszarem krytycznym jest zbiór spe niajacy ¾ relacje P (k k 1 ) = oraz P (k k ) = ; gdzie k 1 ; n A; n B oraz k 1 ; n A; n B odczytujemy ze stosownych tablic... Testy zgodności Testy te s u z a¾ do wery kacji hipotez odnoszacych ¾ si ¾e do postaci rozk adu badanej cechy w populacji. Ich budowa opiera si ¾e na ocenie zgodności rozk adu empirycznego, otrzymanego z próby losowej, z rozk adem teoretycznym o określonej postaci. Omówimy najcz¾eściej stosowane testy test zgodności oraz test zgodności Ko mogorowa-smirnowa. Test zgodności Test ten opiera si¾e na statystyce, która ma graniczny rozk ad Test ten mo ze być stosowany zarówno dla zmiennych skokowych, jak i ciag ych. ¾ Wymaga on aby próba losowa by a du za a wyniki pogrupowane w szereg rozdzielczy. Test ten buduje si¾e w nast¾epujacy ¾ sposób 1. Z populacji o nieznanej dystrybuancie F losowana jest du za n elementowa próba prosta. Wyniki próby zostaja¾ pogrupowane w szereg rozdzielczy o k przedzia ach, tak aby n i 8 Szereg ten przedstawia rozk ad empiryczny badanej zmiennej. 6
. Na podstawie szeregu rozdzielczego estymuje si¾e p-stwa p i za o zonego teoretycznego rozk adu. W przypadku zmiennej losowej ciag ej ¾ p i = P (x i0 X < x i1 ) = F (x i1 ) F (x i0 ) 3. Dla ka zdej klasy oblicza si¾e liczebności teoretyczne bn i = np i 4. Oblicza si ¾e wartość statystyki = kx (n i bn i ) bn i 5. Porównuje si¾e wartość obliczonego z i je zeli to odrzucamy hipotez¾e H 0 mówiac ¾ a¾ o zgodności rozk adów. Test zgodności Ko mogorowa-smirnowa Test ten jest przeznaczony dla zmiennych losowych typu ciag ego ¾ i du zych prób. Jego budowa sprowadza si ¾e do nast¾epujacych ¾ punktów. 1. Z populacji o nieznanej ciag ej ¾ dystrybuancie wybieramy n-elementowa¾ du z a¾ prób ¾e losowa¾ i tworzymy szereg rozdzielczy o prawych końcach x i ; i = 1; ; ; k;. Dla ka zdego x j obliczmy wartości dystrybuanty empirycznej; 3. Analizujemy bezwzgl ¾edne ró znice dystrybuanty empirycznej i teoretycznej D = sup jf n (x) F 0 (x)j i obliczamy wartość statystyki = D p n Statystyka przy za o zeniu prawdziwości hipotezy zerowej ma rozk ad graniczny Ko mogorowa. 4. Je zeli to odrzucamy H 0, co oznacza, ze badany rozk ad jest inny ni z za o zony, przy czy jest odczytywana z tablic rozk adu Ko mogorowa..3 Testy parametryczne dla porównywania w asności dwóch populacji.3.1 Testy dla dwóch średnich. W tej grupie testów zak ada si¾e, ze pobrano n 1 elementowa¾ prób ¾e z populacji o nieznanej średniej 1 oraz n elementowa¾ prób ¾e z rozk adu o średniej Hipoteza zerowa przyjmuje postać H 0 1 = wobec hipotezy alternatywnej, która podobnie jak w przypadku jednowymiarowym mo ze przyjać ¾ jedna¾ z trzech postaci H 1 1 6= lub 1 > lub 1 < 7
Konstrukcja statystyki testowej zale zy od nast ¾epujacych ¾ czynników 1. Czy znamy wariancje w populacjach?. Czy rozk ady badanej zmiennej w populacjach sa¾ normalne? 3. Czy mo zna wnioskować, ze wariancje w próbach sa¾ jednakowe? 4. Czy próby sa¾ du ze, czy te z ma e? Test I. Zak adamy, ze próby pochodza¾ z populacji o rozk adach normalnych N ( 1 ; 1 ) oraz N ( ; ), przy czym wariancje 1, sa¾ znane. Wówczas zmienna losowa ró znicy średnich X 1 X ma rozk ad normalny z parametrami E X 1 X = 1 D X 1 X = 1 n 1 + n Wyznaczamy wartość statystyki testowej Z = X 1 X q 1 n 1 + n Obszar krytyczny pokrywa si ¾e z przypadkami omówionymi we wzorach (1). Test II. Test ten jest stosowany, gdy badane sa¾ dwie du ze próby o nieznanych wariancjach, ale zak adamy, ze nie sa¾ one równe 1 6= W takim przypadku do wery kacji hipotezy H 0 1 = stosuje si¾e statystyk¾e i dalej post¾epujemy jak w teście I. Z = X 1 X q S 1 n 1 + S n Test III. Je zeli populacje maja¾ rozk ady normalne N ( 1 ; ) oraz N ( ; ) o nieznanych, ale równych wariancjach to wówczas prawdziwe sa¾ nast¾epujace ¾ w asności E X 1 X = 1 D X 1 X = 1 + 1 n 1 n oraz estymator wariancji zadany jest wzorem S = n 1S 1 + n S n 1 + n Gdy próby sa¾ ma e to do wery kacji hipotez stosujemy statystyk¾e T = X 1 X r n 1S 1 +ns n 1+n 1 n 1 + 1 n 8
o rozk adzie t-studenta z = n 1 + n stopniami swobody. Test IV. W odró znieniu od testu III zak adamy, ze próby sa¾ du ze. W takim przypadku jako statystyki testowej u zywamy statystyki Z = X 1 X p n1 S 1 + n S p n1 n Statystyki tej mo zna równie z u zywać w przypadku, gdy populacje nie maja¾ rozk adu normalnego. Test V. Rozwa zmy dwie ma e próby z populacji o rozk adach normalnych i ró znych (nieznanych) wariancjach. W takim przypadku do wery kacji hipotez stosuje si ¾e statystyk¾e X 1 X = 6 t = q S 1 S 1 n 1 1 n 1+1 + S 1 n 1 1 + S n 1 natomiast liczb ¾e stopni swobody ustala si ¾e ze wzoru 3 gdzie dxe oznacza zaokraglenie ¾ w gór¾e. n 1 1 + S n 1 S n 1 n +1 ; 7.3. Testy dla dwóch proporcji Rozwa zmy dwie populacje o rozk adach dwumianowych z nieznanymi parametrami p 1, p Z populacji tych pobrano niezale znie dwie próby proste o liczebnościach n 1, n 100 Dla wybranych prób ustalono wskaźniki (frakcje) p 1 = k 1 n 1 oraz p = k n Na podstawie dost ¾epnych danych chcemy zwery kować hipotez ¾e o równości wskaźników struktury H 0 p 1 = p H 1 p 1 6= p lub p 1 > p lub p 1 < p Dowodzi si¾e, ze zmienna losowa b ¾ed aca ¾ ró znica¾ dwóch wskaźników struktury (p 1 p ) gdy n 1! 1 i n! 1 na rozk ad asymptotycznie normalny z parametrami E (p 1 p ) = p 1 p D (p 1 p ) = p 1 (1 p 1 ) n 1 + p (1 p ) n 9
Nale zy w tym miejscu zauwa zyć, ze je zeli hipoteza zerowa jest prawdziwa, czyli p 1 = p = p to wartość oczekiwana wynosi zero zaś wariancja D (p 1 p p (1 p) p (1 p) 1 ) = + = p (1 p) + 1 n 1 n n 1 n Dla du zych prób wartość p ustala si¾e z nast¾epujacego ¾ wzoru p = k 1 + k n 1 + n Statystyka¾ testowa¾ s u z ac ¾ a¾ wery kacji hipotez jest wówczas p 1 p Z = r 1 p (1 p) n 1 + 1 n Jak atwo zauwa zyć ma ona asymptotycznie rozk ad N (0; 1) ;w zwiazku ¾ z tym obszar krytyczny ustala si ¾e na podstawie wzorów (1)..3.3 Test dla dwóch wariancji Test ten stosuje si ¾e do porównania rozproszenia badanej cechy w dwóch populacjach. Szczególne znaczenie tego testu wynika z faktu, ze we wnioskowaniu statystycznym cz ¾esto mamy do czynienia z za o zeniem dotyczacym ¾ równości wariancji zmiennych losowych. Na przyk ad, postać statystyki testowej przy wnioskowaniu o średnich w dwóch populacjach jest uzale zniona mi ¾edzy innymi od tego, czy mo zemy za o zyć, ze wariancje sa¾ równe 1 = ; czy te z ró znia¾ si¾e one mi¾edzy soba¾ 1 6= Zak adamy, ze mamy do czynienia z dwiema populacjami o rozk adach normalnych N ( 1 ; 1 ) oraz N ( ; ), przy czym parametry rozk adów nie sa¾ znane. Hipoteza zerowa zak ada, ze wariancja w badanych populacjach sa¾ jednakowe. Hipoteza alternatywna zaprzecza temu za o zeniu. H 0 1 = ; H 1 1 6= lub 1 > lub 1 < Z populacji zosta y pobrane niezale zne dwie próby proste o liczebnościach odpowiednio n 1 i n Przy wery kacji hipotezy zerowej korzysta si¾e ze statystyki F-Snedecora. Zmienna¾ losowa¾ o rozk adzie F-Snedecora de niuje si ¾e jako iloraz dwóch niezale znych zmiennych losowych U i V o rozk adach z liczba¾ stopni swobody 1 = n 1 1 i = n 1 odpowiednio F = U v 1 V v Je zeli jako niezale zne zmienne losowe przyjmie si ¾e statystyki z prób U = (n 1 1) b S 1 10
V = (n 1) S b ; które maja¾ rozk ad ;oraz za o zy si¾e równość wariancji w populacjach 1 = = ;to wówczas statystyka F przybiera postać S F = b 1 bs Przy za o zeniu prawdziwości hipotezy zerowej statystyka ta ma rozk ad F-Snedecora z liczba¾ stopni swobody 1 = n 1 1 i = n 1 Wartość statystyki z próby porównuje si ¾e z wartościa¾ krytyczna¾ testu, odczytywana¾ z tablic F-Snedecora. Obszar krytyczny uzale zniony jest oczywiście od postaci hipotezy alternatywnej. Wyboru obszaru krytycznego dokonujemy zgodnie z poni zszymi rysunkami (4) 11
Przy badaniu równości dwóch wariancji mo zna zastosować równie z bardziej ogólne testy s u z ace ¾ do badania równości kilku wariancji. Przyk adami tego typu testów sa¾ test Bartletta, test Levena, czy te z test Hartleya..3.4 Test Bartletta W teście tym testujemy hipotezy H 0 1 = = = k (5) H 1 s 1 = = = k W teście tym liczebności poszczególnych k prób moga¾ być ró zne, jako statystyk¾e testowa¾ stosuje si ¾e statystyk¾e kp (N k) ln s p (N i 1) ln s i = kp ; 1 + 1 1 1 3(k 1) N i 1 N k P gdzie N i dla i = 1; ; ; k oznacza liczebności poszczególnych prób, N = k N i ; s i oznacza wariancj¾e z i-tej próby, Obszar krytyczny wynosi.3.5 Test Levena s p = kx (N i 1) s i N k W = 1 ;k 1; 1 Test ten jest innym przyk adem testu s u z acego ¾ do wery kacji hipotez (5) i jest alternatywa¾ dla testu Bartletta. Jako statystyk¾e testowa¾ stosuje si ¾e statystyk¾e P (N k) k N i Z i Z W = ; P (k 1) k PN i Z ij Z i j=1 gdzie Z ij = Xij X i lub Zij = jx ij MeX i j ; Z i = PN i Z ij j=1 N j ; 1
Z = Obszarem krytycznym tego testu jest.3.6 Test Hartleya kp Z i k W = (F ;k 1;N k ; 1) Test ten jest stosowany do wery kacji hipotez (5) w przypadku równolicznych prób. Jako statystyk¾e testowa¾ rozwa za si ¾e statystyk¾e gdzie F = s max s ; min s max = max s 1; s ; ; s k ; s min = min s 1; s ; ; s k Obszarem krytycznym testu jest przedzia wyznaczany zgodnie z rysunkiem (4)..4 Testy nieparametryczne dla porównania w asności dwóch populacji Porównujac ¾ ze soba¾ dwie populacje, mo zemy oceniać zgodność rozk adów badanej cechy w tych populacjach. Wnioskujac ¾ na podstawie prób niezale znych wykorzystujemy testy nieparametryczne zwane równie z testami jednorodności. W testach tych nie wyst ¾epuja¾ zazwyczaj za o zenia dotyczace ¾ postaci rozk adu, z ma ym wyjatkiem ¾ polegajacym ¾ na tym, ze w wi¾ekszości testów zak ada si¾e ciag ość ¾ badanej cechy. Testy jednorodności s u z a¾ do wery kacji hipotezy zak adajacej ¾ zgodność rozk adów, co zapisujemy H 0 F 1 (x) = F (x) (6) H 1 F 1 (x) 6= F (x) Podstawa¾ budowy statystyk w testach jednorodności sa¾ dwie próby niezale zne, spośród wielu dost ¾epnych w literaturze testów ograniczymy si ¾e tylko do wybranych, a mianowicie testu ; testu Ko mogorowa-smirnowa, testu Smirnowa, testu serii oraz testu mediany. Pierwsza dwa sa¾ stosowane dla du zych prób, pozosta e zaś dla prób ma o licznych..4.1 Test jednorodności Jest to chyba najbardziej uniwersalny test jednorodności, poniewa z mo ze być stosowany zarówno dla cech ilościowych jak i jakościowych. Wery kujac ¾ hipotez ¾e (6) post¾epujemy nast¾epujaco ¾ 13
1. Wyniki dwóch niezale znych prób prostych grupujemy w jednakowe przedzia y klasowe, tak aby liczebność ka zdego przedzia u by a niemniejsza od 5 (n i 5). Obliczamy wartość statystyki testowej określonej wzorem = (n 1 + n ) n 1 n " kx n 1i n 1i + n i n 1 n 1 + n gdzie n 1 liczebność pierwszej próby; n liczebność drugiej próby; n 1i liczebność kolejnych przedzia ów w pierwszej próbie n i liczebność kolejnych przedzia ów w drugiej próbie. Przy za o zeniu prawdziwości hipotezy H 0 statystyka ta ma rozk ad z v = k 1 stopniami swobody. 3. Obszar krytyczny testu jest prawostronny, bowiem du ze wartości statystyki sa¾ powodowane du zymi ró znicami pomi ¾edzy obiema próbami. Wartość krytyczna¾ odczytuje si¾e w tablic rozk adu Je zeli, to odrzucamy hipotez¾e zerowa, ¾ zak adajac ¾ a¾ zgodność rozk adów w badanych populacjach; ró znice pomi¾edzy nimi sa¾ statystycznie istotne, czyli pochodza¾ z populacji o ró znych rozk adach. # ;.4. Test Ko mogorowa-smirnowa Test ten jest stosowany do wery kacji hipotezy o zgodności rozk adów dwóch zmiennych losowych. Zak ada si ¾e przy tym, ze obie zmienne losowe maja¾ ciag e ¾ dystrybuanty F 1 oraz F odpowiednio. Dodatkowo zak ada si¾e, ze próby proste pobrano niezale znie od siebie oraz liczebności tych prób n 1, n sa¾ du ze. Wery- kacja hipotezy o zgodności rozk adów sprowadza si¾e do nast¾epujacej ¾ procedury 1. Wyniki dwóch du zych prób o liczebnościach n 1 oraz n grupujemy w szeregi rozdzielcze przedzia owe, wskazane jest przy tym, aby poszczególne klasy by y stosunkowo waskie. ¾. Dla ka zdego przedzia u obliczamy wartości empiryczne dystrybuant F 1 oraz F jako iloraz liczebności skumulowanych oraz liczebności odpowiedniej próby, w prawych końcach przedzia ów, tj F 1 (x k ) = kp n 1i n 1 ; F (x k ) = kp n i n 3. Obliczamy bezwzgl ¾edne ró znice dystrybuant i wyznaczamy ich suprememu D = sup jf 1 (x k ) F (x k )j ; 1kn a nast ¾epnie na tej podstawie wyznaczamy wartość statystyki = D p n; 14
gdzie n = n1n n 1+n Przy za o zeniu zgodności rozk adów statystyka ma asymptotyczny rozk ad -Ko mogorowa. 4. Dla danego poziomu istotności wyznaczamy obszar krytyczny testu, wartość krytyczna¾ wyznaczamy w taki sposób, aby spe niona by a relacja P ( ) = Obszar krytyczny jest prawostronny, stad ¾ te z hipotez¾e zerowa¾ odrzucamy jeśli Nale zy w tym miejscu zauwa zyć, ze test ten mo zna równie z zastosować w przypadku ma ych prób. Jednak ze w tym przypadku procedura post ¾epowania jest nieco odmienna. 1. Porzadkujemy ¾ wyniki próby rosnaco ¾.. Dla kolejnych wyników ka zdej próby liczymy liczebności skumulowane i obliczamy wartości dystrybuant empirycznych. 3. Wyznaczamy wartość statystyki D jak w przypadku du zych prób i dalej post ¾epujemy analogicznie jak w przypadku du zych prób..4.3 Test serii Walda-Wolfowitza Test Walda-Wolfowitza jest jednym z wielu testów opartych na teorii serii. Stosujemy go wtedy, gdy o zgodności dowolnych rozk adów badanej cechy wnioskujemy na podstawie ma ych prób, o liczebnościach n 1 0 oraz n 0 Korzystanie z tego testu sprowadza si¾e do nast¾epujacej ¾ procedury. 1. Wyniki obu prób porzadkujemy ¾ w niemalejacy ¾ sposób. W otrzymanym ciagu ¾ przyporzadkowujemy ¾ liter ¾e A wynikom pochodzacym ¾ z pierwszej próby, zaś liter ¾e B wynikom drugiej próby.. Wyznaczmy liczb ¾e serii k. W tym przypadku seri ¾e stanowia¾ elementy pochodzace ¾ z danej próby. 3. W rozk adzie liczby serii wyznaczamy obszar krytyczny testu, który jest w tym przypadku lewostronny. Po o zenie obszaru krtytycznego wynika z faktu, ze je zeli próby pochodza¾ z zupe nie ró znych populacji, to wyniki zazwyczaj ró znia¾ si¾e mi¾edzy soba¾ w sposób znaczacy ¾ i serii b ¾edzie wtedy niewiele. Im bardziej zbli zone do siebie wyniki obu prób, tym bardziej zostana¾ one "wymieszane" i serii b ¾edzie wi¾ecej. 4. Je zeli wyznaczona na podstawie prób liczba serii jest nie wi ¾eksza od wartości krytycznej k k ; odrzucamy hipotez¾e zerowa, ¾ czyli stwierdzamy, ze próby pochodza¾ z populacji, w których rozk ady badanej cechy ró znia¾ si¾e statystycznie istotnie. Je zeli n 1 i n > 0; to rozk ad liczby serii z prób jest w przybli zeniu normalny i wery kacja hipotezy o zgodności dystrybuant opiera si ¾e na statystyce Z; która ma rozk ad asymptotyczny N (0; 1) Z = jk EKj K ; 15
gdzie EK = n 1n n 1 + n + 1; K = n 1n (n 1 n n 1 n ) (n 1 + n ) (n 1 + n 1) 16