Testowanie hipotezy o rozkładzie Poissona w oparciu o statystykę Cramera von Misesa

Podobne dokumenty
Statystyka matematyczna. Wykład VI. Zesty zgodności

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna dla leśników

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

STATYSTYKA

Rozkłady statystyk z próby

Wykład 3 Hipotezy statystyczne

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Wykład 10 Testy jednorodności rozkładów

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Wnioskowanie statystyczne. Statystyka w 5

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

Kolokwium ze statystyki matematycznej

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

1 Estymacja przedziałowa

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Testowanie hipotez statystycznych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wprowadzenie do analizy korelacji i regresji

ZGODNOŚĆ WYNIKÓW TESTOWANIA HIPOTEZY O ROZKŁADZIE NORMALNYM DLA WYBRANYCH TESTÓW STATYSTYCZNYCH

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez statystycznych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Test t-studenta dla jednej średniej

Testy nieparametryczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Własności statystyczne regresji liniowej. Wykład 4

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Rozkłady statystyk z próby. Statystyka

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Testowanie hipotez statystycznych.

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Estymacja parametrów w modelu normalnym

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Testy dla dwóch prób w rodzinie rozkładów normalnych

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Testowanie hipotez statystycznych.

Statystyka matematyczna i ekonometria

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład 9 Testy rangowe w problemie dwóch prób

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Właściwości testu Jarque-Bera gdy w danych występuje obserwacja nietypowa.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Testowanie hipotez statystycznych. Wprowadzenie

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Zadania ze statystyki, cz.6

Transkrypt:

ROGOWSKI Andrzej 1 Testowanie hipotezy o rozkładzie Poissona w oparciu o statystykę Cramera von Misesa WSTĘP Testowanie hipotez o typie rozkładu zmiennej losowej tzw. testy zgodności lub dopasowania jest jednym z podstawowych działów statystyki, mającym olbrzymie znaczenie praktyczne wszędzie tam, gdzie bezpośrednio lub pośrednio wykorzystuje się własności probabilistyczne badanych zmiennych. Często wynik testu jest podstawą decyzji o zastosowaniu konkretnego aparatu matematyki lub stwierdzenia niemożności jego stosowania. Dotyczy to nie tylko obszaru transportu (szerzej logistyki), choć w tym obszarze wyraźnie przejawia się to w dyskusjach nad możliwością zastosowania procesów Poissona. W stosunku do pierwszych dekad XX wieku statystyka wypracowała szereg nowych efektywnych narzędzi-testów. Jednak problemem pozostaje ich stosowanie przez praktyków inżynierów czy badaczy nieposiadających wykształcenia matematycznego z zakresu statystyki matematycznej. W znacznej mierze wina leży po stronie matematyków, którzy nie przywiązują wagi do rozpowszechniania nowych wyników (poza środowiskiem matematycznym). Związane jest to też z coraz powszechniejszym stosowaniem pakietów statystycznych, które w pewien sposób zwalniają praktyków od poszukiwań nowych rozwiązań z obszaru statystyki. Jeśli już takowe zostaną podjęte, to na ogół ograniczają się do książek z zakresu statystyki. O ile w przypadku testowania hipotez o rozkładach ciągłych znanych jest w ogólnodostępnej literaturze co najmniej kilkanaście testów, a w przypadku tzw. testów normalności kilkadziesiąt (uwzględniając różne modyfikacje tego samego testu w zależności od postaci hipotezy), to w przypadku hipotez dotyczących rozkładów dyskretnych znany jest tylko jeden test chi-kwadrat Pearsona. Jednak nawet w przypadku rozkładów ciągłych (przynajmniej w obszarze transportu i nauk pokrewnych) króluje test λ Kołmogorowa jeden z najsłabszych testów, dodatkowo obarczonych różnego rodzaju sprzecznymi interpretacjami warunków stosowalności, a w przypadku testów normalności również (poza testem λ Kołmogorowa i jego modyfikacją Kołmogorowa Lillieforsa) mocny test Shapiro Wilka (choćby z tego powodu, że jest dostępny w pakietach statystycznych) ale o wykorzystaniu przez praktyków testu Eppsa Pulleya, jednego z najsilniejszych testów normalności, polecanego przez normę PN-ISO 5479, autor nie słyszał 2. Test chi-kwadrat Pearsona (1900) jest jednym z najstarszych (jeśli nie najstarszym) testów statystycznych. Jest testem uniwersalnym, tzn. można go stosować zarówno do weryfikacji hipotez o rozkładzie ciągłym, jak i dyskretnym, do hipotez prostych, jak i złożonych. Jednak jest testem słabym, wymagającym licznej próby (ponad 100) i grupowania wyników próby w rozłączne klasy co dodatkowo powoduje utratę informacji 3. O ile stosowanie testu chi-kwadrat w przypadku rozkładów dyskretnych można uzasadnić brakiem w dostępnej ogólnej literaturze innych testów dotyczących hipotez o rozkładzie dyskretnym, to stosowanie tego testu wobec rozkładów ciągłych jest niezrozumiałe. Jednak również w przypadku rozkładów dyskretnych istnieją od co najmniej 20 lat testy mocniejsze niż test chi-kwadrat Pearsona zarówno dla dowolnych rozkładów dyskretnych, jak ściśle określonych, np. dwumianowego czy Poissona [1, 3, 4, 5, 11, 12, 13]. Z punktu widzenia zastosowań w transporcie i nauk pokrewnych szczególnie istotne jest weryfikowanie hipotezy o rozkładzie Poissona. Przy czym istotne jest, by weryfikacja brak podstaw do odrzucenia hipotezy, 1 dr hab. inż., Uniwersytet Technologiczno-Humanistyczny im. Kazimierza Pułaskiego w Radomiu, Wydział Transportu i Elektrotechniki; 26-600 Radom; ul. Malczewskiego 29. Tel: + 48 48 361-77-85, Fax: + 48 48 361-77-39, a.rogowski@uthrad.pl 2 Na temat kontrowersji stosowania testu λ Kołmogorowa i porównania mocy zob. [6, 7, 8, 9, 10]. 3 Szerzej na temat stosowalności testu chi-kwadrat Pearsona zob. [9]. 4162

że próba pochodzi z populacji rozkładzie Poissona nie była tylko alibi dla przyjętego, uproszczonego modelu. Stąd istotne jest użycie najlepszych dostępnych testów służących do weryfikacji takiej hipotezy. Test chi-kwadrat Pearsona takim narzędziem nie jest. W niniejszym artykule autor przedstawi testy statystyczne, oparte na statystyce Cramera von Misesa, służące do weryfikacji hipotezy o rozkładzie Poissona wraz z dyskusją ich mocy w zależności od hipotezy alternatywnej i w kontekście innych testów stosowanych do weryfikacji takiej hipotezy testy te są istotnie mocniejsze niż test chi-kwadrat. Zasadnicze wyniki pochodzą z pracy [12]. 1. TESTY OPARTE NA STATYSTYCE CRAMERA VON MISESA Statystyka Cramera von Misesa dla rozkładów ciągłych (po raz pierwszy zaproponowana przez Cramera w 1928) należy do grupy testów opartych na dystrybuancie empirycznej 4 (ang. EDF Empirical Distribution Function), które mierzą różnice między dystrybuantą hipotetyczna (teoretyczną) a dystrybuanta empiryczną (do tej grupy należy również test λ Kołmogorowa). Ogólna postać statystyki jest następująca: (1) gdzie dystrybuanta empiryczna określona wzorem próba prosta funkcja wagi (2) Jeśli funkcja wagi, to statystyka nazywana jest statystyką Cramera von Misesa, gdy to statystyka nazywana jest statystyką Andersona Darlinga. W przypadku testowania hipotezy o rozkładzie Poissona zdefiniowano następujące statystyki oparte o statystykę [12]: (3) (4) (5) (6) gdzie prawdopodobieństwo przyjęcia wartości j w rozkładzie Poissona z parametrem > 0 (wartość średnia) przy prawdziwości hipotezy zerowej określone przez liczba elementów w próbie równych j 4 Szerzej na temat testów opartych na statystyce Cramera von Misesa dla rozkładów ciągłych zob. [9]. 4163

oczekiwana liczba elementów w próbie równych j, n liczność próby W przypadku hipotezy prostej, μ jest wartością średnią rozkładu zdefiniowaną w hipotezie zerowej. W przypadku hipotezy złożonej, wartość średnią μ należy oszacować na podstawie próby metodą największej wiarygodności estymatorem tym jest średnia arytmetyczna z próby. Ponieważ rozpatrywane statystyki są szeregami nieskończonymi (zbieżnymi) w praktyce zamieniane są na sumy skończone. Proponuje się [12] zakończyć sumowanie, gdy zarówno dla hipotezy prostej, jak i złożonej. Wartości średnie wymienionych statystyk nie zależą od liczności próbki n, natomiast w istotny sposób (i rozkłady graniczne) zależą od wartości parametru μ. Stąd wyznaczając wartości krytyczne testów należy uwzględnić wartość μ dla hipotez prostych i dla hipotez złożonych. Dla prób o bardzo małej liczności, wartości krytyczne nieznacznie różnią się od wartości krytycznych dla rozkładów granicznych. Wartości krytyczne dla wybranych poziomów istotności, wartości średnich i hipotezy prostej i złożonej odpowiednio zamieszczono w tabeli 1 i tabeli 2. Tab. 1. Graniczne wartości krytyczne testów,,, dla testowania hipotezy o rozkładzie Poissona dla wybranych poziomów istotności α i wartości średniej μ hipoteza prosta [12] 0,1 0,104 0,164 0,209 0,300 0,338 0.518 0,614 0,841 0,009 0,015 0,019 0,027 0,031 0,047 0,056 0,076 0,5 0,222 0,333 0,427 0,597 0,769 1,013 1,199 1,435 0,070 0,106 0,137 0,193 0,250 0,329 0,389 0,533 1 0,228 0,317 0,391 0,523 0,660 0,848 0,993 1,339 0,097 0,133 0,163 0,215 0,269 0,342 0,399 0,533 2 0,216 0,297-0,365 0,486 0,614 0,788 0,923 1,243 0,104 0,135 0,159 0,201 0,243 0,299 0,340 0,441 5 0,212 0,289 0,354 0,471 0,593 0,760 0,889 1,196 0,106 0,133 0,155 0,193 0,230 0,280 0,317 0,405 10 0,211 0,286 0,350 0,466 0,587 0,751 0,879 1,181 0,106 0,132 0,154 0,190 0,226 0,274 0,310 0,394 20 0,210 0,280 0,349 0,464 0,584 0,747 0,874 1,175 0,105 0,132 0,153 0,188 0,224 0,271 0,307 0,390 50 0,211 0,285 0,348 0,462 0,582 0,744 0,871 1,171 0,105 0,131 0,152 0,187 0,223 0,269 0,305 0,387 100 0,210 0,284 0,348 0,462 0,581 0,744 0,870 1,169 0,105 0,131 0,152 0,187 0,222 0,269 0,304 0,387 0,209 0,284 0,347 0,461 0,581 0,743 0,869 1,167 0,105 0,131 0,152 0,187 0,222 0,268 0,304 0,385 0,1 0,119 0,184 0,238 0,336 0,439 0,587 0,684 0,767 1,303 1,982 2,557 3,589 4,664 6,128 7,260 8,436 0,5 0,442 0,632 0,792 1,087 1,378 1,797 2,115 2,769 1,320 1,836 2,265 3,035 3,838 4,936 5,787 7,805 1 0,689 0,939 1,146 1,513 1,896 2,421 2,825 3,789 1,311 1,758 2,124 2,783 3,467 4,379 5,127 6,849 2 0,993 1,320 1,593 2,081 2,593 3,266 3,836 5,124 1,284 1,688 2,025 2,627 3,257 4,123 4,787 6,376 5 1,575 2,077 2,497 3,252 4,042 5,126 5,960 7,943 1,262 1,647 1,968 2,544 3,146 3,970 4,609 6,124 10 2,229 2,932 3,52 4,582 5,691 7,209 8,382 11,171 1,255 1,634 1,950 2,518 3,111 3,924 4,548 6,046 20 3,153 4,143 4,974 6,469 8,032 10,171 11,826 15,752 1,252 1,628 1,942 2,505 3,094 3,901 4,525 6,008 50 4,985 6,549 7,860 10,218 12,685 16,059 18,680 24,868 1,249 1,624 1,936 2,497 3,084 3,887 4,511 5,985 100 7,051 9,260 11,113 14,445 17,932 22,702 26,403 35,151 1,249 1,623 1,935 2,495 3,081 3,882 4,391 5,977 1,248 1,610 1,933 2,492 3,070 3,857 4,500 6,000 4164

Tab. 2. Graniczne wartości krytyczne testów,,, dla testowania hipotezy o rozkładzie Poissona dla wybranych poziomów istotności α i wartości średniej hipoteza złożona [12] 0,1 0,006 0,009 0,011 0,016 0,018 0,028 0,033 0,045 0,002 0,003 0,004 0,005 0,006 0,009 0,010 0,014 0,5 0,059 0,90 0,116 0,164 0,213 0,280 0,332 0,455 0,048 0,074 0,096 0,136 0,177 0,231 0,276 0.378 1 0,088 0,123 0,152 0,203 0,257 0,330 0,289 0,556 0,081 0,115 0,143 0,194 0,246 0,319 0,375 0,507 2 0,093 0,121 0,144 0,182 0,221 0,273 0,315 0,408 0,088 0,115 0,136 0,173 0,211 0,262 0,302 0,395 5 0,094 0,119 0,139 0,172 0,206 0,251 0,285 0,366 0,089 0,113 0,132 0,164 0,196 0,240 0,274 0,352 10 0,094 0,118 0,137 0,169 0,201 0,244 0,277 0,354 0,089 0,112 0,130 0,160 0,192 0,234 0,266 0,343 20 0,094 0,117 0,135 0,167 0,199 0,241 0,273 0,349 0,089 0,111 0,128 0,159 0,189 0,231 0,263 0,338 50 0,094 0,117 0,135 0,166 0,199 0,239 0,271 0,346 0,089 0,111 0,128 0,158 0,188 0,229 0,261 0,3355 100 0,094 0,117 0,135 0,166 0,197 0,239 0,270 0,345 0,089 0,110 0,128 0,157 0,188 0,229 0,260 0,335 0,094 0,117 0,134 0,165 0,197 0,238 0,270 0,345 0,088 0,110 0,127 0,157 0,187 0,228 0,259 0,334 0,1 0,011 0,017 0,022 0,031 0,040 0,053 0,063 0,069 0,162 0,251 0,325 0,460 0,601 0,784 0,937 1,286 0,5 0,136 0,199 0,252 0,350 0,439 0,590 0,697 0,857 0,456 0,549 0,811 1,104 1,414 1,828 2,151 2,849 1 0,287 0,391 0,475 0,624 0,778 0,988 1,158 1,536 0,577 0,769 0,921 1,191 1,465 1,812 2,119 2,762 2 0,472 0,602 0,705 0,881 1,058 1,295 1,472 1,908 0,630 0,796 0,927 1,151 1,377 1,681 1,913 2,465 5 0,773 0,959 1,106 1,359 1,616 1,961 2,227 2,854 0,640 0,790 0,908 1,112 1,319 1,598 1,813 2,322 10 1,100 1,355 1,557 1,906 2,261 2,738 3,106 3,975 0,641 0,786 0,900 1,099 1,301 1,573 1,783 2,281 20 1,560 1,914 2,196 2,685 3,181 2,849 4.363 5,581 0,641 0,783 0,897 1,093 1,292 1,562 1,769 2,262 50 2,468 3,024 3,468 4,235 5,014 6,064 6,872 8,778 0,641 0,782 0,894 1,089 1,287 1,555 1,761 2,249 100 3.492 4,276 4,902 5,984 7,084 8,566 9,706 12,412 0,641 0,782 0,894 1,088 1,286 1,553 1,758 2,245 0,644 0,782 0,894 1,087 1,285 1,551 1,756 2,241 W tabelach tych, w wierszach oznaczonych symbolem znajdują się wartości krytyczne (graniczne) w przypadku testowania hipotezy dla rozkładu ciągłego. W przypadku tabeli 1 dla niemodyfikowanych statystyk odpowiednio Cramera von Misesa, Watsona i Andersona Darlinga dla hipotezy prostej dla dowolnego rozkładu ciągłego (zob. [9]). W przypadku tabeli 2 dla statystyk odpowiednio Cramera von Misesa, Watsona i Andersona Darlinga dla hipotezy złożonej o znanej wariancji, ale nieznanej średniej w przypadku testowania rozkładu normalnego (zob. [9]). 2. UWAGI O MOCY TESTÓW OPARTYCH NA STATYSTYCE CRAMERA VON MISESA W pracy [12] Spinnelli porównywał moc testów,,, dla testowania hipotezy o rozkładzie Poissona zarówno między sobą, jak i w stosunku do innych wybranych testów, m.in. chikwadrat, wariancji [3], testów opartych na funkcji tworzącej prawdopodobieństwa [4, 11], i testu gładkości (ang. smooth test of goodness-of-fit) [5]. Moc testów zależy od hipotezy alternatywnej i wartości średniej. Wyróżnił trzy klasy hipotez alternatywnych. Klasa I, gdy wartość średnia jest równa wariancji (tak jak w rozkładzie Poissona), klasa II, gdy wariancja jest mniejsza niż wartość średnia (underdispersed) i klasa III, gdy wariancja jest większa niż wartość średnia (overdispersed). Generalny wniosek z analizy mocy jest taki, że wszystkie rozpatrywane testy inne niż oparte na statystyce Cramera von Misesa przynajmniej dla jednej z klas hipotez alternatywnych miały bardzo małą moc. Spośród testów opartych na statystyce Cramera von Misesa najmocniejszym (poza 4165

przypadkami, gdy wartość średnia jest mniejsza niż 0,1) okazał się test i polecany jest jako test uniwersalny wobec wszystkich klas hipotez alternatywnych szczególną przydatność wykazuje w przypadku alternatyw z klasy I (w tym przypadku niemal równorzędny jest test. W przypadku klas II i III największą moc ma test wariancji, jednak dla alternatyw klasy I jest bardzo słaby (co jest zrozumiałe, gdyż test wykrywa różnice między wartością średnią a wariancją). Test chikwadrat okazał się bardzo słaby w stosunku do wszystkich klas hipotez alternatywnych. 3. PRZYKŁAD W pracy [2] Autor zderzył się z problem weryfikowania hipotezy, że liczba statków przebywających jednocześnie na określonym torze wodnym w określonej jednostce czasu ma rozkład Poissona. Autor zastosował test chi-kwadrat Pearsona. Problemem zasadniczym w ocenie poprawności wnioskowania przy zastosowanej metodzie jest stosunkowa mała liczność prób dla przypadku testowania hipotezy złożonej, a przede wszystkim zbyt mała liczba klas o dostatecznej liczności w poszczególnych klasach, co powodowało, że przynajmniej w jednym przypadku nie można było zastosować testu, a dla pozostałych przypadku tworzono 3 klasy, co skutkowało, że liczba stopni swobody wynosiła 1. Na poziomie istotności 0,05, we wszystkich przypadkach dla których przeprowadzono testowanie, nie było podstawy do odrzucenia hipotezy, że próba pochodzi z populacji o rozkładzie wykładniczym. Dla tych samych danych przeprowadźmy na poziomie istności 0,05 testowanie hipotezy o rozkładzie Poissona z wykorzystaniem statystyk,, i. W obliczeniach wykonanych w Excelu (również wartości w rozkładzie Poissona) we wszystkich przypadkach wykorzystano 31 składników odpowiednich sum (3) (6) 5. Ponieważ dla wszystkich prób wartość średnia jest mniejsza niż 0,6, a w tabeli 2 podano wartości krytyczne z tego zakresu jedynie dla wartości średniej 0,5 i 0,1, dla wyznaczenia wartości krytycznych dokonano aproksymacji liniowej. Wyniki testów i wyniki próbek zamieszczono w tabeli 3. Tab. 3. Wartości testów,,,, dla testowania hipotezy o rozkładzie Poissona dla rozkładu liczby statków na wybranych torach wodnych (na podstawie [2]) Wartość Liczba elementów w próbie równych j Wartość testu Nr Liczność średnia tabeli próby n 0 1 2 3 4 w próbie 3,1 0,092593 54 49 5-0,0009 0,0009 0,0290 0,0018 3,3 0,212121 99 82 13 4 3,185 0,0376 0,0373 0,5828 0,0805 3,5 0,263889 72 58 10 3 1 3,2 0,0881 0,0870 0,8910 0,1603 3,7 0,507042 71 46 18 4 2 1 1,38 0,0941 0,0930 0,7364 0,2141 3,9 0,392157 51 33 16 2 0,87 0,0338 0,0334 0,2474 0,0653 3,11 0,111111 54 49 4 1 1,93 0,0085 0,0083 0,2351 0,0174 Numer tabeli oznacza numer tabeli danych w [2]. Wartości testu podano za [2] (we wszystkich przypadkach liczba stopni swobody 1, wartość krytyczna 3,84), pozostałe obliczenia własne. Jedynie dane z tabeli 3.5 (wg numeracji [2]) mogą wskazywać, że próba nie pochodzi z rozkładu Poissona. Aproksymowane wartości krytyczne wynoszą odpowiednio 0,076639; 0,058674; 0,723861; 0,161701 i dla statystyk, i są mniejsze niż uzyskane wartości testów. Jednak wynik nie jest jednoznaczny, gdyż aproksymacja liniowa zaniża wartości krytyczne (tym silniej im wartość średnia jest bliższa wartości 0,1; w przypadku aproksymacji wykładniczej lepiej oddającej przebieg zmian wartości krytycznych dla zmian wartości średniej od 0,1 do 0,5 sytuacja jest identyczna; wartości krytyczne dla aproksymacji wykładniczej wynoszą: 0,079569, 0,060919, 0,766472, 0,177239), a ponadto graniczne wartości krytyczne są mniejsze niż wartości krytyczne dla ustalonych n (choć dla n > 50 wpływ ten jest już minimalny [12]). Dlatego ostateczną decyzję należałoby podjąć po obliczeniu wartości krytycznych dla ustalonej (dla tego przypadku) wartości średniej i liczności 5 To jest znacznie więcej niż wynikałoby to z sugestii zawartej w [12]. W rzeczywistości co najmniej od 15. składniki tych sum były równe 0 (dla dokładności obliczeń osiąganych w Excelu). 4166

próby. Należałoby również skorzystać np. z testu wariancji [3] (wariancja w tym przykładzie wynosi 0,360918 wobec wartości średniej 0,263889). WNIOSKI Z porównania mocy testów wynika, że test Andersona Darlinga może z powodzeniem być stosowany jako test uniwersalny do testowania hipotezy o rozkładzie Poissona zarówno dla hipotezy prostej, jak i złożonej. Może być również stosowany w sytuacjach, gdy test chi-kwadrat, również ze względów merytorycznych zbyt mała liczność próby, zbyt mała liczba klas, nie może być stosowany. Test ten, z wykorzystaniem np. arkusza kalkulacyjnego Excel, nie nastręcza praktycznie żadnych trudności obliczeniowych. Jedyną trudność stanowić może dysponowanie odpowiednimi tablicami wartości krytycznych. Podane tablice kwantyli rozkładów granicznych (również dla pozostałych statystyk) w zasadzie w zupełności wystarczają w przypadkach, gdy wartość średnia w rozkładzie Poissona jest większa niż 1 zarówno dla hipotez prostych, jaki złożonych bez względu na liczność próbki, gdyż różnice między rozkładem granicznym a dokładnym są bardzo małe (z punktu widzenia wnioskowania statystycznego nieistotne, gdyż jeśli wartość testu jest tak blisko wartości krytycznej, to wnioskowanie powinno być oparte na innym dodatkowym aparacie statystyki). W przypadku wartości średniej z przedziału [0,09; 1] można się posiłkować aproksymacją (liniową lub wykładniczą). Zwróćmy uwagę, że testy te można stosować nawet dla bardzo małych prób. W przypadku hipotez alternatywnych klas II i III należy posiłkować się testem wariancji. Zdecydowanie należy odradzać stosowanie testu chi-kwadrat, szczególnie dla hipotez złożonych dla małych prób, dla których stosowanie testu jest niedopuszczalne. Należy zauważyć, że dla innych hipotez o rozkładzie dyskretnym prawdopodobieństwa o nośniku skończonym bądź nieskończonym również opracowano testy inne niż test chi-kwadrat, w tym oparte na statystyce Cramera von Misesa. Streszczenie W pracy przedstawiono zasadnicze wyniki przedstawione przez Spinell ego w pracy [12] odnośnie wykorzystania statystyki Cramera von Misesa do testowania hipotezy o rozkładzie Poissona. Zdefiniowano cztery testy podając graniczne wartości krytyczne testów. Porównano moc rozpatrywanych testów i innych znanych testów zgodności do testowania hipotezy o rozkładzie Poissona. Zarekomendowano test Andersona- Darlinga jako uniwersalny test do testowania hipotezy o rozkładzie Poissona wobec dowolnej hipotezy alternatywnej. Podano przykłady wykorzystania omawianych testów do weryfikacji rozkładu liczby statków na torze wodnym w sytuacji, gdy skorzystanie z testu chi-kwadrat jest niemożliwe bądź dyskusyjne ze względów merytorycznych. Słowa kluczowe: test zgodności, statystyki Cramera von Misesa, rozkład Poissona Cramér-von Mises statistics for testing for the Poisson distribution Abstract The paper presents the basic results reported by Spinelli in the work [12] on the use of statistics Cramer-von Mises for testing for the hypothesis of Poisson distribution. Defines four tests providing asymptotic critical values test. We compared the power of the tests considered and other known compatibility tests for testing for the hypothesis of Poisson distribution. Recommended the Anderson-Darling test as a universal test for testing for the hypothesis of Poisson distribution against any alternative hypothesis. Are examples of the use of these tests to verify the distribution of the number of ships on the fairway where the use of the chi-square test is not possible or doubtful on the merits. Keywords: goodness-of-fit test, Cramér-von Mises statistics, Poisson distribution BIBLIOGRAFIA 1. Choulakian V., Lockhart R. A., Stephens M. A., Cramér-von Mises statistics for discrete distributions, Canadian Journal of Statistics, Vol. 22, No 1, 1994, pp. 125-137. 4167

2. Kasyk L., Probabilistyczne metody modelowania parametrów strumienia ruchu statków na akwenach ograniczonych, Uniwersytet Technologiczno-Humanistyczny im. Kazimierza Pułaskiego w Radomiu, Wydawnictwo 2012, ISBN 978-83-7351-521-5. 3. Kendall M. G., Stuart A., The Advanced Theory of Statistics, Vol 2, 4 th edition, Charles Griffin & Company Limited, London 1979. 4. Nakamura M., Perez-Abreu V., An empirical probability generating function approach for testing a Poisson model, Canadian Journal os Statistics, Vol 21, 1993, pp. 149-156. 5. Rayner J. C. W., Best D. J., Smooth Tests of Goodness of Fit, Oxford University Press, New York 1989. 6. Rogowska R., Rogowski A., Zgodność wyników testowania hipotezy o rozkładzie normalnym dla wybranych testów statystycznych, Logistyka nr 3/2011 (Logistyka nauka, materiały VIII Konferencji Naukowo-Technicznej Logitrans Logistyka, Systemy Transportowe, Bezpieczeństwo w Transporcie), s. 2317-2338, ISSN 1231-5478. 7. Rogowski A., Comments on the power of Kolmogorov test, Scientific Letters of the University of Žilina 3 (2013) p. 90 95, ISSN 1335-4205. 8. Rogowski A., Compliance of the results of hypothesis testing with exponential distribution for selected statistical tests, The Archives of Transport Volume 24 (2012), Issue 4, p. 531-551, ISSN 0866-9546. 9. Rogowski A., Podstawy metod probabilistycznych w transporcie, Uniwersytet Technologiczno- Humanistyczny im. Kazimierza Pułaskiego w Radomiu, Wydawnictwo 2012, ISSN 1642-5278. 10. Rogowski Andrzej, Moc testu Kołmogorowa dla weryfikowania hipotezy o rozkładzie wykładniczym prawdopodobieństwa, Autobusy Technika, Eksploatacja, Systemy Transportowe nr 3/2013, s. 1193 1202, ISSN 1509-5878. 11. Rueda R., Perez-Abreu V., O Reilly F., Goodness of fit for the Poisson distribution based on the probability generating function, Comm. Statist. Theory Methods, A20, 1991, pp. 3093-3110. 12. Spinelli J. J., Cramér-von Mises statistics for discrete distributions, Department of Mathematics and Statistics, Simon Fraser University, Burnaby, British Columbia 1994, ISBN 0-612-01156-9. 13. Spinelli J. J., Regression and EDF Tests of Fit. M.SC. Thesis, Department of Mathematics and Statistics, Simon Fraser University, Burnaby, British Columbia 1980. 4168