TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Podobne dokumenty
Testy nieparametryczne

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Przykład 1. (A. Łomnicki)

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Wydział Matematyki. Testy zgodności. Wykład 03

STATYSTYKA MATEMATYCZNA

Badania eksperymentalne

Wykład 10 Testy jednorodności rozkładów

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka matematyczna. Wykład VI. Zesty zgodności

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

1 Estymacja przedziałowa

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Testowanie hipotez statystycznych cd.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyczna analiza danych

VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

Wykład 9 Testy rangowe w problemie dwóch prób

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Wykład 3 Hipotezy statystyczne

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Wykład 11 Testowanie jednorodności

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka w zarządzaniu : pełny wykład / Amir D. Aczel. wyd. 1, dodr. 5. Warszawa; Spis treści

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna i ekonometria

STATYSTYKA MATEMATYCZNA

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Ekonometria. Zajęcia

Test t-studenta dla jednej średniej

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Testowanie hipotez statystycznych

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Zadania ze statystyki cz.8. Zadanie 1.

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Elementarne metody statystyczne 9

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Kolokwium ze statystyki matematycznej

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Transkrypt:

TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe miały rozkład normalny. Jeżeli wielkość próby jest mała, to znaczenie tego założenia dla poprawności testu (pytanie: co w tym przypadku oznacza określenie poprawność testu?) jest duże.

Testy Manna-Whitney a oraz Kruskala-Wallisa stanowią, odpowiednio, alternatywę dla testu równości dwóch średnich wykorzystującego statystykę t oraz ANOVA. Ich istotą jest porównywanie rang zmiennych zamiast porównań ich wartości. Jednym z celów tego zabiegu jest osłabienie wpływu wartości nietypowych na wynik oraz uniezależnienie tego wyniku od typu rozkładu badanych zmiennych. W obu testach hipoteza zerowa mówi o identyczności porównywanych rozkładów, przy założeniu jednorodności wariancji (podobnie jak w przypadku testów t i ANOVA). Formalnie, są to zatem testy nieparametryczne, jednak w przypadku gdy wariancja i wartość oczekiwana jednoznacznie definiują rozkład, to można je również uznać ze testy równości średnich.

Test Manna-Whitney a Służy on do weryfikacji hipotezy o zgodności rozkładów w dwóch porównywanych populacjach, przy założeniu równości ich wariancji. Po wylosowaniu dwóch niezależnych prób łączymy je w jedną, nadając im rangi w ten sposób aby najmniejsza wartość miała rangę 1. Konstrukcja statystyki testowej opiera się na następującym rozumowaniu: jeżeli rozkłady w obydwu populacjach są jednakowe, to rangi obserwacji pochodzących tylko z jednej próby są próbą losową pobrana z próby połączonej. Tym samym, średnia ranga tych obserwacji nie powinna znacznie odbiegać od średniej rangi dla próby połączonej.

Jeżeli hipoteza zerowa (mówiąca o identyczności rozkładów) jest prawdziwa, to wartość oczekiwana sumy rang elementów pierwszej próby (T) jest równa: m T n 1( n1 2 n 2 gdzie n 1 i n 2 oznaczają liczebności obu prób. 1)

Suma rang T jest statystyką testową i jeżeli jej wartość znacznie odbiega od m T, to H 0 należy odrzucić. Wartości krytyczne wyznacza się za pomocą specjalnych tablic, np.: http://www.watpon.com/table/wilcoxonmannwhitney.pdf Podają one minimalną wartość T jeżeli wartość wyznaczona dla pierwszej próby jest mniejsza. W przypadku gdy jest większa należy obliczyć T dla drugiej próby lub skorzystać z tablic podających również wartość maksymalną i wyznaczyć prawostronny obszar krytyczny. Jeżeli liczebności obu prób są jednakowe, to test Manna-Whitney a (z 1947 r.) jest tożsamy z testem opracowanym dwa lata wcześniejszym przez Wilcoxona. We współczesnej literaturze nazwy tych testów są stosowane wymiennie.

Przykład: Zmienna X1 rangi 1 Zmienna X2 rangi 2 1 10 1 15 2 2 20 4 18 3 3 30 6 25 5 4 40 7 45 8 5 60 11 55 9 6-56 10 Średnia 32 35,7 - Wariancja 370-345,5 - Suma (T) - 29 - - Przy liczebnościach prób 5 i 6 (kolejność nie ma znaczenia przy korzystaniu z tablic) wartość krytyczna wynosi 19. Ponieważ statystyka testowa T jest wyższa, to nie ma podstaw do odrzucenia hipotezy zerowej przy żadnym akceptowalnym poziomie istotności. Tym samym, nie ma powodów aby uznać, że próby zostały wylosowane z populacji o różnych rozkładach.

Test Kruskala-Wallisa Test ten jest uogólnieniem testu Manna-Whitney a do przypadku porównań więcej niż dwóch populacji i może być traktowany jako nieparametryczna alternatywa dla analizy wariancji. Hipoteza zerowa mówi o zgodności wszystkich rozkładów. Podobnie jak w przypadku testu Manna-Whitney a, należy utworzyć połączoną próbę i wszystkim jej elementom nadać rangi.

Statystyka testu Kruskala-Wallisa ma następującą postać: H 12 N( N 1) r i1 2 i T n i 3( N 1) gdzie n i oraz T i oznaczają, odpowiednio, liczebność i-tej próby i sumę rang pochodzących z i-tej próby w łącznej próbie (i = 1, 2,..., r), N jest liczebnością próby łącznej. Statystyka H ma rozkład χ 2 o r -1 stopniach swobody (r oznacza liczbę porównywanych populacji).

2. Test serii Test serii jest testem losowości rozumianej dwojako. Hipoteza zerowa może mówić, że: a/ elementy znajdujące się w dwóch próbach zostały wylosowane z tej samej populacji, b/ elementy znajdujące się w próbie znalazły się w niej w wyniku niezależnego losowania. Pierwszy rodzaj testu ma zastosowanie m. in. w eksperymentach mających na celu porównanie skuteczności dwóch metod postępowania (np. stosowania leków, środków ochrony roślin itp.). Drugi rodzaj testu ma m. in. zastosowanie w weryfikacji hipotezy o autokorelacji w modelu regresji.

Zastosowanie testu serii w weryfikacji hipotez na temat reszt modelu regresji polega na badaniu liczby serii znaków reszt modelu. Jeżeli reszty są wynikiem niezależnego losowania, to liczba serii nie powinna być ani zbyt mała, ani zbyt duża. Ewentualna ich losowość wynika z faktu iż wartości zmiennej objaśnianej (y i ) są traktowane jako wynik losowania z populacji o wartości oczekiwanej αx i + β i wariancji σ 2, losowe więc są także różnice między y i oraz αx i + β. Jeżeli wartości zmiennej objaśniającej są nielosowe lub losowane niezależnie (najczęściej przyjmowane założenia), to losowość reszt powinna objawiać się m. in. właściwą liczbą serii. Test serii pozwala zatem zweryfikować hipotezę mówiącą, że reszty są losowane z niezależnych populacji. Ergo, test serii może być użyty jako test autokorelacji reszt. Zbyt duża liczba serii wskazuje na autokorelację ujemną, zbyt mała na dodatnią.

3. Test Kołmogorowa-Smirnowa Test ten jest jednym z testów zgodności. Hipoteza zerowa mówi, iż dany rozkład empiryczny jest zgodny z założonym rozkładem teoretycznym o ciągłej funkcji prawdopodobieństwa. Statystyka testowa jest rosnąca funkcją maksymalnej odległości miedzy dystrybuantą empiryczną oraz teoretyczną i ma rozkład Kołmogorowa (λ). Ma ona następująca postać: D sup Fn ( x) F0 ( X ) X n gdzie F n (x) i F 0 (x) oznaczają, odpowiednio, dystrybuantę empiryczną i teoretyczną zaś n jest liczbnościa próby. Statystyka D ma rozkład Kołmogorowa, który jest stablicowany. Przekroczenie wartości krytycznej stanowi podstawę do odrzucenia hipotezy zerowej, mówiącej, że rzeczywista dystrybuanta jest określona przez funkcję F 0.