Testy nieparametryczne



Podobne dokumenty
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Przykład 1. (A. Łomnicki)

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych. Laboratorium VI: Testy nieparametryczne

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Badania eksperymentalne

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Wydział Matematyki. Testy zgodności. Wykład 03

Wykład 9 Testy rangowe w problemie dwóch prób

Wykład 3 Hipotezy statystyczne

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Statystyka matematyczna i ekonometria

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

STATYSTYKA MATEMATYCZNA

Analizy wariancji ANOVA (analysis of variance)

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Wykład 10 Testy jednorodności rozkładów

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Wykład 11 Testowanie jednorodności

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

WNIOSKOWANIE STATYSTYCZNE

Statystyka matematyczna dla leśników

Metodologia badań psychologicznych. Wykład 12. Korelacje

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Analiza wariancji i kowariancji

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Jednoczynnikowa analiza wariancji

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA MATEMATYCZNA

Test t-studenta dla jednej średniej

VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

KORELACJE I REGRESJA LINIOWA

Statystyka opisowa. Wykład VI. Analiza danych jakośiowych

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Opracowywanie wyników doświadczeń

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

laboratoria 24 zaliczenie z oceną

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Zadania ze statystyki cz.8. Zadanie 1.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Podstawowe pojęcia statystyczne

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Zadanie 1. Analiza Analiza rozkładu

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Pobieranie prób i rozkład z próby

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski wersja /13:40

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Testy nieparametryczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Badanie normalności rozkładu

STATYSTYKA MATEMATYCZNA

( x ) jest dystrybuantą cechy x dla i-tej grupy.

KARTA KURSU. Kod Punktacja ECTS* 1

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Transkrypt:

Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów oraz dla grup o małej liczebności.

Testy nieparametryczne Siła testów nieparametrycznych (1 minus wielkość błędu drugiego rodzaju) jest mniejsza niż siła testów parametrycznych.

Testy będące nieparametrycznymi odpowiednikami testu t-studenta Testy te służą do weryfikacji hipotezy, że dwie analizowane próby pochodzą z różnych populacji. Wymagają one założenia, że analizowane zmienne mogą być uporządkowane od wartości najmniejszej do wartości największej (tzn. są mierzone na skali porządkowej). Ich interpretacja jest taka sama, jak w przypadku testu t- Studenta dla prób niezależnych.

Testy będące nieparametrycznymi odpowiednikami testu t-studenta Można wyróżnić dwie grupy testów: 1. Do porównanie dwóch prób niezależnych (grup) 2. Do porównanie dwóch prób zależnych (zmiennych)

Testy do porównanie dwóch prób niezależnych test U Manna - Whitneya test serii Walda i Wolfowitza test dla dwóch prób Kołmogorowa i Smirnowa

Test U Manna i Whitneya Wśród testów nieparametrycznych ma największą moc.

Test Manna i Whitneya Stosujemy go w celu porównania dwóch grup danych, gdy: dane są mierzalne (ilościowe), ale ich rozkład zdecydowanie odbiega od rozkładu normalnego (czyli nie jest spełnione założenie testu t-studenta) dane są typu porządkowego - w tym przypadku hipoteza zerowa zakłada, że rozkłady danych w analizowanych grupach nie różnią się istotnie; dla danych porządkowych nie można bowiem obliczać wartości średniej, a prawidłową miarą tendencji centralnej jest mediana.

Test Manna i Whitneya (dla sumy rang) Punktem wyjścia w teście jest nadanie wynikom obserwacji rang. Rangowanie przeprowadza się następująco: 1. Porządkujemy rosnąco wartości obu prób. 2. Zaczynając od wartości najmniejszej (lub największej), przyporządkowujemy poszczególnym obserwacjom kolejne liczby naturalne. 3. W przypadku wystąpienia wartości jednakowych przyporządkowujemy im tzw. rangi wiązane (średnia arytmetyczna z rang, jakie powinno im się przypisać).

Wynik testu U - oznacza wartość testu dla małych liczebności (<20) Z - dla liczebności powyżej 20)

Przykład 2. Dane stężenie ozonu mierzone o godzinie 8 i 11. godz.8 12 12 13 15 12 14 12 14 12 17 17 15 godz.11 16 17 15 18 17 19 18 20 16 19 18 17

Chcemy zweryfikować hipotezę, że stężenie ozonu w obu grupach jest jednakowe. Hipoteza zerowa H 0 : m 1 =m 2 H 1 : m 1 m 2 Sprawdzamy założenia: normalność rozkładu - test W Shapiro i Wilka

Statystyki podstawowe i tabele - statystyki opisowe - zakładka Normalność Histogram: Stężenie godz.8 K-S d=.23653, p>.20; Lilliefors p<.10 Shapiro-Wilk W=.83447, p=.02373 5 4 Liczba obs. 3 2 1 0 11 12 13 14 15 16 17 X <= Granica klasy Ponieważ zmienna "stężenie ozonu o godz.8" nie ma rozkładu normalnego, nie możemy zastosować testu t-studenta.

Należy zmienić dane tak by w pierwszej kolumnie była zmienna grupująca tzn. Czas godzina stężenie 8 14 8 16 8 16 8 15 8 14 8 17 8 16 8 14 8 15 8 14 8 16 8 16 11 16 11 19 11 15

Testy nieparametryczne Wybieramy Statystyki Statystyki nieparametryczne Porównanie dwóch prób niezależnych (grup)

Test Manna i Whitneya U oznacza wartość testu dla małych liczebności (<20) Z - dla liczebności powyżej 20) Poziom prawdopodobieństwa p dla testu =0.00038 < =0,05 Wniosek: Na poziomie istotności = 0.00038 można odrzucić hipotezę zerową o takim samym stężeniu ozonu o godz.8 i 11.

Test Walda i Wolfowitza Hipoteza zerowa zakłada, że dwie próby pochodzą z tej samej populacji.

Test serii Walda i Wolfowitza Konstrukcja testu: 1. Porządkujemy dane według zmiennej, wedle której należy je porównać między sobą. Podobnie jak w teście serii wyodrębniamy serie Jeżeli nie ma różnic pomiędzy zmiennymi, wówczas liczba i długość takich sąsiadujących ze sobą serii będzie się układać w mniejszym lub większym stopniu w sposób losowy.

Test Walda i Wolfowitza Interpretacja testu polega na porównaniu wartości p z poziomem istotności.

Wyniki testu Walda- Przykład 1. Wolfowitza Ponieważ różnią się od wyników testu U M-W, bierzemy pod uwagę tylko test M-W.

Przykład 2. (ozon). Test serii Walda-Wolfowitza Z - wartość testu Walda i Wolfowitza, gdy liczebność obu grup jest >20 [6] poziom istotności wyliczony dla wartości testu [5] [7] wartość testu skorygowanego, stosowanego dla małych liczebności (<20) [8] poziom istotności dla testu poprawionego Wniosek: Hipotezę zerową należy odrzucić.

Testy nieparametryczne dla prób zależnych Testy te są przeznaczone do sprawdzania istotności różnic między dwoma zależnymi pomiarami Są to: test znaków test kolejności par Wilcoxona

Testy nieparametryczne dla prób zależnych Testy te stosujemy również wtedy, gdy nie są spełnione założenia testu t dla zmiennych powiązanych. Testy te wymagają jedynie założenia, że wartości badanych zmiennych możemy uporządkować (są mierzalne w skali porządkowej).

Test znaków oparty jest na znakach różnic między kolejnymi parami wyników (czy są ujemne, czy dodatnie). Test polega na ustaleniu liczby plusów i minusów oraz porównaniu ich z wartością teoretyczną podaną w odpowiednich tablicach.

Test znaków Test ten stosujemy więc przede wszystkim dla cech jakościowych. Wystarczy bowiem sprawdzić, że dana jednostka charakteryzuje się obecnością ("+") lub nieobecnością ("-") danego zjawiska. Dla danych mierzalnych nie uwzględniamy wartości różnic, lecz jedynie ich znaki. Różnice o wartości zero są pomijane.

Test Wilcoxona Test kolejności par Wilcoxona uwzględnia znak różnic, ich wielkość, jak również ich kolejność. Jest mocniejszy od testu znaków.

Test Wilcoxona W teście tym, po uporządkowaniu różnic w szereg rosnący przypisuje się im rangi. Następnie osobno sumuje się rangi różnic dodatnich i ujemnych. Mniejsza z otrzymanych sum to wartość testu Wilcoxona, która po porównaniu z odpowiednią wartością teoretyczną w tablicach decyduje o odrzuceniu hipotezy zerowej lub nie.

Testy nieparametryczne dla prób zależnych Uruchomienie Statystyka - Testy nieparametryczne Porównanie dwóch prób zależnych

Test znaków

[1] - liczebność grup [2] - wartość testu Wilcoxona dla grup n =<25 [3] - wartość testu Wilcoxona dla grup n >25 [4] - poziom istotności dla testu Wilcoxona

ANOVA nieparametryczna Do nieparametrycznych odpowiedników analizy wariancji zaliczamy: test ANOVA rang Kruskala-Wallisa test ANOVA Friedmana

Test Kruskala-Wallisa Jest nieparametrycznym odpowiednikiem jednoczynnikowej analizy wariancji. Za pomocą tego testu sprawdzamy czy n niezależnych próbek pochodzi z tej samej populacji, czy z populacji z taką samą medianą. Poszczególne próbki nie muszą mieć takiej samej liczebności. Maksymalnie możemy porównywać 10 grup.

Test Kruskala-Wallisa Danymi wejściowymi jest n-elementowa próba statystyczna podzielona na k rozłącznych grup o licznościach n 1,..., n k. Zakłada się, że każda grupa jest losowana z innej populacji. Wykonywane jest rangowanie całej próby. (połączone wszystkie grupy).

Wyniki

Test Friedmana Jest nieparametrycznym odpowiednikiem jednoczynnikowej analizy wariancji dla pomiarów powtarzanych. Uważany jest za najlepszy nieparametryczny test dla danych tego rodzaju.

Test parametryczny Test nieparametryczny Test t Studenta dla prób niezależnych Test U Manna Whitneya Test serii Walda i Wolfowitza Test t Studenta dla prób zależnych Jednoczynnikowa analiza wariancji Test znaków rangowanych Wilcoxona Test znaków Test H Kruskala Wallisa Analiza wariancji z powtarzanymi pomiarami Test Friedmanna

Zadanie. Należy sprawdzić czy rzeki województwa śląskiego są bardziej zanieczyszczone od rzek województwa mazowieckiego. Jakim testem przeprowadzisz analizę statystyczną wiedząc, że stan zanieczyszczenia rzek wg wskaźników fizyko-chemicznych podawany jest w skali: Klasa 1 = niski, Klasa 2 = średni, Klasa 3 = wysoki testem U Manna Whitneya testem znaków rangowanych Wilcoxona testem t dla prób zależnych testem t dla prób niezależnych

Chcąc sprawdzić czy rozkład badanej zmiennej odbiega od rozkładu normalnego użyjemy testu: a) Kruskala Wallisa b) Friedmana c) Kołmogorowa Smirnowa