Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Podobne dokumenty
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Badania eksperymentalne

Testy nieparametryczne

Wykład 9 Testy rangowe w problemie dwóch prób

Wykład 3 Hipotezy statystyczne

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych.

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wykład 10 Testy jednorodności rozkładów

Statystyka matematyczna. Wykład VI. Zesty zgodności

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Przykład 1. (A. Łomnicki)

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 11 Testowanie jednorodności

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Wydział Matematyki. Testy zgodności. Wykład 03

Kolokwium ze statystyki matematycznej

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyczna analiza danych

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Analiza wariancji. dr Janusz Górczyński

Testowanie hipotez statystycznych.

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Testowanie hipotez statystycznych

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Statystyka matematyczna dla leśników

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

STATYSTYKA MATEMATYCZNA

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Testy post-hoc. Wrocław, 6 czerwca 2016

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Badanie zależności pomiędzy zmiennymi

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka matematyczna

Testowanie hipotez statystycznych.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wykład 7 Testowanie zgodności z rozkładem normalnym

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Test t-studenta dla jednej średniej

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Porównanie dwóch rozkładów normalnych

Elementarne metody statystyczne 9

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Wykład 8 Dane kategoryczne

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

166 Wstęp do statystyki matematycznej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Prawdopodobieństwo i statystyka r.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Transkrypt:

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane ciągi danych statystycznych... oraz y1 y... ym łączymy je w jeden x 1 x x n ciąg uporządkowany niemalejąco. W otrzymanym ciągu elementom z pierwszej sekwencji przyporządkowujemy 0 a elementom z drugiej sekwencji przyporządkowujemy 1. Obliczamy liczbę serii w otrzymanym ciągu zerojedynkowym. 1

Rozpatrujemy hipotezy: H 0 (pobrane próbki pochodzą z populacji o tym samym rozkładzie), H 1 (pobrane próbki pochodzą z populacji o różnych rozkładach),

Serie to podciągi złożone z jednakowych symboli. Stosujemy statystykę: U n,m = liczba serii Zbiór krytyczny: K = (-; k> gdzie k odczytujemy z tablicy rozkładu serii dla poziomu istotności i liczb n, m. Decyzje: Jeśli Jeśli u n m u n m, K to H 0 odrzucamy,, K to nie ma podstaw do odrzucenia H 0. 3

Uwaga. Gdy n i m są większe od 0, to statystyka U n,m ma w przybliżeniu rozkład nmnm n m n m n m nm N 1; n m 1 W naszym przypadku skorzystamy z powyższej uwagi i dla pobranej próby obliczamy wartość u * u nmnm n m n m n m 1 n, m Statystyka ta ma rozkład N(0, 1) Zbiór krytyczny: nm 1 n m K = (-; -k> gdzie k odczytujemy z tablicy dystrybuanty N(0, 1) dla poziomu istotności (k ) 1. 4

TEST MEDIANY Mamy dwa uporządkowane ciągi danych statystycznych... oraz y1 y... ym (n m), łączymy je w x 1 x x n jeden ciąg uporządkowany niemalejąco i wyznaczamy medianę m e. Rozpatrujemy hipotezy: H 0 (pobrane próbki pochodzą z populacji o tym samym rozkładzie), H 1 (pobrane próbki pochodzą z populacji o różnych rozkładach), 5

Tworzymy tablicę: X Y n i >m e n 11 n 1 n 1 m e n 1 n n n j n 1 n n+m 6

Na podstawie próby obliczamy wartość statystyki (*) u n n ij nˆ i1 j1 ij nˆ ij (rozpatrywana statystyka ma rozkład Y 1 ) gdzie nˆ ij ni n j (suma i tego wiersza) (suma j tej kolumny) n m liczebność próby 7

- poziom istotności. Zbiór krytyczny ma postać K k ; ) ; gdzie P ( Y 1 k) = Jeśli un K to H 0 odrzucamy, w przeciwnym przypadku nie ma podstaw do odrzucenia H 0. 8

Uwaga. Dla tablicy korelacyjnej 1 1 A B A+B C D C+D A+C B+D n+m Statystyka U n ma postać: U n ( n m)( AD BC) ( A B)( A C)( B D)( C D) i ma rozkład Y 1. 9

Test Wilcoxona Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane ciągi danych statystycznych... oraz y1 y... ym (n m), łączymy je w x 1 x x n jeden ciąg uporządkowany niemalejąco i nadajemy rangi. Rozpatrujemy hipotezy: H 0 (pobrane próbki pochodzą z populacji o tym samym rozkładzie), H 1 (pobrane próbki pochodzą z populacji o różnych rozkładach), 10

Stosujemy statystykę: Zbiór krytyczny: U = suma rang elementów z I próbki K = (-; k 1 > < k ; ) gdzie k 1, k odczytujemy z tablicy rozkładu sumy rang dla poziomu istotności i liczb n oraz m, Decyzje: Jeśli Jeśli u K to H 0 odrzucamy, u K to nie ma podstaw do odrzucenia H 0. 11

Uwaga. Gdy n i m są większe od 10, to suma rang elementów z I próbki ma w przybliżeniu rozkład n( n m 1) nm n m 1 N ; 1 W naszym przypadku skorzystamy z powyższej uwagi i dla pobranej próby obliczamy wartość u * n( n m 1) u nm( n m 1) 1 * statystyki U, gdzie u jest wartością zmiennej losowej U (suma rang elementów z I próbki). Zbiór krytyczny: K = (-; -k> < k ; ) gdzie k odczytujemy z tablicy dystrybuanty rozkładu N(0, 1) ( k) 1. 1

Uwaga o decyzji. Wyznaczamy liczbę ˆ (krytyczny poziom istotności) * ˆ spełniającą równość P X u n, gdzie X ~ N(0, 1). Podejmujemy decyzję: nie ma podstaw do odrzucenia hipotezy H 0, gdy ˆ jest istotnie większe od zera (standardowo większe od 0,05) odrzucamy hipotezę H 0, gdy ˆ jest bliskie zeru. 13

Test (sumy rang) Kruskala-Wallisa Jest to uogólnienie testu Wilcoxona. Założenie. Rozpatrywane rozkłady są ciągłe. Rozpatrujemy m cech w m populacjach o rozkładach wyznaczonych przez dystrybuanty F 1, F,..., F m. Mamy m ciągów danych statystycznych o liczebnościach n i, (n 1 + n +... + n m = n), łączymy je w jeden ciąg uporządkowany niemalejąco i nadajemy rangi. Rozpatrujemy hipotezy: H 0 (F 1 = F =... = F m ), H 1 (co najmniej dwie cechy mają różne rozkłady), 14

Niech T i - suma rang w poszczególnych próbach. Stosujemy statystykę: u 1 n( n 1) m i1 T n i i 3( n 1) dla n i 0 rozpatrywana statystyka ma rozkład Y m-1. Zbiór krytyczny: K = <k ; ) Decyzje: Jeśli Jeśli u K to H 0 odrzucamy, u K to nie ma podstaw do odrzucenia H 0. 15