Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Podobne dokumenty
Testy nieparametryczne

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Opisowe charakterystyki rozkładów cech statystycznych. Descriptive Characteristics of Distributions of Statistical Variables

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY ANOVA JAKO NARZĘDZIE WSPOMAGAJĄCE WERYFIKACJĘ HIPOTEZ STATYSTYCZNYCH ANOVA TESTS AS A TOOL TO ASSIST IN VERIFYING STATISTICAL HYPOTHESIS

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna dla leśników

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Przykład 1. (A. Łomnicki)

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Wykład 9 Testy rangowe w problemie dwóch prób

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykład 10 Testy jednorodności rozkładów

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład 3 Hipotezy statystyczne

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

WNIOSKOWANIE STATYSTYCZNE

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka matematyczna i ekonometria

STATYSTYKA MATEMATYCZNA

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Statystyczna analiza danych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

STATYSTYKA MATEMATYCZNA

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

laboratoria 24 zaliczenie z oceną

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

166 Wstęp do statystyki matematycznej

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Kilka uwag o testowaniu istotności współczynnika korelacji

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Badania eksperymentalne

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Wykład 7 Testowanie zgodności z rozkładem normalnym

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych. Laboratorium VI: Testy nieparametryczne

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Metodologia badań psychologicznych. Wykład 12. Korelacje

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Opracowywanie wyników doświadczeń

Wprowadzenie do analizy korelacji i regresji

kod nr w planie ECTS Przedmiot studiów PODSTAWY STATYSTYKI 7 2

WNIOSKOWANIE STATYSTYCZNE SYLABUS A. Informacje ogólne

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Testowanie hipotez statystycznych

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

POLITECHNIKA OPOLSKA

przedmiot podstawowy obowiązkowy polski drugi

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Elementarne metody statystyczne 9

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych

WNIOSKOWANIE STATYSTYCZNE

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Transkrypt:

Wydawnictwo UR 2017 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 2/20/2017 www.eti.rzeszow.pl DOI: 10.15584/eti.2017.2.13 WIESŁAWA MALSKA Wybrane statystyki nieparametryczne Selected Nonparametric Statistics Doktor inżynier, Politechnika Rzeszowska, Wydział Elektrotechniki i Informatyki, Katedra Energoelektroniki, Elektroenergetyki i Systemów Złożonych, Polska Streszczenie W artykule zaprezentowano wybrane testy nieparametryczne dla prób zależnych i dla prób niezależnych. Testy te stosowane są w przypadku, gdy nie można zastosować testów parametrycznych. Ich użycie determinuje rozkład analizowanych zmiennych (danych) inny niż rozkład normalny. Metody nieparametryczne opierają się najczęściej na rangach, czyli odpowiednim uporządkowaniu badanej cechy (lub badanych cech). Obliczenia wykonano w programie Statistica. Słowa kluczowe: test istotności, test nieparametryczny, próba zależna, próba niezależna Abstract This article presents selected nonparametric tests for dependent and independent trials. These tests are used when parametric tests can not be used. Their application determines the distribution of the analyzed variables (data) other than the normal distribution. Nonparametric methods are most often based on ranks, the orderly arrangement of the studied features (or characteristics). Calculations were made in STATISTICA program. Keywords: essence test, nonparametric test, dependent test, independent test Wstęp W statystyce matematycznej testy nieparametryczne są stosowane jako alternatywa dla testów parametrycznych. Ma to miejsce wtedy, gdy pojawia się wątpliwość odnosząca się do spełnienia odpowiednich założeń stawianych testom parametrycznych. Najczęściej jest to wątpliwość dotycząca spełnienia założenia odnośnie do normalności rozkładu rozważanej cechy statystycznej. W programie Statistica są dostępne testy nieparametryczne dla prób zależnych i dla prób niezależnych (Rabiej, 2012; Kot, Jakubowski, Sokołowski, 2011). Możliwość wykorzystania tych testów jest ważnym czynnikiem w analizie danych statystycznych, jeżeli ich rozkłady empiryczne znacznie różnią się od rozkładu normalnego. 111

Testy nieparametryczne dla prób losowych zależnych W zagadnieniach wnioskowania statystycznego wykorzystuje się testy nieparametryczne dla prób losowych niezależnych i dla prób losowych zależnych. W przypadku zastosowania testów nieparametrycznych dla prób losowych zależnych do najczęściej wykorzystanych należy test znaków i test kolejności par Wilcoxona (Greń, 1984; Rabiej, 2012; Dobosz, 2004). Za pomocą testów dla prób zależnych sprawdza się także, czy próby różnią się między sobą pod względem pewnych własności. Głównym założeniem w tym teście jest wymóg, że wartości badanych zmiennych możemy uporządkować (Rabiej, 2012; Wagner, 2015). Test znaków służy do porównywania par obserwacji uzyskiwanych w badaniu eksperymentalnym polegającym na poddaniu jednostek pewnemu zabiegowi i określeniu, jaki wpływ wywrze ten zabieg na wartości badanej cechy. Test znaków oparty jest na znakach różnic między kolejnymi parami zmiennych, a nie na wielkości tych różnic. Stąd wzięła się nazwa testu jako test znaków. Na rysunku 1 przedstawiono arkusz z danymi dotyczącymi wyników dwóch zaliczeń dla 15-osobowej grupy. Celem weryfikacji jest opinia, że nastąpiła znaczna poprawa ocen wyników zaliczenia dla rozpatrywanej grupy. Rysunek 1. Arkusz z danymi Rysunek 2. Widok karty Statystyka/Statystyki nieparametryczne/porównanie dwóch prób zależnych (zmiennych) 112

Test znaków w programie Statistica dostępny jest w module Statystyka/Statystyki nieparametryczne/porównanie dwóch prób zależnych (zmiennych), a widok modułu z wbudowanym testem znaków przedstawiono na rysunku 2. Na rysunku 3 przedstawiono widok karty Porównanie dwóch zmiennych z testem Test znaków. Wyniki testu znaków przedstawiono na rysunku 4. W arkuszu wynikowym Liczba niewiąz. oznacza liczebność prób; Procent v<v procent liczebności zmiennych, dla których różnica ma wartość ujemną (znak ); Z wartość testu znaków; p poziom komputerowego prawdopodobieństwa (które porównywane jest z przyjętym poziomem współczynnika istotności). Rysunek 3. Widok karty Porównanie dwóch zmiennych z testem Test znaków Rysunek 4. Arkusz wynikowy testu znaków Otrzymana wartość poziomu prawdopodobieństwa testowego p > 0,05, stąd nie ma podstaw do odrzucenia hipotezy zerowej. Należy uznać, że nie nastąpił istotny spadek otrzymywanych ocen. Kolejnym testem nieparametrycznym dla prób niezależnych jest test kolejności par Wilcoxona (test dostępny w tym samym module co test znaków) (Rabiej, 2012; Kot i in., 2011; Sobczyk, 2007). Uwzględnia on znak różnic, ich kolejności i ich wielkość. Po uporządkowaniu 113

różnic w szereg rosnący przypisuje się im rangi (odpowiednią kolejność). Późniejszym zabiegiem jest sumowanie różnicy rang dodatnich i różnicy rang ujemnych. Mniejsza z otrzymanych w ten sposób sum to wartość testu kolejności par Wilcoxona. Wartość ta porównywana jest z odpowiednią wartością teoretyczną w tablicach z adekwatnymi statystykami, a w dlaszje kolejności następuje konkluzja końcowa o przyjęciu lub odrzuceniu hipotezy zerowej. Wyniki testu kolejności par Wilcoxona przedstawiono na rysunku 5. Rysunek 5. Arkusz wynikowy testu kolejności par Wilcoxona Interpretując otrzymane prawdopodobieństwo p, nie ma podstaw do odrzucenia hipotezy zerowej, czyli wyniki zaliczeń nie różnią się istotnie od siebie. Testy nieparametryczne dla prób losowych niezależnych Testy nieparametryczne dla prób losowych niezależnych najczęściej wykorzystywane w statystyce matematycznej to test serii Walda i Wolfowitza oraz test U Manna i Whitneya (Rabiej, 2012; Luszniewicz, Słaby, 2001). Testy te służą weryfikacji hipotezy, że dwie analizowane próby pochodzą z różnych populacji generalnych (zbiorowości statystycznych). Wymogiem jest tu możliwość uporządkowania analizowanych zmiennych (danych pomiarowych) w sposób rosnący, czyli od wartości minimalnej do wartości maksymalnej. Test U Manna i Whitneya stosowany jest, gdy dane są mierzalne, ale ich rozkład nie jest rozkładem normalnym, i gdy dane są typu porządkowego. W przypadku danych typu porządkowego hipoteza zerowa zakłada, że typy rozkładów analizowanych grup nie różnią się istotnie od siebie. Należy jednak pamiętać o tym, że dla danych typu porządkowego nie można obliczać wartości średniej, a właściwą miarą tendencji centralnej jest mediana (wartość środkowa). W teście U Manna i Whitneya nadawane są wynikom obserwacji (pomiarów) odpowiednie rangi (kolejne liczby naturalne) (Rabiej, 2012; Jóźwiak, Podgórski, 2009). W przypadku wystąpienia takich samych wartości przyporządkowywane są tzw. rangi wiązane (równe średniej arytmetycznej z kolejnych rang, jakie powinno się im przypisać). Kolejnym krokiem jest obliczenie dla każdej grupy sumy rang. Obliczone wartości są porównywane z wartościami krytycznymi testu U Manna i Whitneya. Test U Manna i Whitneya w programie Statistica dostępny jest w module Statystyka/Statystyki nieparametryczne/porównanie dwóch prób niezależnych widok okna testu przedstawiono na rysunku 6. 114

Rysunek 6. Widok okna z testem U Manna-Whitneya Dla rozważań wykorzystano przykład związany z liczbą usterek (braków) wyrobów produkowanych na dwóch odrębnych liniach technologicznych. Na pierwszej linii wyroby produkowane są metodą tradycyjną (metoda 1), a na drugiej linii nową innowacyjną metodą (metoda 2). Wykorzystując testy dostępne w programie Statistica, sprawdzono, czy liczba usterek ma rozkład normalny. Wyniki testu normalności rozkładu Shapiro-Wilka i skategoryzowany wykres normalności przedstawiono na rysunku 7. Wyniki testu normalności Shapiro- -Wilka dla metody nie mają rozkładu normalnego. Rysunek 7. Wykres normalności wraz z wynikami testu Shapiro-Wilka 115

Na rysunku 8 zaprezentowano wyniki testu U Manna-Whitneya, wartość otrzymanego prawdopodobieństwa p = 0,319. Można twierdzić, że różnica w liczbie usterek na dwóch liniach produkcyjnych jest nieistotna. Rysunek 8. Wyniki testu U Manna-Whitneya Do tego samego przykładu wykorzystano test serii Walda-Wolfowitza (test dostępny w module Statystyka/Statystyki nieparametryczne/porównanie dwóch prób niezależnych). Rysunek 9. Wyniki testu serii Walda-Wolfowitza Wyniki testu serii Walda-Wolfowitza przedstawiono na rysunku 9 i świadczą one o tym, że zebrane informacje nie potwierdzają hipotezy, że na linii 1 jest odnotowywana większa liczba usterek detali niż na linii 2. Podsumowanie Testy nieparametryczne w analizie danych (zmiennych) można stosować w przypadku dwóch grup danych. Można je użyć odnośnie do danych ilościowych (cech mierzalnych) i gdy ich rozkłady empiryczne odbiegają od rozkładu normalnego. W programie Statistica testy te podzielone są dwie kategorie testów. Pierwsza dotyczy testów dla prób losowych zależnych, a druga kategoria to testy dla prób niezależnych. Wykorzystanie dostępnych testów nieparametrycznych podobnie jak i wykorzystanie testów parametrycznych niesie ze sobą pewne założenia, które muszą być spełnione, aby moc testu była na odpowiednim poziomie. Wnioski końcowe związane z przyjęciem weryfikowanej hipotezy jako prawdziwej lub odrzuceniem jako fałszywej związane są z możliwością popełnienia błędu pierwszego lub błędu drugiego rodzaju. Zaprezentowane w niniejszym artykule wybrane testy nieparametryczne mogą ułatwić analizę danych i obliczenia w tych przypadkach, w których nie można zastosować testu parametrycznego. 116

Literatura Dobosz, M. (2004). Wspomagana komputerowo statystyczna analiza wyników badań. Warszawa: Exit. Greń, J. (1984). Statystyka matematyczna. Modele i zadania. Warszawa: PWN. http:// www.statsoft.pl (10.02. 2017). Jóźwiak, J., Podgórski, J. (2009). Statystyka od podstaw. Warszawa: PWE. Kot, S., Jakubowski, J., Sokołowski, A. (2011). Statystyka. Warszawa: Difin. Luszniewicz, A., Słaby, T. (2001). Statystyka z pakietem komputerowym STATISTICA. Warszawa: C.H. Beck. Rabiej, M. (2012). Statystyka z programem STATISTICA. Gliwice: Helion. Sobczyk, M. (2007). Statystyka. Warszawa: PWN. Wagner, W. (2015). Zasady statystyki jedno- i dwuwymiarowej, metodyka, teoria i zastosowania. Rzeszów: Wyd. WSIiZ. 117