Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Podobne dokumenty
Testy nieparametryczne

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Przykład 1. (A. Łomnicki)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

1 Estymacja przedziałowa

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Badania eksperymentalne

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

STATYSTYKA MATEMATYCZNA

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wybrane statystyki nieparametryczne. Selected Nonparametric Statistics

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Testowanie hipotez statystycznych

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Statystyka matematyczna dla leśników

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Wykład 9 Testy rangowe w problemie dwóch prób

Statystyka matematyczna i ekonometria

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Testowanie hipotez statystycznych

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Z poprzedniego wykładu

Statystyka opisowa. Wykład VI. Analiza danych jakośiowych

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

STATYSTYKA MATEMATYCZNA

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski wersja /13:40

Matematyka i statystyka matematyczna dla rolników w SGGW

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Wykład 10 Testy jednorodności rozkładów

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Statystyczna analiza danych

PDF created with FinePrint pdffactory Pro trial version

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wykład 11 Testowanie jednorodności

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 3 Hipotezy statystyczne

S t a t y s t y k a, część 3. Michał Żmihorski

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Analizy wariancji ANOVA (analysis of variance)

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testy nieparametryczne

STATYSTYKA. dr Agnieszka Figaj

ANALIZA DWUZMIENNOWA. czyli ABC KOREALCJI

Testowanie hipotez statystycznych.

W1. Wprowadzenie. Statystyka opisowa

STATYSTYKA MATEMATYCZNA

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

166 Wstęp do statystyki matematycznej

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Metodologia badań psychologicznych. Wykład 12. Korelacje

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

STATYSTYKA MATEMATYCZNA

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Kolokwium ze statystyki matematycznej

Statystyka matematyczna. Wykład VI. Zesty zgodności

Zadania ze statystyki cz.8. Zadanie 1.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

STATYSTYKA MATEMATYCZNA

Transkrypt:

Doświadczalnictwo leśne Wydział Leśny SGGW Studia II stopnia

Metody nieparametryczne Do tej pory omawialiśmy metody odpowiednie do opracowywania danych ilościowych, mierzalnych W kaŝdym przypadku zakładaliśmy m.in. normalność rozkładów zmiennej Nie zawsze jednak rzeczywistość jest taka łaskawa

Metody nieparametryczne Co zrobić, jeŝeli: mamy do czynienia z danymi niemierzalnymi, jakościowymi? analizowany zbiór danych jest niejednorodny i cecha nie ma rozkładu normalnego? próba jest mała i nie moŝna zweryfikować załoŝenia o rozkładzie? Zastosować metody (testy) nieparametryczne

Skale pomiarowe Zmienne jakościowe Nominalna (nazwa, relacja róŝności) Porządkowa (rangowa; relacja porządku) Zmienne ilościowe Przedziałowa (interwałowa; stała jednostka, umowne zero, nie dzielić) Ilorazowa (stosunkowa; zero absolutne, wartości moŝna dzielić)

Metody nieparametryczne Stosować wtedy, gdy nie moŝemy posłuŝyć się metodą parametryczną / testem parametrycznym Co prawda gdy załoŝenia testów parametrycznych (zwłaszcza o normalności rozkładu) nie są spełnione, będą one dalej działać, ale w wielu wypadkach wyniki nie będą wiarygodne

Testy nieparametryczne Niedotrzymanie załoŝenia o normalności cechy = zmniejszenie błędu I rodzaju (alfa), ale..... wówczas siła (moc) testów nieparametrycznych jest mniejsza, niŝ parametrycznych moc testu = zdolność do unikania błędu II rodzaju

Testy nieparametryczne Testy nieparametryczne nie wymagają załoŝenia o normalności rozkładu cech(y) (ang. ditribution free tests) Mimo mniejszej mocy (ogółem) dają lepsze wyniki (większą moc) gdy rozkład cechy jest silnie asymetryczny

Testy nieparametryczne Testy te nazywają się nieparametrycznymi gdyŝ w zasadzie nie badają hipotez dotyczących parametrów (mimo, Ŝe na pierwszy rzut oka tak się nam wydaje)

Zalety Testy nieparametryczne moŝna stosować do róŝnych populacji łatwiejsze do zastosowania Wady mniejsza moc bardziej chaotyczne trudniejsze do zastosowania do bardziej skomplikowanych hipotez / modeli

Testy nieparametryczne Najłatwiej będzie prześledzić podstawowe testy nieparametryczne przez ich porównanie do metod parametrycznych w róŝnych sytuacjach

Pojedyncza próba

Pojedyncza próba Test serii Walda-Wolfowitza Stosowany do badania losowości zjawisk Test bierze pod uwagę zarówno róŝnice od średniej, jak i rozkład próby

Pojedyncza próba Np. testujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P) Notujemy czas kiełkowania kaŝdego nasienia W efekcie uzyskać moŝemy następujące przykładowe rozkłady terminu kiełkowania

Pojedyncza próba E P E P E P E P E P E P E P E P E P E P E E E E E E E E E E P P P P P P P P P P E E E E E E P E E P E E P P P P P P P P E E P P E P E P P E E E P P E P E E P P E E E E E P P P P P P P P P P E E E E E

Próby niezaleŝne

Próby niezaleŝne Zastosowanie mediany

Miary połoŝenia

Miary połoŝenia

MiąŜszości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 0.6 Średnia miąŝszość [m3]: 0.421 MiąŜszości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 7.1 Średnia miąŝszość [m3]: 1.07 Mediana [m3]: 0.3, 0.35, 0.38, 0.39, 0.4, 0.41, 0.42, 0.45, 0.51, 7.1

Próby niezaleŝne Zastosowanie mediany Test median Ho: mediany w badanych populacjach są takie same H1: mediany w badanych populacjach są róŝne

Próby niezaleŝne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew

Próby niezaleŝne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew

Próby niezaleŝne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew Czy metoda A jest lepsza?

Próby niezaleŝne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew Czy metoda A jest lepsza? Liczymy ogólną medianę (Me=16)

Próby niezaleŝne Metoda A: 5 wartości < mediany, czyli PA=5/12 Metoda B: 5 wartości < mediany, czyli PB=5/9 Ho: nie ma róŝnicy między PA i PB (PA- PB=0) Obliczamy

Próby niezaleŝne Test sumy rang Manna-Whitneya Stosowany zamiast testu t w sytuacji, gdy rozkłady cechy nie są normalne

Próby niezaleŝne Test sumy rang Manna-Whitneya Stosowany zamiast testu t w sytuacji, gdy rozkłady cechy nie są normalne Łączymy próby ze sobą, sortujemy i przydzielamy rangi (gdy wartości takie same uŝywamy rang wiązanych)

Próby niezaleŝne Obliczamy sumę rang dla kaŝdej z prób przed połączeniem JeŜeli populacje mają takie same rozkłady badanej cechy, sumy rang powinny być takie same (lub przynajmniej do siebie zbliŝone)

Próby niezaleŝne Np. analizujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P)

Próby niezaleŝne Np. analizujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P)

Próby niezaleŝne Np. analizujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P) Czy jest róŝnica w terminach kiełkowania tych podgatunków?

Próby niezaleŝne Analizujemy rangi dla E i P E: 2, 7, 8, 9, 11 (suma = 37) P: 1, 3, 4, 5, 6, 10 (suma = 29)

Próby niezaleŝne Analizujemy rangi dla E i P E: 2, 7, 8, 9, 11 (suma = 37) P: 1, 3, 4, 5, 6, 10 (suma = 29) Testujemy hipotezy Ho: nie ma róŝnicy w terminie kiełkowania nasion E i P H1: jest róŝnica w terminie kiełkowania nasion E i P

Próby zaleŝne

Próby zaleŝne Podobnie, jak w przypadku testów parametrycznych, test dotyczy nie wartości cechy w populacjach, ale róŝnicy cech dla par spostrzeŝeń Ho: mediana róŝnic między wartościami sparowanymi = 0 Statystyka testowa: liczba róŝnic + JeŜeli Ho jest prawdziwa, liczba róŝnic na + i powinna być równa

Próby zaleŝne Test znaków dla prób zaleŝnych Np. Badamy liczbę nasion w strąkach robinii. Interesuje nas, czy liczba zdrowych nasion w strąkach z górnej części korony jest inna, niŝ w dolnej części korony. Badaniu podlegają straki pobrane z 10 drzew

Próby zaleŝne Na podstawie tych danych obliczamy statystykę testu (z) i porównujemy ją z wartością krytyczną dla rozkładu normalnego

Test Wilcoxona Próby zaleŝne Testowi równieŝ podlega mediana róŝnic między parami obserwacji Ale do testu wykorzystuje się rangi okreslone na podstawie wartości absolutnych róŝnic między parami obserwacji

Próby zaleŝne Suma R+ = 47 Suma R- = 8 Statystyka testu = min(r+, R-) = 8 Porównanie z wartością krytyczną i decyzja (tu 8 < 10)

Próby zaleŝne Test Wilcoxona jest podobny do testu znaków dla prób zaleŝnych MoŜna je stosować w tych samych sytuacjach Test Wilcoxona uwzględnia więcej informacji (znak i wielkość róŝnic), dlatego jest lepszy

Rozkłady

Rozkłady W tej grupie testów omówimy test chi-kwadrat test Kołmogorowa test Kołmogorowa-Smirnova test Shapiro-Wilka

Rozkłady 1 próba Testowana jest zgodność rozkładu empirycznego z rozkładem teoretycznym test chi-kwadrat test Kołmogorowa test Shapiro-Wilka

Rozkłady 1 próba Test chi-kwadrat testuje róŝnice między częstościami klas w rozkładzie teoretycznym i empirycznym Czuły na liczbę i liczebność klas Przeznaczony do testowania hipotez dotyczących rozkładów zmiennych skokowych (dla zmiennych ciągłych statystyka daje tylko przybliŝenie)

Rozkłady 1 próba Test Kołmogorowa testuje róŝnice między skumulowanymi liczebnościami klas (dystrybuantami) rozkładu teoretycznego i empirycznego Przeznaczony do testowania hipotez dotyczących rozkładów zmiennych ciągłych Modyfikacja: normalizacja statystyki wielkością próby

Rozkłady 1 próba Test Shapiro-Wilka testuje hipotezę, Ŝe rozkład empirycznyc jest zgodny z rozkładem normalnym

Rozkłady 2 próby Test Kołmogorowa-Smirnova testuje hipotezę, Ŝe dwie próby zostały pobrane z tej samej populacji lub z populacji o takich samych rozkładach Wykorzystuje (standaryzowaną) róŝnicę między skumulowanymi liczebnościami (dystrybuantami) rozkładów

ANOVA

ANOVA? Ze względu na załoŝenia nie zawsze moŝemy wykonać analizę wariancji Nieparametryczny odpowiednik ANOVA - test Kruskala-Wallisa Zamiast średnich testowane są mediany Rozwinięcie testu Wilcoxona dla prób niezaleŝnych (wykorzystuje rangi)

Test Kruskala-Wallisa KaŜdej obserwacji przypisuje się rangę (dla całości doświadczenia) Warianty doświadczenia / poziomy czynnika Oblicza się statystykę testową

Test Kruskala-Wallisa Np. Czy branŝa, w której absolwent wyŝszej uczelni znajduje pierwszą pracę, decyduje o wielkości wynagrodzenia?

Test Kruskala-Wallisa Ho: początkowe wynagrodzenia w poszczególnych branŝach są takie same

Test Kruskala-Wallisa Hobl = 4,13 Krytyczna wartość chi2 = 7,81 Brak podstaw do odrzucenia Ho o równości wynagrodzeń

Siła związku

Siła związku Współczynnik korelacji rang Spearmana (1904) Wykorzystuje rangi do badania siły związku między cechami MoŜna równieŝ wykorzystać do testowania hipotezy, Ŝe nie ma związku między badanymi populacjami

Dziekuje za uwagę!