Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Podobne dokumenty
1 Estymacja przedziałowa

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna. Wykład VI. Zesty zgodności

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna dla leśników

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Testowanie hipotez statystycznych.

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyczna analiza danych

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Testowanie hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Testowanie hipotez statystycznych.

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Statystyka matematyczna i ekonometria

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Przykład 1. (A. Łomnicki)

STATYSTYKA MATEMATYCZNA

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Statystyka matematyczna

Wykład 7 Testowanie zgodności z rozkładem normalnym

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych

Testy nieparametryczne

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych cd.

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Estymacja parametrów w modelu normalnym

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Wydział Matematyki. Testy zgodności. Wykład 03

Elementy statystyki STA - Wykład 5

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

STATYSTYKA MATEMATYCZNA

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Statystyka Matematyczna Anna Janicka

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Analiza wariancji i kowariancji

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; Weryfikacja założenia o normalności rozkładu populacji

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Testowanie hipotez statystycznych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Hipotezy statystyczne

KORELACJE I REGRESJA LINIOWA

Wprowadzenie do analizy korelacji i regresji

Testowanie hipotez statystycznych

Analizy wariancji ANOVA (analysis of variance)

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Hipotezy statystyczne

Kolokwium ze statystyki matematycznej

Transkrypt:

Testowanie Hipotez

Wprowadzenie Testy statystyczne: pocz. XVII wieku (prace J.Arbuthnotta, liczba urodzeń noworodków obu płci w Londynie) Testowanie hipotez: Karl Pearson (pocz. XX w., testowanie zgodności, test χ 2 ), potem Egon Pearson (syn) i Jerzy Neyman.

2 przeciwstawne hipotezy: Hipoteza zerowa Hipoteza alternatywna Test: decyzja o przyjęciu lub odrzuceniu hipotezy zerowej

Poziom istotności α: maksymalne akceptowalne prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej (tzw. błąd I rodzaju) Typowe wartości: 0.05, 0.01 (im niższy, tym pewniejszy wynik) p-wartość: minimalny poziom istotności pdjęcia decyzji o odrzuceniu hipotezy zerowej. jeśli p < α to mamy podstawy do odrzucenia hipotezy zerowej. Statystyka testowa.

Testowanie zgodności Testowanie zgodności z danym rozkładem. Najpopularniejsze: testy normalności testy jednostajności testy zgodności 2 rozkładów

Testy normalności H 0 : F {N(µ, σ) : µ R, σ R + } gdzie F to nieznany rozkład, pochodzą z niego obserwacje x F Często procedury statystyczne (np. Gaussowska regresja liniowa lub analiza wariancji (ANOVA)) zakładają zgodność pewnych zmiennych z rozkładem normalnym aby zapewnić prawidłowość procesu testowania.

Który test wybrać? Jest wiele testów. Każdy test wykrywa nieco inne rodzaje niezgodności. (np. Shapiro-Wilka (shapiro.test), Andersona-Darlinga, etc.) Każdy test oparty jest często na dodatkowych założeniach, które należy sprawdzić przed użyciem (np. w pakiecie R, czytając dokumentację odpowiedniego testu)

Moc testu Prawdopodobieństwo odrzucenia hipotezy zerowej, gdy faktycznie jest fałszywa (uniknięcie błędu II rodzaju) (1-prawdopodobieństwo błędu II rodzaju) Zależy m.in. od: liczby obserwacji (im więcej tym lepiej) poziomu istotności

Wizualna ocena normalności Za pomocą wykresu kwantylowego (qqnorm) Porównanie kwantyli z rozkładu empirycznego z teroetycznymi kwantylami rozkładu normalnego. Normalny: punkty układają się na prostej (qqline). Także: qqplot przykład: x = rnorm(1000); qqnorm(x)

Testy zgodności z rozkładem jednostajnym Można wykorzystać: χ 2 Kołmogorowa-Smirnowa Powyższych testów można użyć do testowania zgodności innych rozkładów.

Test X 2 Dzieli dziedzinę zmiennej losowej na przedziały i sprawdza zgodność oczekiwanej liczby obserwacji i faktycznie zaobserwowanej. Wyższa liczba przedziałów: wyższa dokładność (subtelność) ale niższa moc testu Prosta magiczna reguła: Przynajmniej 10 obserwacji w każdym przedziale. (chisq.test, argumentem jest tablica liczników obserwacji w poszczególnych przeziałach)

Przykład segments = seq(0,1,0.2) x = runif(1000) a = table(cut(x,segments)) chisq.test(a)

Testy zgodności 2 prób H 0 : F = G F, G - dwa porównywane rozkłady (np. empiryczne) Hipoteza alternatywna: dwustronna F G jednostronna F > G jednostronna F < G Używane narzędzia: Kołmogorowa-Smirnowa Wilcoxona qqplot (odchylenie od prostej y=x)

Test Kołmogorowa-Smirnowa (ks.test) przykład: ks.test(x, pnorm ) Można podać inne parametry, np. alternatywa: two-sided (domyślna w R), greater, less

Test Wilcoxona Stosuje się np. do wykrywania różnic w parametrze położenia przykład: wilcox.test(x,y) Niewrażliwy na różnice skali, ale może wykryć różnice w skośności.

Równość parametrów położenia H 0 : µ 1 = µ 2 =... = µ k H A : i j µ j µ j Użwywane narzędzia: test t-studenta (t.test) analiza wariancji (anova) test Wilcoxona Test Kruskala-Wallisa (uogólnienie testu Wilcoxona na więcej niż 2 próby) Testy t-studenta i ANOVA zakładają normalność rozkładu. Pozostałe nie mają takiego założenia (są rangowe), zakładają tylko ciągłość rozkładu (unikanie powtarzających się wartości)

Rodzaje hipotez zerowych czy wartość średnia równa się danej liczbie: H 0 : µ x = µ czy wartości średnie dwóch rozkładów różnią się o stałą: H 0 : µ x µ y = µ (dwa warianty: równe wariancje (R: t.test: var.equal=t) i różne wariancje (wtedy dodawana jest tzw. korekta (np. Welcha). Hipotezę o równości wariancji można sprawdzić np. testem F (var.test) czy wartości średnie prób sparowanych różnią się o stałą: H 0 : µ x y = µ (paired = T)

Równość parametrów skali Testowanie np. równości wariancji (odchyleń standardowych) H 0 : σ 1 = σ 2 =... = σ k dla 2 prób: var.test (test F, iloraz wariancji) ansari.test mood.test Są też testy dla więcej niż 2 prób: bartlett.test fligner.test levene.test Uwaga: Wiele testów zakłada np. normalność rozkładu (F, Bartlett)

Przykład a = rnorm(100,1,0) b = rnorm(100,1,1) c = rnorm(100,1,2) ansari.test(a,b) ansari.test(a,c) bartlett.test(list(a,b,c))

Testowanie proporcji Czy prawdopodobieństwo sukcesu w rozkładach dwumianowych jest równe: H 0 : p 1 =... = p k R: prop.test przykład: prop.test(650,1234,p=0.5) (wynik: p-value: prawdopodobieństwo, że faktycznie było jednak prawdopodobieństwo sukcesu 0.5)

Test korelacji H 0 : ρ x,y = 0 Pearsona (cor.test) Kendalla Spearmana Przykład: a = rnorm(50) b = a + rnorm(50) cor.test(x,y,method= spearman )

Przykładowe pytania/zadania/problemy Testowanie hipotez Poziom istotności, p-wartość, statystyka testowa, moc testu Testy normalności, jednostajności, etc. Wizualna ocena normalności Testy zgodności Testy równości parametrów położenia Rodzaje hipotez

Dziękuję za uwagę.